• Non ci sono risultati.

Dati e selezione del campione

Nel documento L'economia dell'alta formazione (pagine 40-43)

La fonte principale dei dati `e costituita dalle indagini Almalaurea sulla condizione occupazionale dei laureati a uno, tre e cinque anni dalla laurea. `E stato possibile ottenere l’accesso alle indagini 2010, 2011, 2012 e 2013, relative ai laureati degli anni dal 2007 al 2010 intervistati a tre anni dalla laurea, dei laureati dal 2005 al 2008 intervistati a cinque anni dalla laurea e dei laureati dal 2009 al 2012 intervistati ad un anno dalla laurea.

Dal 1998 Almalaurea pubblica annualmente i risultati delle indagini sulla condizione occupazio- nale e sul profilo dei laureati italiani. Il numero di universit`a aderenti al consorzio `e cresciuto nel corso degli anni fino a coprire, per l’indagine 2014, 64 atenei e quasi 230000 laureati totali. Per l’arco temporale considerato il dataset comprende oltre 134000 laureati di secondo livello intervistati ad un anno dalla laurea, oltre 220000 a tre anni e quasi 93000 a cinque anni.

Una caratteristica importante da sottolineare `e come non rientrino tra gli intervistati i laureati in corsi di laurea del cosiddetto ’vecchio ordinamento’, ma solo quelli post-riforma. Di conseguenza il numero di intervistati nel campione tende progressivamente ad aumentare nel tempo, in quanto diminuisce la quota dei laureati ’vecchi’ non rappresentati nell’indagine. Questo elemento - combi- nato con gli e↵etti della riforma universitaria del 2000 - rende determinante, per qualsiasi analisi che abbia come obiettivo quello di comparare i laureati che hanno conseguito il titolo in anni diversi, l’introduzione delle dummy relative all’anno di laurea.

Dal momento che la dimensione panel del dataset a disposizione `e limitata - solo per i laureati del 2007 e del 2008 sono disponibili entrambe le indagini a tre e cinque anni - la scelta operata `e stata quella di concentrarsi sul follow-up a tre anni. L’analisi presentata nelle sezioni seguenti si basa quindi su quattro di↵erenti cross-section.

La scelta di focalizzarsi sull’indagine a tre anni `e dettata dalla necessit`a di individuare un com- promesso tra un arco temporale che permetta di valutare gli esiti di breve/medio periodo sul mercato del lavoro - escludendo quindi il brevissimo periodo - ma garantisca al tempo stesso una sostanziale eterogeneit`a tra gli studenti nell’esposizione a un numero maggiore o minore di finanziamenti per l’alta formazione.

Il dataset Almalaurea contiene informazioni relative sia agli studi intrapresi dopo la laurea - master, dottorati, corsi di formazione, scuole di specializzazione, tirocini - sia ad eventuali lavori iniziati nel periodo compreso tra la laurea e la data dell’intervista (uno, tre o cinque anni dopo). In particolare l’indagine riporta la condizione occupazionale di ciascun laureato intervistato, il salario mensile - in classi - e la regione di lavoro nel caso di partecipazione al mercato del lavoro.

La variabile indipendente principale - la partecipazione a un master dopo la laurea - `e ottenuta aggregando le risposte relative a tre tipologie di master: i master universitari di primo e secondo livello e i master non universitari. Nonostante il campione sia ristretto ai laureati di secondo livello si `e scelto di considerare anche i master di primo livello per includere i percorsi di studio esteri, che formalmente costituiscono, appunto, master di primo livello. In considerazione dell’obiettivo principale dell’analisi - la valutazione dell’e↵etto di avere concluso un master - dall’analisi sono esclusi gli intervistati che hanno dichiarato di frequentare un master al momento dell’intervista, restringendo cos`ı l’analisi alla comparazione tra ’master conclusi’ e ’nessun master’. Coerentemente sono stati anche esclusi i laureati che, al momento dell’intervista, erano iscritti a un altro tipo di corso post lauream: dottorati, corsi di formazione o scuole di specializzazione.

Le indagini Almalaurea sulla condizione occupazionale dei laureati sono state combinate con quelle relative al profilo dei laureati, che tra le altre informazioni riportano la data esatta di lau- rea e la regione di residenza di ogni laureato. Queste ultime variabili saranno determinanti per l’implementazione della strategia empirica che verr`a descritta nelle sezioni successive.

Dalla combinazione dei due dataset Almalaurea `e possibile inoltre ricavare una ricca variet`a di misure utili per controllare per eventuali di↵erenze tra laureati, quali voto ed et`a alla laurea, media dei voti, corso di studi, classe sociale e livello di istruzione dei genitori. Quest’ultima rappresenta una proxy dello status socio-economico della famiglia del laureato. Non `e tuttavia disponibile per tutti i laureati, ma solo per coloro che hanno compilato una parte aggiuntiva del questionario. Dal momento che la quota di coloro che hanno scelto di non fornire informazioni su istruzione e occupazione dei genitori `e rilevante (circa il 10% ) e che la semplice esclusione di questi dal campione ne altererebbe la rappresentativit`a, la scelta operata `e quella di includere, tra le dummy relative allo status socioeconomico, anche una variabile binaria per lo status ’non definito’.

Al dataset Almalaurea si affianca quello relativo al numero di borse di studio disponibili per ogni laureato nelle quattro regioni considerate: Sicilia, Sardegna, Puglia e Calabria. Questo dataset `e stato costruito analizzando i documenti amministrativi pubblicati sui Bollettini Ufficiali Regionali (BUR) delle varie regioni, che riportano il testo del bando e le graduatorie provvisorie e definitive di ogni edizione dei programmi di finanziamento. Dallo studio dei BUR e dei documenti pubblicati sui siti internet ufficiali delle diverse amministrazioni regionali `e stato possibile quindi ricostruire il numero di borse a disposizione, la data di pubblicazione e la scadenza per la presentazione delle domande per ogni bando, oltre ai criteri di ammissibilit`a. La tabella 2.9, presentata in appen-

dice, riporta l’elenco dei diversi bandi considerati oltre ad illustrare la costruzione della variabile strumentale per le stime 2SLS.

Al fine di comparare la generosit`a di ogni programma regionale tra i vari anni, i dati sul numero delle borse sono integrati dai dati del Ministero dell’Universit`a e della Ricerca (MIUR) sul numero totale dei laureati per regione. Questi dati sono infatti indispensabili al fine di costruire una misura pro capite del numero di borse disponibili, dal momento che il campione Almalaurea non comprende, per alcune delle regioni di riferimento, tutte le universit`a. I dati del MIUR permettono di deter- minare il numero di laureati per provenienza geografica - regione e provincia - e corso di studio, permettendo cos`ı di escludere i laureati delle cosiddette lauree ’triennali’. Il numero di laureati per anno e regione di residenza `e riportato nella tabella 2.10, in appendice. Questo numero di↵erisce da quello dei Concorrenti presentato nella tabella precedente in quanto quest’ultimo `e calcolato consi- derando i laureati degli anni precedenti al bando e la probabilit`a di ciascun laureato di concorrere per ognuno dei bandi a disposizione. La procedura per la costruzione di questa variabile `e descritta nella sezione 3.1.

Nel documento L'economia dell'alta formazione (pagine 40-43)

Documenti correlati