• Non ci sono risultati.

7.2 Le proprietà del modello di Rasch: discussione

7.2.2 Le statistiche sufficienti

Una delle proprietà più importanti del modello di Rasch è quella delle statistiche sufficienti, a loro volta premessa necessaria per le proprietà d’invarianza del modello. Il

69 Si prenda una dimensione latente attitudinale, per esempio quella del “conservatorismo”, indicata

da un insieme di item. Si può anche stabilire un punto di riferimento, per esempio la “quantità di conser- vatorismo necessaria a superare in media un certo item i”, scelto magari perché particolarmente significa- tivo da un punto di vista teorico; ma di per sé non si possono rappresentare direttamente altri item come espressione di n volte la quantità di conservatorismo di i. Per questo il concetto più appropriato è quello di soglie ordinate e non di unità ripetibili.

102

concetto di statistica sufficiente, così come elaborato a partire dalla riflessione di Ro- nald A. Fisher in poi, riguarda la capacità di una funzione campionaria di rappresentare in modo sintetico un’informazione, senza perderne la ricchezza. In altre parole, “la stati- stica sufficiente rappresenta una riduzione dei dati che conserva l’informazione conte- nuta nei dati” [Andersen 1977, 80; cit. in Giampaglia 2008].

Nel presentare gli assunti dei modelli della IRT, abbiamo sottolineato l’importanza di quello d’indipendenza locale e la sua stretta connessione con quello di unidimensionalità. Riassumendo quei concetti, la logica del modello di Rasch è sempli- ce: gli unici fattori che influenzano le risposte degli individui sono i parametri conside- rati dalla funzione di risposta all’item e, al netto di quelli, le risposte devono essere tra loro indipendenti. Se tale assunto è rispettato, la conseguenza necessaria è che la proba- bilità di una certa combinazione di risposte sarà uguale al prodotto della combinazione delle probabilità singole. Per esempio, dato un certo soggetto s e il suo profilo di rispo- ste a n item70, sfruttando le proprietà degli esponenziali, si avrà che:

𝑃(𝑥𝑠1, 𝑥𝑠2, 𝑥𝑠3… 𝑥𝑠𝑛) = 𝑃(𝑥𝑠1)𝑃(𝑥𝑠2)𝑃(𝑥𝑠3) … 𝑃(𝑥𝑠𝑛) = (eq. 7.18) =𝑒𝑥𝑠1(𝛽𝑠−𝛿1) 1+𝑒(𝛽𝑠−𝛿1) 𝑒𝑥𝑠2(𝛽𝑠−𝛿2) 1+𝑒(𝛽𝑠−𝛿2) 𝑒𝑥𝑠3(𝛽𝑠−𝛿3) 1+𝑒(𝛽𝑠−𝛿3)… 𝑒𝑥𝑠𝑛(𝛽𝑠−𝛿𝑛) 1+𝑒(𝛽𝑠−𝛿𝑛) = (eq. 7.19) =𝑒[(𝑥𝑠1+𝑥𝑠2+𝑥𝑠3+⋯+𝑥𝑠𝑛)𝛽𝑠−𝑥𝑠1𝛿1−𝑥𝑠2𝛿2−𝑥𝑠3𝛿3−⋯−𝑥𝑠𝑛𝛿𝑛] ∏𝑛𝑖=1(1+𝑒(𝛽𝑠−𝛿𝑖))

(eq. 7.20)

Poiché la sequenza 𝑥𝑠1, 𝑥𝑠2, 𝑥𝑠3, … , 𝑥𝑠𝑛 altro non è se non la serie di numeri ‘1’ e ‘0’ che costituiscono la combinazione di risposte71 del soggetto s, allora la somma dei

suoi componenti sarà il numero di item superati dal soggetto, ossia il suo punteggio grezzo rs:

70 I profili di risposta dei soggetti corrispondono ai vettori-riga nella matrice riportata in tabella 5.1:

ogni cella contiene la singola risposta xsi all’item in colonna, mentre il marginale rs rappresenta il punteg-

gio grezzo.

71 Ricordiamo che, convenzionalmente, il codice ‘1’ è assegnato alle risposte positive, cioè agli item

103

(𝑥𝑠1+ 𝑥𝑠2+ 𝑥𝑠3+ ⋯ + 𝑥𝑠𝑛) = 𝑟𝑠 (eq. 7.21)

Per cui, è possibile riscrivere l’equazione 7.20 come segue:

𝑃(𝑥𝑠1, 𝑥𝑠2, 𝑥𝑠3… 𝑥𝑠𝑛) = 𝑒(𝑟𝑠𝛽𝑠−∑ 𝑥𝑠𝑖𝛿𝑖

𝑛 𝑖=1 )

∏𝑛𝑖=1(1+𝑒(𝛽𝑠−𝛿𝑖)) (eq. 7.22)

Come mostra l’equazione 7.22, rs funge da coefficiente di βs, cioè dell’abilità del

soggetto, ed è indifferente al tipo di combinazione che lo produce: quel punteggio grez- zo è ottenuto parimenti da molte diverse sequenze di risposte. La probabilità di ottenere, in generale, una qualsiasi combinazione di risposte la cui somma sia pari a rs è [Giam-

paglia 2008]: 𝑃(𝑥𝑠1 + 𝑥𝑠2+ 𝑥𝑠3 + ⋯ +𝑥𝑠𝑛 = 𝑟𝑠) = ∑ 𝑒(𝑟𝑠𝛽𝑠−∑ 𝑥𝑠𝑖𝛿𝑖 𝑛 𝑖=1 ) ∏𝑛𝑖=1(1+𝑒(𝛽𝑠−𝛿𝑖)) (𝑥)|𝑟 (eq. 7.23)

dove il simbolo ∑(𝑥)|𝑟 indica la sommatoria di tutti i profili di risposta che corrispondo- no a un dato punteggio r. Orbene, conoscendo il punteggio grezzo del soggetto ci si può chiedere quale sia la probabilità di averlo ottenuto attraverso una certa specifica combi- nazione di risposte. Da un punto di vista matematico ciò equivale a calcolare il rapporto tra la probabilità di ottenere quella data serie di risposte e la probabilità di ottenere qual- siasi combinazione di risposte la cui somma sia rs, ossia il rapporto tra l’equazione 7.22

e la 7.23. Tale probabilità condizionata al punteggio risulta:

𝑃(𝑥𝑠1, 𝑥𝑠2, 𝑥𝑠3… 𝑥𝑠𝑛|𝑟𝑠) = 𝑒(𝑟𝑠𝛽𝑠−∑𝑛𝑖=1𝑥𝑠𝑖𝛿𝑖) ∏𝑛𝑖=1(1+𝑒(𝛽𝑠−𝛿𝑖)) ∑ 𝑒(𝑟𝑠𝛽𝑠−∑ 𝑥𝑠𝑖𝛿𝑖 𝑛 𝑖=1 ) ∏𝑛𝑖=1(1+𝑒(𝛽𝑠−𝛿𝑖)) (𝑥)|𝑟 = (eq. 7.24) = 𝑒 (− ∑𝑛𝑖=1𝑥𝑠𝑖𝛿𝑖) ∑(𝑥)|𝑟𝑒(− ∑𝑛𝑖=1𝑥𝑠𝑖𝛿𝑖) (eq. 7.25)

104

La semplificazione della eq. 7.24, che conduce alla eq. 7.25, rappresenta un risul- tato teorico assolutamente capitale per il modello di Rasch. L’elemento immediatamente evidente è la scomparsa del parametro di abilità dalla formula. Formalmente questo im- plica che, dato un certo punteggio, il parametro β non rientra nel calcolo della probabili- tà che il punteggio stesso sia ottenuto attraverso una qualche specifica sequenza di ri- sposte, ma contano solo le difficoltà degli item. Nella sostanza, se il soggetto supera un certo numero r di item, il profilo di risposte che ha condotto a quel risultato non fornisce informazioni in più sulla quantità di proprietà posseduta dal soggetto stesso. Da ciò de- riva l’importantissima conseguenza che rs è una statistica sufficiente, di per sé, per la

posizione dei soggetti sul continuum.

Vi sono altre due conseguenze cruciali della formula 7.25 [Giampaglia 2008, 53]. La prima è che l’assenza del parametro β rende teoricamente ininfluente la distribuzione dell’abilità tra i soggetti del campione su cui si opera la rilevazione. In altre parole, dal punto di vista formale del modello la stima dei parametri δ di difficoltà degli item è in- dipendente dall’abilità degli specifici soggetti inseriti nel campione (in inglese, sample-

free). Torneremo nel prossimo paragrafo su questo punto in modo più diffuso, allorché

si tratterà della questione dell’invarianza. Basti qui osservare che questo è un aspetto di profonda differenza rispetto alla teoria classica dei test, i cui modelli test-oriented sono dipendenti dalle caratteristiche dei soggetti. Nel caso del modello di Rasch, item-

oriented, il punteggio totale è una statistica sufficiente per la stima di parametri specifici

per ogni item, che in condizioni di aderenza dei dati al modello non risentono dei carat- teri di ogni specifico campione.

La seconda, ulteriore conseguenza è che in questo contesto qualsiasi distribuzione di β nel campione dei soggetti è ugualmente ammissibile, per cui, a differenza di molti altri modelli statistici, non sono necessari altri assunti sulla sua forma funzionale72. Questo carattere del modello è senz’altro desiderabile in un ambito, come quello della ricerca sociale, in cui le assunzioni sulle forme funzionali delle distribuzioni campiona-

72 Sono molto diffusi i casi in cui, ad esempio, è necessario assumere che determinati caratteri si di-

105

rie sono raramente confermate dai dati, pur essendo in via di principio necessarie rispet- to ai modelli statistici utilizzati73.

L’indipendenza della stima dei parametri δ da quelli β trova nel modello di Rasch un riscontro simmetrico nell’indipendenza della stima dei parametri β da quelli δ [Giampaglia 2008, 53]. Vediamo come ciò sia giustificato matematicamente. Si consi- derino le equazioni da 7.18 a 7.20, ma stavolta si prendano come riferimenti non i vetto- ri di riga (i profili di risposte dei soggetti) bensì quelli di colonna, cioè i profili di rispo- sta agli item. Per ogni item i, in condizione d’indipendenza locale, varrà che la probabi- lità del verificarsi di una certa combinazione di risposte è uguale al prodotto delle pro- babilità delle singole risposte, come segue:

𝑃(𝑥1𝑖, 𝑥2𝑖, 𝑥3𝑖… 𝑥𝑁𝑖) = 𝑃(𝑥1𝑖)𝑃(𝑥2𝑖)𝑃(𝑥3𝑖) … 𝑃(𝑥𝑁𝑖) = (eq. 7.26) =𝑒𝑥1𝑖(𝛽1−𝛿𝑖) 1+𝑒(𝛽1−𝛿𝑖) 𝑒𝑥2𝑖(𝛽2−𝛿𝑖) 1+𝑒(𝛽2−𝛿𝑖) 𝑒𝑥3𝑖(𝛽3−𝛿𝑖) 1+𝑒(𝛽3−𝛿𝑖)… 𝑒𝑥𝑁𝑖(𝛽𝑁−𝛿𝑖) 1+𝑒(𝛽𝑁−𝛿𝑖) = (eq. 7.27) =𝑒[−(𝑥𝑖1+𝑥2𝑖+𝑥3𝑖+⋯+𝑥𝑁𝑖)𝛿𝑖+𝑥1𝑖𝛽1+𝑥2𝑖𝛽2∓𝛽3+⋯+𝑥𝑁𝑖𝛽𝑁] ∏𝑁𝑠=1(1+𝑒(𝛽𝑠−𝛿𝑖)) (eq. 7.28)

Similmente a quanto visto per i soggetti, la sequenza 𝑥1𝑖, 𝑥2𝑖, 𝑥3𝑖, … , 𝑥𝑁𝑖 è la serie di risposte (sotto forma di cifre ‘1’ e ’0’) all’item i. La loro somma sarà il numero di soggetti che superano l’item, dato da yi:

(𝑥1𝑖+ 𝑥2𝑖+ 𝑥3𝑖+ ⋯ + 𝑥𝑁𝑖) = 𝑦𝑖 (eq. 7.29)

L’equazione 7.28 si riscrive quindi così:

𝑃(𝑥1𝑖, 𝑥2𝑖, 𝑥3𝑖… 𝑥𝑁𝑖) =𝑒(−𝑦𝑖𝛿𝑖+∑ 𝑥𝑠𝑖𝛽𝑠

𝑁 𝑠=1 )

∏𝑁𝑠=1(1+𝑒(𝛽𝑠−𝛿𝑖)) (eq. 7.30)

73 Tanto è vero che alcuni autori, consapevoli di tale condizione, propongono tecniche specifiche per

il trattamento dei dati in modo tale da avvicinarli alle condizioni richieste. Si veda, per esempio, la tecnica di deflazione di Marradi [2007].

106

In questo caso abbiamo –yi che funge da coefficiente di δi, cioè della difficoltà

dell’item. Come rs, anche yi è indifferente al tipo di combinazione da cui scaturisce. La

probabilità di ottenere una tra tutte le possibili combinazioni di risposte la cui somma sia a yi è: 𝑃(𝑥1𝑖 + 𝑥2𝑖 + 𝑥3𝑖 + ⋯ + 𝑥𝑁𝑖 = 𝑦𝑖) = ∑ 𝑒(−𝑦𝑖𝛿𝑖+∑ 𝑥𝑠𝑖𝛽𝑠 𝑁 𝑠=1 ) ∏𝑁𝑠=1(1+𝑒(𝛽𝑠−𝛿𝑖)) (𝑥)|𝑦 (eq. 7.31)

dove ∑(𝑥)|𝑦 è la sommatoria di tutti i vettori-colonna che corrispondono al punteggio totale di yi. Sulla base del punteggio finale dell’item si può, anche in questo caso, calco-

lare la probabilità di ottenerlo attraverso una combinazione data di risposte, dividendo la probabilità di ottenere quella precisa serie di risposte con la probabilità di ottenerne una qualunque la cui somma sia yi. Essa è pari a:

𝑃(𝑥1𝑖, 𝑥2𝑖, 𝑥3𝑖… 𝑥𝑁𝑖|𝑦𝑖) = 𝑒(−𝑦𝑖𝛿𝑖+∑𝑁𝑠=1𝑥𝑠𝑖𝛽𝑠) ∏𝑁𝑠=1(1+𝑒(𝛽𝑠−𝛿𝑖)) ∑ 𝑒(−𝑦𝑖𝛿𝑖+∑ 𝑥𝑠𝑖𝛽𝑠 𝑁 𝑠=1 ) ∏𝑁𝑠=1(1+𝑒(𝛽𝑠−𝛿𝑖)) (𝑥)|𝑦 = (eq. 7.32) = 𝑒(∑ 𝑥𝑠𝑖𝛽𝑠 𝑁 𝑠=1 ) ∑(𝑥)|𝑦𝑒(∑𝑁𝑠=1𝑥𝑠𝑖𝛽𝑠) (eq. 7.33)

E’ così che si arriva all’altro importante risultato del modello, simmetrico rispetto a quanto ottenuto partendo dai vettori dei soggetti. Questa volta a scomparire dalla for- mula è il parametro di difficoltà per cui, dato un certo punteggio dell’item, il parametro

δ non è coinvolto nel calcolo della probabilità che il punteggio sia stato ottenuto attra-

verso una data sequenza di risposte. Se un item è superato da un certo numero y di sog- getti, il risultato non è influenzato dal livello di proprietà dell’item stesso, bensì dall’abilità dei soggetti. Su questa base si conclude che anche yi è una statistica suffi- ciente, in questo caso rispetto alla posizione degli item sul continuum.

Dalla formula 7.33 possiamo far discendere due implicazioni che, di fatto, sono analoghe a quelle individuate per il parametro β. L’assenza del parametro δ nell’equazione ne rende indifferente la distribuzione nel pool di item selezionati. For-

107

malmente, la stima dei parametri β di abilità dei soggetti è indipendente dalla difficoltà degli item (in inglese, item-free). Anche su tale punto torneremo nel paragrafo successi- vo, perché esso costituisce una caratteristica fondamentale del modello, nota come og-

gettività specifica, che sancisce in via di principio la possibilità di produrre le medesime

stime dell’abilità dello stesso soggetto, indipendentemente dagli item utilizzati (e quindi delle loro difficoltà relative). Che si usino affermazioni più o meno facili, il modello of- fre gli strumenti tecnici e logici per giungere alla stessa stima: un elemento, questo, che si allinea alle prerogative delle procedure tipiche della teoria classica della misurazione.

L’altra implicazione è che qualsiasi distribuzione di δ nel pool di item è accettabi- le, senza vincoli di forma.

Concludiamo questo paragrafo con due importanti considerazioni, connesse a quanto si è appena illustrato. La prima riguarda le conseguenze delle statistiche suffi- cienti sulla stima dei parametri [Maggino 2007; Giampaglia 2008]. I procedimenti di stima più diffusi, utilizzando l’assunto d’indipendenza locale e procedure reiterative, si basano sulla massimizzazione della funzione di verosimiglianza (ML, Maximum Likeli-

hood) per calcolare i parametri degli item che meglio descrivono i dati a disposizione74. Vi sono fattispecie che stimano contemporaneamente i parametri e altre che invece, sfruttando la loro indipendenza, li calcolano separatamente. La funzione di verosimi- glianza (L, Likelihood) di base per il modello di Rasch, nel caso più generale di stima congiunta, è 𝐿([𝑥𝑠𝑖]|𝜷, 𝜹) = ∏ ∏ 𝑃𝑠𝑖𝑥𝑠𝑖(1 − 𝑃) 𝑠𝑖 𝑥𝑠𝑖 𝑁 𝑠=1 𝑛 𝑖=1

(eq. 7.34)

in cui: [xsi] è la matrice delle risposte degli N soggetti agli n item

β e δ sono i vettori dei parametri di abilità e difficoltà

Psi è la probabilità che il soggetto s superi l’item i

In ogni caso, le procedure sono incapaci di stimare la posizione di soggetti o di

item i cui vettori in matrice siano composti di valori costanti (solo ‘1’ o solo ‘0’ in cia-

74 Più precisamente, i parametri che, partendo dai dati ottenuti, stimano la curva che con maggior

108

scuna cella), ossia i soggetti che hanno superato tutti gli item ovvero nessuno e gli item che sono stati superati da tutti i soggetti ovvero da nessuno. Per questo motivo, tali vet- tori devono essere eliminati dalla matrice e non considerati per la stima. Questa limita- zione porta a una perdita d’informazione, la cui entità varia chiaramente da situazione a situazione. Concettualmente, però, questo handicap ha una sua interpretazione del tutto legittima. Infatti, un soggetto o un item i cui vettori siano composti di tutti valori ‘1’ sa- ranno, rispettivamente, estremamente abile e difficile: ma quanto abile e quanto diffici- le? Quale termine di paragone relativo si può utilizzare per quantificare questa presenza estrema di proprietà? La risposta è: nessun termine di paragone. Allo stesso modo, un soggetto o un item i cui vettori siano composti solo dal codice ‘0’ saranno, rispettiva- mente, estremamente poco abile e facile: quanto poco abile e quanto facile? Anche in questo caso nessun termine di paragone esterno viene in soccorso per fissare una possi- bile stima. Per questo motivo è necessario decurtare le righe e le colonne con tali carat- teristiche.

La seconda considerazione riguarda invece il confronto tra il modello di Rasch e quello di Guttman a proposito del ruolo svolto dai punteggi grezzi. Si è già osservato che il primo può essere interpretato come variante stocastica di un modello cumulativo deterministico. Adesso è interessante notare un parallelo indicativo. Nel modello di Ra- sch, in caso di perfetto adattamento dei dati agli assunti del modello, il punteggio grezzo di un soggetto e quello di un item sono statistiche sufficienti per stimare i parametri β e

δ, cioè le loro posizioni lungo la scala comune. Nel modello di Guttman, in caso di per-

fetta aderenza dei dati agli assunti del modello si è nella condizione di perfetta riprodu- cibilità della scala, cioè il punteggio grezzo fornisce una previsione precisa della posi- zione ordinale del soggetto. Insomma, in entrambi i modelli, nel caso-limite ideale, la somma delle risposte contiene tutto il succo dell’informazione necessaria a collocare soggetti e affermazioni lungo la proprietà. Nel secondo caso, il punteggio fornisce in più anche l’informazione relativa a quali item sono stati superati e da quali soggetti, in un’ottica rigidamente deterministica. Il vettore empirico di risposte non aggiunge invece informazioni statistiche nel modello di Rasch, ma c’è da rilevare che in quest’ultimo il

109

fulcro della stima risiede nei parametri, per i quali il punteggio è una statistica sufficien- te75.