• Non ci sono risultati.

3.3 Il modello di Holman & Glas

3.3.1 Modelli IRT multidimensionali

MRCMLM è l’acronimo di Multidimensional random coefficient multinomial logit model ; proposto da Adams, Wilson e Wang (1997), esso può essere inteso anche come un’estensione al caso multidimensionale del modello di Rasch. Si assuma che ci sia più di un tratto latente θθθ e che l’item i − esimo (con i= 1, . . . , I) abbia Ki+ 1 (con k = 0, 1, . . . , Ki) categorie; sia Yik la variabile

casuale tale che: Yik =

(

1 se la risposta all’item i è uguale a k

0 altrimenti (3.11)

Il modello MRCMLM si scrive come: P(Yik = 1; A, B, δδδ|θθθ) = exp(bikθθθ+ a 0 ikδδδ) PKi k=1(bikθθθ+ a 0 ikδδδ) (3.12) Le matriciA e B sono note, rispettivamente, come matrice di scoring e matri- ce disegno e vengono utilizzate con lo scopo di specificare la forma funzionale del modello; la matrice A descrive la relazione tra gli items e i parametri di difficoltà mentre la matrice B quella tra gli items e le dimensioni latenti. L’introduzione di queste due matrici rende il modello molto flessibile e in grado di rappresentare un’ampia classe di modelli appartenenti alla famiglia di Rasch.

Gli autori distinguono, nella trattazione, tra due diverse sottoclassi del mo- dello, note rispettivamente come Between-Item-multidimensional model e

3.3 Il modello di Holman & Glas 53

Within-Item-multidimensional model. Nel primo modello si hanno diversi tratti latenti unidimensionali e ogni item misura solo un tratto latente; nel secondo, invece, alcuni o tutti gli items sono legati a più di una dimensione latente.

Per gli scopi del presente lavoro, si farà riferimento al primo modello. La matrice di scoring e quella di disegno vengono adattate al tipo di modello in questione per cui, per items dicotomici, la probabilità di risposta corretta da parte del soggetto j all’item i semplifica in:

P(Yij = 1|θθθj) =

exp(r0iθθθj+ βi)

1 + exp(r0iθθθj + βi)

(3.13) βi rappresenta il parametro di difficoltà (o facilità) dell’item i e θθθj il vettore

dei parametri del soggetto j. ri = (ri1, ri2, . . . , rim)

0

dove

rim=

(

1 se l’item i misura la dimensione m

0 altrimenti (3.14)

Se facciamo riferimento alle due variabili latenti introdotte in precedenza per il modello di Holman & Glas, ossia θθθ (variabile latente dell’abilità) e ξξξ (va- riabile latente della propensione alla risposta), la differenza tra il modello Between items e quello Within items può essere facilmente intuita da quanto rappresentato in Figura 3.1 e 3.2.

Obiettivo del capitolo successivo sarà proprio la definizione di un modello multidimensionale between items per le latenti θ e ξ, al fine di modellizzare la situazione di missing non ignorabile, avvalendosi del linguaggio dei modelli grafici bayesiani ed estendendo l’applicazione ad un modello gerarchico a tre livelli.

ϑ

ξ

Y

1

Y

2

Y

I

d

1

d

2

d

I

Figura 3.1: Esempio di Between-item-multidimensional model

ϑ

ξ

Y

1

Y

2

Y

I

d

1

d

2

d

I

Capitolo 4

Specificazione e caratteristiche del

modello

4.1

Introduzione

Nel presente capitolo, il modello di Rasch gerarchico rappresenta l’elemento cardine della trattazione, con particolare riferimento alla sua definizione bi- dimensionale in ottica between items.

Come anticipato nel terzo capitolo, le due dimensioni latenti che caratteriz- zano il modello rappresentano, rispettivamente, l’abilità e la propensione alla risposta del soggetto. La prima è misurata dal gruppo di items somministra- to tramite il questionario, la seconda dal gruppo di items, creato ad hoc, per la codifica della presenza\assenza del missing per ciascuno degli items del primo gruppo.

Obiettivo principale del lavoro è quello di descrivere i modelli IRT multili- vello (bidimensionali) attraverso il linguaggio dei modelli grafici bayesiani, con l’indubbio vantaggio di comunicare la struttura “matematica” del mo- dello nella modalità più intuitiva e versatile possibile, ossia attraverso la sua rappresentazione grafica.

Il secondo obiettivo concerne la possibilità di comparare tre diversi approcci al trattamento dei dati mancanti, mediante tre differenti specificazioni dei modelli appena descritti, al fine di individuare eventuali distorsioni nelle sti- me dei parametri, in caso di probabile violazione del princìpio di ignorabilità. Il confronto fa riferimento ai seguenti tre modelli:

1. Modello NIM (Non Ignorable Missing).

È il modello IRT bidimensionale between items che tiene conto del mec- canismo generatore del dato mancante poiché considera due dimensio-

ni latenti: l’abilità e la propensione alla risposta. I parametri che le definiscono vengono, in questo caso, considerati non indipendenti. 2. Modello IM (Ignorable Missing).

È il modello IRT unidimensionale che lascia la matrice dei dati incom- pleta; non modellizza il meccanismo generatore del dato mancante e di conseguenza considera, come unica variabile latente, l’abilità.

3. Modello ZIM (Zero Imputation Missing).

È il modello IRT unidimensionale che considera la matrice dei dati completa, avendo precedentemente sostituito i dati mancanti con lo zero. Ovviamente, anche in questo caso, l’unica dimensione latente è l’abilità.

Il primo modello, come anticipato, ipotizza un meccanismo non ignorabile poiché considera le due dimensioni latenti non indipendenti; si avrà, quindi, un nodo bivariato latente sia al secondo che al terzo livello gerarchico. Il secondo modello ipotizza un meccanismo di tipo ignorabile poiché sottin- tende l’indipendenza tra le latenti e ipotizza un meccanismo MAR, in quanto sfrutta la capacità del software di imputare i valori mancanti sulla base della distribuzione predittiva a posteriori (condizionata ai soli dati osservati e ai parametri non noti presenti nel modello).

Il terzo modello assume che tutte le risposte mancanti siano risposte sbaglia- te imputando lo “zero” al posto degli “NA” ed ottenendo, così, una matrice di dati completa. Quest’ultimo approccio trova riscontro in molte applicazioni pratiche.

La comparazione delle stime dei parametri dei modelli non sarà l’unico ele- mento su cui concentrarsi, ancora più informativa sarà la misura della cor- relazione tra le due dimensioni latenti nel modello bidimensionale. Quanto più forte sarà la correlazione tra di esse, tanto più consistente sarà la suppo- sta deviazione dall’ipotesi di ignorabilità del meccanismo generatore del dato mancante.

Concludendo, va sottolineato che l’approccio gerarchico, o multilivello, ren- de più affascinante e complessa tale comparazione; la caratteristica dei dati “annidati” è molto diffusa in matrici di dati derivanti dal contesto educativo e non può essere ignorata.

Sembra opportuno far anticipare la descrizione e rappresentazione dei model- li grafici dalla trattazione delle loro caratteristiche analitiche e matematiche, per rendere più chiari ed evidenti i richiami teorici ai modelli visti nel secondo capitolo. In particolare, dalla lettura dei prossimi paragrafi, risulterà chiaro

Documenti correlati