Limiti del modello additivo - Il modello additivo

2. Il modello additivo

2.4 Limiti del modello additivo

Il modello additivo ha trovato e trova larga applicazione nella ricerca sociale; ciò è dovuto sia alla sua base logica chiara che alle sue semplici procedure di applicazione e di verifica. Esso però è stato oggetto di critiche per diversi motivi.

Esso dipende interamente dall'assunto di fluttuazioni casuali tra gli item che vengono sommati per creare la scala. I criteri stabiliti per selezionare gli item (item analysis) utilizzati nelle tecniche

Likert e Thurstone possono essere visti come strategie per cercare di assicurare la casualità delle

differenze interitem. Nel caso in cui sia possibile soddisfare tale assunto l'approccio additivo risulta essere una tecnica di scaling molto potente. D'altra parte il modello additivo presenta due limiti prodotti dallo stesso assunto:

a. il metodo assume che in un insieme di punti tutti gli errori sono attribuibili a fluttuazioni casuali. Tale fluttuazioni potrebbero però verificarsi per altre ragioni come l'influenza simultanea di più dimensioni sottostanti. Il modello additivo però non considera a priori la multidimensionalità come presenza possibile; infatti una delle critiche rivolte a questo modello riguarda proprio il metodo di valutazione della reale unidimensionalità del gruppo di item in

quanto basato su assunti troppo deboli17; in termini strettamente pratici, ciò significa che la

verifica del modello di scala potrebbe produrre un buon adattamento anche quando le vere fonti di variazioni sono più di una. Ciò significa che tale approccio è molto utile come tecnica di

scaling ma molto carente come criterio di scaling.

b. con l'approccio additivo è possibile scalare solo un'unico insieme di punti tra i due che di solito costituiscono i dati del tipo stimolo-unico. Ciò è dovuta al fatto che, assumendo che il secondo insieme di punti varia in modo casuale, le stime precise per le posizioni dei punti appartenenti al secondo insieme non avrebbero significato. La scelta riguardante quale insieme di punti scalare dipende interamente dagli assunti fatti sui dati e dagli obiettivi analitici. Per questo è possibile scalare:

• casi, quando gli indicatori vengono considerati ripetizioni casuali (approccio Likert),

• item, quando i casi vengono considerati ripetizioni casuali (approccio degli intervalli che

appaiono uguali di Thurstone).

Un altro appunto rivolto a tale metodo riguarda l'approccio che il modello additivo utilizza per la valutazione dell'adeguatezza (in termini di affidabilità e validità) dello strumento in quanto troppo legata alle informazioni ricavate dai dati empirici.

Un altra caratteristica criticata riguarda la definizione delle scale di risposta troppo rigidamente vincolata per tutti gli item (si richiede infatti lo stesso numero di livelli di risposta per tutti gli item). Ma la critica più severa rivolta all'approccio prende spunto dal fatto che secondo il modello additivo, richiamandosi al modello classico di misurazione, la dimensione da misurare è espressa come punteggio vero definito come il valore atteso di una caratteristica presente in un certo

soggetto. Tale dimensione misurata in un soggetto è definita solamente in funzione di un particolare

strumento di misurazione. Se per esempio la dimensione misurata è rappresentata da una capacità, lo strumento sarà considerato:

o difficile quando i soggetti risultano avere bassa capacità;

17_{Vedremo infatti come una verifica indiretta dell'unidimensionalità è l'analisi della consistenza interna, basata sulle}

correlazioni tra ciascun item e il punteggio totale (correlazione item-totale); tale criterio è considerato insufficiente come prova di unidimensionalità in quanto non è in grado di registrare l'eventuale presenza di due o più sottoinsiemi di item corrispondenti a sottodimensioni della caratteristica misurata.

2. Il modello additivo

o facile quando molti soggetti risulteranno avere alta capacità.

Analogamente definendo la difficoltà come la proporzione di soggetti che risponde correttamente

ad un item, ne consegue che:

o la facilità/difficoltà di un item dipende dalla capacità dei soggetti misurati, o la capacità di un soggetto dipende dalla facilità o difficoltà degli item.

Ciò vuol dire che la verifica dell'affidabilità (e quella della validità) dello strumento è troppo legata al campione utilizzato per la sperimentazione con la conseguenza che

- le caratteristiche di uno strumento cambiano in funzione del gruppo di soggetti (group-

dependent),

- le caratteristiche di un soggetto cambiano in funzione degli strumenti di misurazione (test-

dependent).

Conseguentemente è molto difficile confrontare o soggetti misurati con strumenti diversi,

o item per la cui validazione sono stati utilizzati campioni per la sperimentazione composti da soggetti con caratteristiche diverse.

Proviamo a questo punto a riassumere i limiti riscontrati che hanno condotto ad una valutazione insoddisfacente dell'approccio additivo:

• Group-dependent: la dipendenza delle caratteristiche degli item dai campioni di soggetti utilizzati per la sperimentazione rende gli indici di uso limitato nella pratica, soprattutto nei casi in cui le caratteristiche di tali campioni sono diverse rispetto a quelle della popolazione sulla quale verrà utilizzato lo strumento costruito e validato.

• Test-dependent: è difficile confrontare direttamente tra punteggi individuali ottenuti con strumenti diversi non essendo sempre possibile osservare e identificare relazioni funzionali tra

due strumenti18. Se i soggetti presentano diversi livelli, per esempio, di capacità (lo strumento è

più difficile per un gruppo che per un altro), i punteggi osservati contengono una diversa

quantità di errore, ovvero sono affidabili in diversa misura19. Per ottenere informazioni più

precise sulla reale capacità di un soggetto sarebbe quindi necessario osservare il risultato ottenuto in ciascun item. La difficoltà di confrontare punteggi individuali ottenuti con strumenti diversi è dovuta anche alla diversa precisione nel misurare la dimensione. Per superare il problema della presenza di livelli di versi di errori di misurazione sarebbe necessario stabilire diversi livelli rispetto alla dimensione, per esempio livelli diversi di capacità e di difficoltà. • Definizione degli strumenti paralleli: l'affidabilità è valutata sulla base di correlazioni tra

punteggi ottenuti con forme parallele che sono difficili, se non impossibili, da definire;

• Stime di affidabilità con significatività ignota: la valutazione dell'affidabilità è effettuate con coefficienti che forniscono stime che non possono essere sottoposte a verifica della significatività statistica;

• Errore di misurazione uguale: il modello classico assume che l'errore di misurazione sia funzione dell'affidabilità e della varianza della distribuzione dei punteggi e che, conseguentemente, sia uguale per tutti i soggetti; tale assunto però non è accettabile in quanto, come abbiamo visto, ciascuno strumento misura in modo impreciso e in modo disuguale soggetti di capacità differenti.

Un ultimo limite è dato dal fatto che l'approccio additivo è test-oriented piuttosto che item-oriented; infatti l'adozione del concetto di punteggio totale non consente alcuna valutazione delle risposte individuali ai singoli item; ciò vuol dire che a partire dal punteggio totale individuale non è possibile stimare le risposte ai singoli item.

18_{Tale limite è uguale a quello riscontrato per il modello sperimentale degli strumenti paralleli.}

19_{Il punteggio zero ottenuto da un soggetto indica che il soggetto presenta un basso livello nella capacità misurata ma}

non fornisce alcuna informazione su quanto esattamente basso soprattutto se confrontato con lo stesso punteggio ottenuto da un altro soggetto.

3. I MODELLI CUMULATIVI. L’APPROCCIO

Nel documento I modelli di scaling. Confronto tra ipotesi complesse per la misurazione del soggettivo (pagine 31-33)