• Non ci sono risultati.

CAPITOLO 1 METODOLOGIA

1.4 L’analisi psicometrica

1.4.2 Costruzione e validazione di un modello di indagine

Per questo lavoro, si è scelto di seguire la metodologia proposta da Churchill (1979) e Hinkin (1995) che presenta un processo di sette fasi per lo sviluppo di analisi, con i metodi

25 più appropriati per la progettazione di scale affidabili e valide. Il motivo principale è che il modello di indagine proposto in questo lavoro comprende l’analisi di tre diverse dimensioni psicometriche (empowerment, co-creazione e soddisfazione) che necessitano di tre scale di misura diverse e la metodologia indicata si basa proprio sullo sviluppo di misurazioni multiple ciascuna delle quali consiste di item multipli. Tuttavia, il processo sarebbe lo stesso, anche se meno complesso, per lo sviluppo di una singola scala con più item. Come è noto, ci sono molti diversi tipi di misure, ma la stragrande maggioranza delle scale utilizzate negli studi di variabili comportamentali con sondaggi attraverso questionari sono scale Likert che utilizzano un livello di intervallo di misura (Cook et al., 1981; Schmitt e Klimoski, 1991). Le Scale Likert includono diversi "punteggi", lungo un continuum, che definiscono i vari gradi o livelli dell'attributo misurato o variabile (ad esempio, accordo, frequenza, importanza etc.). La letteratura suggerisce che gli item siano scalati con cinque o sette punti Likert. Misure con scale a cinque o sette punti hanno dimostrato di creare la varianza necessaria per l'esame delle relazioni tra gli item e le scale e di creare un adeguato coefficiente alpha (Coerenza interna) e previsioni di affidabilità (Lissitz e Green, 1975).

La Figura 1 elenca i sette passi necessari per produrre scale valide, con più item, più sottoscale e a intervalli affidabili.

26

FIGURA 1: STEP PER LA PRODUZIONE DI SCALE VALIDE

FONTE: HINKIN ET AL. 1997

La creazione degli item

Il processo di sviluppo della scala inizia con la creazione di item per valutare il costrutto in esame. Questo processo può essere condotto induttivamente, generando prima gli item, da cui sono poi derivate le scale, o deduttivamente, a partire da una definizione teorica dalla quale sono poi generati gli item. Entrambi questi approcci vengono usati nella ricerca comportamentale e la decisione deve essere effettuata in base a quale risulta più appropriato in una particolare situazione.

L'approccio induttivo è di solito utilizzato quando si esplora un fenomeno sconosciuto sul quale esiste poca teoria. Agli esperti in materia in genere viene richiesto di fornire descrizioni dei loro sentimenti circa le loro organizzazioni o di descrivere alcuni aspetti del comportamento. Le risposte vengono poi classificate in una serie di categorie per l'analisi dei contenuti in base a parole chiave o temi. Dalla classificazione delle risposte vengono poi derivati gli item.

27 Lo sviluppo di una scala deduttiva utilizza un costrutto di base che viene poi usato come guida per la creazione di item (Schwab, 1980). Questo approccio richiede uno studio della letteratura e del fenomeno da indagare e aiuta ad assicurare adeguatezza dei contenuti nelle scale finali. Nella maggior parte delle situazioni in cui esiste una qualche teoria, l’approccio deduttivo sarebbe più appropriato. L’approccio deduttivo è quello seguito in questa tesi.

Ci sono diverse linee guida da seguire per assicurare che gli item siano ben costruiti. Gli item dovrebbero affrontare un solo problema; le voci con doppio significato, come "I miei dipendenti sono dediti e infaticabili" possono rappresentare due costrutti e provocare confusione negli intervistati. È anche importante che tutti gli item siano coerenti in termini di prospettiva, assicurandosi di non mescolare gli item che valutano i comportamenti con quelli che valutano risposte affettive o esiti di comportamenti (Harrison e McLaughlin, 1993). Le dichiarazioni dovrebbero essere semplici e più brevi possibile e il linguaggio utilizzato dovrebbe essere familiare e calibrato sugli intervistati. Gli items negativamente-formulati, o reverse-gol, devono essere usati con cautela in quanto alcuni di questi item intercalati casualmente all'interno di una misura possono avere un effetto negativo sulle sue proprietà psicometriche (Harrison e McLaughlin, 1991). Gli item devono essere compresi dall’intervistato come previsto dal ricercatore se si vogliono ottenere risposte significative. Infine, ridondanze nel contenuto sono desiderabili per la creazione di item multipli perché sono il fondamento dell’affidabilità della coerenza interna.

Non ci sono regole specifiche circa il numero di item da conservare, ma esistono alcune euristiche utili. Una misura deve essere internamente coerente e bisogna essere parsimoniosi, deve essere composta da un numero minimo di elementi che valutano adeguatamente il dominio di interesse (Thurstone, 1947). Un'adeguata affidabilità della coerenza interna può essere ottenuta con quattro o cinque item per scala (Harvey, Billings e Nilan, 1985; Hinkin e Schriesheim, 1989). Mantenere una misura breve è un mezzo efficace per ridurre al minimo i bias di risposta causati dalla noia o stanchezza (Schmitt e Stults, 1985). Item aggiuntivi richiedono anche più tempo sia nello sviluppo che nella somministrazione di una misura (Carmines e Zeller, 1979). Questi problemi potrebbero suggerire che una scala di qualità composta da quattro a sei elementi potrebbe essere sviluppata per la maggior parte dei costrutti o dimensioni concettuali. Una volta che la

28 scala è stata sviluppata bisogna procedere con il pre-test per valutare l'adeguatezza del contenuto e l’affidabilità degli item.

Valutazione dell’adeguatezza del contenuto

Un passo ancora necessario e spesso trascurato nel processo di sviluppo di una scala è il pre-testing degli item per l'adeguatezza dei contenuti. In molti casi i ricercatori hanno investito molto tempo e sforzo nel raccogliere grandi insiemi di dati solo per scoprire che una misura importante è viziata. Assicurare l'adeguatezza dei contenuti prima dello sviluppo del questionario finale fornisce il supporto per la validità del costrutto in quanto consente l'eliminazione di item che possono essere concettualmente incoerenti.

Diversi metodi di valutazione dei contenuti sono stati descritti nella letteratura sulla metodologia della ricerca (Nunnally, 1978).

Un metodo ampiamente utilizzato per lo svolgimento di valutazioni del contenuto utilizza le tecniche di analisi fattoriale per valutare quantitativamente l'adeguatezza dei contenuti di un set di item di nuova concezione (Schriesheim, et al. 1993). Gli item che sulla base delle risposte del pre-test risultano adaguati dalla factor analysis vengono conservati per la successiva somministrazione ad un ulteriore campione.

Questa tecnica è molto semplice e lineare e permette un test statistico dell’adeguatezza dei contenuti. Questo può essere condotto con un campione relativamente piccolo e ha un costo molto basso.

Non si riuscirà mai a garantire la validità di una scala, ma si può fornire prova che gli item rappresentano una ragionevole misura del costrutto in esame e ridurre le probabilità di una successiva modifica della scala. Gli item che rimangono dopo questa analisi, possono essere utilizzati con una certa sicurezza per la raccolta dei dati.

La somministrazione dei questionari

Gli item trattenuti sono poi presentati a un campione appropriato per esaminare quanto bene questi item confermano le aspettative relative alle proprietà psicometriche di questa nuova misura. I dati devono essere raccolti da un campione di dimensioni adeguate per

29 condurre in modo appropriato analisi successive. In genere per il pre-test sono necessarie poche decine di intervistati, per testare invece il modello definitivo, risultante dal pre-test, c'è un sostanziale dibattito sulla dimensione del campione necessaria per opportunamente condurre il test di significatività statistica. Sembra che il numero di variabili o item da valutare debba dettare la dimensione del campione necessaria per ottenere risultati affidabili. Le prime raccomandazioni riguardo il rapporto tra gli item e le risposte necessarie sia da 1: 4 (Rummel, 1970) ad almeno 01:10 (Schwab, 1980) per ogni set di scale da analizzare fattorialmente. Recenti studi hanno scoperto che, spesso, un campione di 150 osservazioni dovrebbe essere sufficiente per ottenere una accurata soluzione in analisi fattoriale esplorativa, purché le intercorrelazioni tra gli item siano abbastanza forti (Guadagnoli e Velicer, 1988). Per l'analisi fattoriale confermativa, si consiglia un minimo di un campione di 100 (Bollen, 1989).

Al termine della raccolta dei dati è essenziale valutare le prestazioni degli item per determinare se essi costituiscono adeguatamente la scala. La loro valutazione attraverso l’analisi fattoriale è una delle fasi più critiche nel determinare la fattibilità della scala.