Campionamento
• Campione: parte dell’insieme
universo interessato dall’ipotesi di ricerca
• Popolazione di riferimento: insieme
dei casi potenzialmente reperibili
(universo)
• Determinato dall’ipotesi di ricerca e dalle variabili in gioco
• Determinante rispetto all’analisi e all’interpretazione dei risultati
Campionamento
Caratteristiche da perseguire nella scelta del campione:
• adeguatezza rispetto all’ipotesi di partenza
• rappresentatività rispetto alla popolazione
• controllo della distorsione
• affidabilità
Campionamento
Fattori di distorsione della stima campionaria:
• influenza i risultati della ricerca
• non è controllabile dal disegno sperimentale
• determinata dalla tecnica di campionamento utilizzata
Campionamento
Campionamento
Paradosso centrale del
campionamento (Stuart, 1996) impossibilità di conoscere
dall’esame del campione se sia esso scevro di distorsioni
Campionamento
Campionamento
Distorsione da selezione
• Il campione è adeguato se e solo se non è influenzato da altre variabili che non siano quelle in studio
• Per assicurarci questa situazione occorre attuare un meccanismo di selezione
casuale
Campionamento
Campionamento
Campionamento casuale
• consiste nella scelta di una campione attraverso un meccanismo casuale
• attraverso questo metodo è possibile
conoscere le probabilità di selezione del campione
Tecniche di
Campionamento
Il campione casuale
• è privo di distorsioni dovute alla selezione
• è l’unico tipo di campione sul quale è possibile fare inferenza statistica
Tecniche di Tecniche di
Campionamento
Campionamento
• Esistono diverse tecniche di campionamento
• Rimane fondamentale la
spiegazione delle procedure di selezione che determinano i
risultati della ricerca
Tecniche di Tecniche di
Campionamento
Campionamento
Campionamento casuale semplice
permette di selezionare un campione dalla popolazione in
modo da avere la stessa probabilità per ogni possibile campione
Tecniche di Tecniche di
Campionamento
Campionamento
Campionamento stratificato
suddivide il campione in strati, ovvero in sottogruppi, le cui proporzioni corrispondono alla suddivisione della popolazione
Tecniche di Tecniche di
Campionamento
Campionamento
• per formare gli strati in modo casuale bisogna estrarre un campione casuale semplice da ogni strato
• incrementa la precisione del campionamento
• la corretta stratificazione dipende solo dalle conoscenze e dall’abilità dello
sperimentatore
Tecniche di Campionamento:
Tecniche di Campionamento:
Campionamento stratificato
Campionamento a grappoli
• nella prima fase la popolazione è suddivisa in gruppi - chiamati grappoli o cluster –
ciascuno dei quali non ha caratteristiche diverse dagli altri
• nella seconda fase da tutti i grappoli ne viene selezionato casualmente uno
Tecniche di Tecniche di
Campionamento
Campionamento
• La differenza fra gli strati e i grappoli sta nel fatto che mentre la selezione casuale degli strati
avviene a livello della popolazione la selezione casule dei grappoli avviene a livello di unità della popolazione
• comporta una perdita di precisione che può essere in taluni casi giustificata da ragioni economiche
• Naturalmente maggior variabilità esiste all’interno dei grappoli corrisponde a maggior precisione di campionamento
Tecniche di Campionamento:
Tecniche di Campionamento:
Campionamento a grappoli
Campionamento a stadi
• Dopo aver selezionato due o più grappoli si
seleziona all’interno di essi un individuo sempre attraverso un campionamento casuale semplice
• Oltre al caso descritto di due stadi si possono
verificare ripartizioni a più stadi che determinano una maggior flessibilità del progetto a discapito della rappresentatività del campione
Tecniche di Tecniche di
Campionamento
Campionamento
Campionamento
Numerosità campionaria
• Va determinata a priori
Dipende :
da H0 e da H1
dalla potenza del test
dalla minima differenza apprezzabile
dalla varianza casuale
Confronto fra le tecniche di campionamento
• Casuale semplice: è alla base delle altre
tecniche, è attuabile quando la popolazione è omogenea rispetto alla variabile in studio
• Stratificato: applica un metodo più preciso ma meno casuale
• A grappoli e a stadi: applica un metodo più
casuale ma meno preciso
Fallacia nella Stima
Campionaria e nel Test Statistico
• Ambiguità
Fallacia
• Errore
“Una fallacia è un X che sembra Y,
ma è Z” (Johnson,
1987)
Campione e Inferenza Statistica
• E’ attraverso il campione che posso fare inferenze in campo statistico
• Non esiste inferenza senza fallacie così come non esiste campionamento senza errore
• Controllo dell’errore attraverso il
metodo
Campione
Rappresentativo
• Rappresenta la popolazione alla quale si riferisce ma non lo è né per caratteristiche né per numerosità.
• Campione Rappresentativo:
» Controllo distorsione
nella selezione Casualità
» Corrispondenza fra campione e
popolazione Precisione
Questione di Metodo
• Errori non campionari sono eliminabili
• Errore campionario controllabile in quanto misurabile
• Piano di campionamento: modalità di selezione e parametri/stimatori da
misurare
Precisione e Casualità
Tanto più cerchiamo di controllare la precisione tanto più facilmente
possiamo selezionare un campione non casuale
La rappresentatività è data dalla
differenza tra stima campionaria e parametro della popolazione
“The surer you want to be the less you have to demand”
(Alan Stuart, 1968)
Errori legati alla
Dimensione del Campione
La dimensione ottimale del campione è quella per cui l’errore di
campionamento non va oltre una certa soglia
Efficienza: precisione per unità di costo Può esser controllata solo nel caso del
campionamento probabilistico
Omogeneità e Numerosità
• Più n si avvicina a N più l’errore di campionamento diminuisce
• Maggiore è la variabilità della
stima campionaria minore è
l’affidabilità
Esempi di fallacie
collegate a distorsioni nel campionamento
– Principio inficiato: Casualità – Principio inficiato: Idoneità
– Principio inficiato: Numerosità
adeguata
Fallacia e Principio di Casualità
Se il campionamento non è probabilistico non può esser considerato rappresentativo della popolazione studiata.
Le conclusioni a cui portano i risultati del campione non saranno facilmente identificabili in una variabile.
Esempio: applicazione di più test statistici sullo stesso campione per diverse dimostrazioni
Disegno sperimentale: si ipotizza la
diversità fra tre campioni indipendenti riguardo i punteggi ottenuti in un
questionario che misura il QI
Gruppo 1 Gruppo 2 Gruppo 3
99 102 89
100 103 92
98 107 75
96 102 87
101 110 90
90 100 99
T test: Confronto: 1 con 2, 1 con 3, 3 con 2.
Tre risultati diversi ciascuno dei quali non è indipendente dall’altro:
T1= -3.45 p=0.005, T2 = 1.742 p>0.05, T3=4.21 p=0.001
Anova: crea matematicamente confronti indipendenti e dà un unico risultato:
F= 10.23, p<0.001
VAR00001
96.1429 7 4.81070
103.8571 7 3.43650
90.0000 7 8.00000
96.6667 21 7.96450
1.00 2.00 3.00 Totale
Media N Deviazione std.
Applicazione di test
univariati su esperimenti multivariati
Disegno sperimentale è multivariato ovvero le variabili sono fra loro interdipendenti:
Esempio: due scale di misurazione dell’intelligenza
Supponiamo di confrontare due gruppi in
98.818 2.301 94.002 103.634
93.900 2.413 88.849 98.951
102.273 1.872 98.354 106.191
95.600 1.964 91.490 99.710
1.00 2.00 1.00 2.00 Variabile dipendente
VAR00001 VAR00002
Media Errore std. Limite inferiore
Limite superiore Intervallo di confidenza 95%
Dai test univariati abbiamo due risultati diversi: F1= 2.1 p>0.05 F2 = 6.04
p=0.024
Che possono avere solo valore descrittivo Dal test multivariato ho un unico risultato Calcolato sulla base dell’interdipendenza
fra le due variabili F = 4.17 p=0.032
Che ha valore dimostrativo
Fallacia e Principio di Idoneità
Quando le variabili misurate sul campione sono troppo eterogenee i risultati non
danno nessuna indicazione oppure danno indicazioni fallaci rispetto alla popolazione generale
Esempi: regressione su gruppi non omogenei, paradosso di Simpson
Regressione su gruppi non omogenei
y = 2.2161x - 2.9788 R2 = 0.9285
0 5 10 15 20 25 30
0 2 4 6 8 10 12 14 16
Misura della
relazione fra due parametri X e Y in campione composto da due popolazioni diverse con valori medi nei due
parametri diversi
Il coefficiente R2 è altissimo e la relazione è significativa dal punto di vista dell’analisi
statistica che non tiene conto della diversità fra
Paradosso di Simpson
Immaginiamo di dover confrontare
l’efficacia di due diverse terapie
(Terapia A, Terapia B) nel
miglioramento di un particolare
stato patologico
Tutti i soggetti Migliorati Non migliorati
Percentuale di migliorati
Terapia A 20 20 50
Terapia B 24 16 60
La terapia B è la più efficace perché produce miglioramento nel 60% dei casi, mentre la terapia A arriva solo al 50%.
… Considerando la
differenza fra maschi e femmine nelle due
terapie…
Solo maschi Migliorati Non migliorati Percentuale di migliorati
Terapia A 12 18 40
Terapia B 3 7 30
Solo femmine Migliorati Non migliorati Percentuale di migliorati
Terapia A 8 2 80
Terapia B 21 9 70
sia nei maschi che nelle femmine è la terapia A a produrre una percentuale maggiore di
miglioramenti e non la terapia B
Fallacia e Adeguatezza della Numerosità
Quando il campione non è
sufficientemente numeroso per quel tipo di variabile presa in esame e per quel tipo di differenza che si vuole
misurare si può concludere
erroneamente che non ci siano
differenze.
Fallacia e principio della causalità
Attraverso il test statistico non è possibile stabilire relazioni causali ma solo differenze. Il test è tutto sbilanciato nel senso di falsificare H0.
Esempio: due eventi prossimi in senso temporale vengono considerati l’uno la causa dell’altro.
Utilizzando un campione opportuno per dimensioni e rappresentatività qualsiasi idea sarebbe dimostrata. Ma siamo interessati a dimostrare idee qualsiasi o differenze interessanti dal punto di vista clinico?
Stabilire a priori le caratteristiche del campione significa assicurare la validità delle idee che si intende dimostrare
“Post hoc, ergo propter hoc”
Campionamento
• Mappa concettuale
• Domande in itinere
Validità nella ricerca
Nell’ambito ricerca sperimentale:
caratteristiche di
falsificabilità, generalizzabilità,
replicabilità o appropriatezza nella
descrizione e nell’utilizzo dei test
statistici
Validità di un test
In ambito psicometrico: attributo del test che permette di stabilire se il test stesso misura quello che effettivamente vuol
misurare.
caratteristiche:
la struttura del test deve essere unitaria e le relazioni fra il test e altri test che
misurano costrutti teorici analoghi.
Validità
Validità interna
• sono stabilite in modo appropriato le relazioni fra le variabili in studio
• sono escluse dal disegno
sperimentale quelle variabili
confondenti
Validità
Esempi di minaccia alla validità interna:
• Effetto regressione (studi longitudinali)
• L’effetto apprendimento: alcuni fenomeni se studiati in momenti successivi sono
influenzati dalla consapevolezza del compito e dalla conoscenza della prova
• maturazione degli individui
Validità
Compito dello sperimentatore è quello di misurare l’effetto del fenomeno sia in relazione al ripetersi delle prove che
indipendentemente dalle ripetizioni
Validità
Esempio: disegno sperimentale di Solomon per il controllo dell’effetto trattamento, apprendimento e maturazione.
Suddivisione in gruppi:
• Il primo gruppo (I gruppo – sperimentale) è sottoposto a pretest-trattamento e posttest
• Il secondo gruppo (II gruppo - di controllo) è
sottoposto a pretest e posttest senza trattamento
• Il terzo gruppo (III gruppo - sperimentale) è sottoposto a trattamento e post-test.
• Il quarto gruppo (IV gruppo – di controllo) è sottoposto solo a post-test.
Validità
a Variabili confondenti:
fonte di minaccia principale per la validità interna in quanto non
controllabili dallo sperimentatore
sono spesso distinte in sistematiche e
asistematiche.
Validità
Variabili sistematiche
si riferiscono a quelle variabili che in ogni piano della ricerca agiscono in modo incontrollato.
Variabili asistematiche
sono caratteristiche di situazioni particolari di quel disegno di ricerca e solo di quello
Tuttavia … dipende sempre dal disegno di ricerca
Validità
Un esempio di varibili asistematiche sono quelle legate alla mortalità o ai drop-out dei soggetti del campione (studi longitudinali).
• Mortalità: perdita non recuperabile di soggetti del campione durante il corso della ricerca.
• Drop-out: o le mancate risposte a una parte della ricerca o la perdita recuperabile di soggetti nel corso della
ricerca
analisi statistiche della popolazione che all’interno del campione non ha terminato la ricerca
Validità
Un esempio di analisi per controllare la mortalità e i drop-out è quella che viene definita Intention- to-treatment- analysis che, in modi diversi a
seconda del metodo che viene
seguito, confronta la popolazione di
soggetti che ha terminato lo studio
con quella che non lo ha terminato.
Validità
c Relazioni fra le variabili
• Nel disegno sperimentale il controllo della validità interna si effettua soprattutto sulla conoscenza delle relazioni fra le variabili
• Diversi sono i tipi di variabili che sono utilizzati nelle ricerche sperimentali. Solitamente si
indagano gli effetti che una variabile definita fattore determina su una variabile definita dipendente.
Validità
• La distinzione fra variabili
dipendenti e fattori deve essere indagata dallo sperimentatore in
base all’ipotesi che vuole verificare.
Sebbene alcuni casi presentino una chiara distinzione fra le variabili
molte situazioni si caratterizzano
per relazioni più ambigue.
Validità
• I casi di chiara relazione causale fra variabile
dipendente e fattore sono dette relazioni genuine. Ne è un esempio la relazione fra altezza e peso.
• I casi in cui la relazione è genuina ma bidirezionale ovvero entrambe le variabili possono essere
considerate influenti l’una sull’altra, sono definiti da una relazione mutua.
• Quando invece non sono chiare le definizioni fra le variabili allora la relazione si definisce spuria. (Un esempio è dato dall’utilizzo di farmaci in base alla gravità della patologia).
Validità
Validità esterna
insieme di caratteristiche della ricerca che permettono di
generalizzare i risultati ottenuti dalla ricerca alla popolazione
generale che rappresenta il
campione analizzato
Validità
Validità di costrutto
riguarda la teoria di riferimento che si vuole testare tramite la ricerca.
Per verificare la validità del costrutto
teorico alla base della ricerca occorre che sia possibile tradurre il costrutto stesso in variabili misurabili.
Diversi passi:
• Elaborazione preoperativa del costrutto.
• Misurazione.
• Verifica adeguatezza in base alle variabili sudiate.
• Costrutti confondenti. Sono quei costrutti che possono essere determinanti rispetto al
costrutto in studio e che interferiscono con esso in modo non controllato dallo
sperimentatore.
Validità
Validità
Validità statistica o predittiva
si riferisce alla verifica statistica delle
ipotesi sperimentali in ogni suo passo, dalla formulazione dell’ipotesi al controllo degli errori di I e II tipo e alla verifica della
relazione fra le variabili dipendenti e i fattori Sovrapposizione fra validità statistica e
validità interna (validità predittiva)
Validità
Validità ecologica
• Il concetto di validità ecologica è stato introdotto nell’ambito della ricerca
psicologica per sottolineare l’importanza della distinzione fra comportamento
investigato in laboratorio e comportamento
reale del soggetto nella realtà abituale. Il
valore di questo concetto è verificabile in
alcune condizioni teoriche particolari nelle
quali interessa valutare la differenza fra
ambienti diversi di stimolazione.
Validità
Artefatti
al pari delle variabili confondenti sono fattori legati al soggetto o allo
sperimentatore che inficiano i risultati della ricerca e che inducono a
conclusioni erronee in modo non
controllato dallo sperimentatore stesso.
Validità
• a Fattori legati al ricercatore
• L’Effetto Rosenthal: lo sperimentatore in
modo inconsapevole riesce a trasmettere al soggetto le proprie aspettative riguardo ai risultati della ricerca e quindi alterandone il comportamento a proprio favore.
• Questo effetto si elimina utilizzando un
disegno sperimentale a doppio cieco ovvero tenendo all’oscuro chi conduce la ricerca delle ipotesi sperimentali.
Validità
• L’Effetto Pigmallione è lo studio dell’effetto Rosenthal nel campo dell’educazione. Grazie a questo
effetto più un soggetto è percepito da chi lo valuta in senso positivo
più sarà in grado di ottenere una
valutazione positiva.
Validità
• Altri fattori non espliciti e legati a desiderabilità sociale
• Controllo: figure alternative che
conducono la ricerca
Validità
b Fattori legati al soggetto
• i soggetti sono fiduciosi quando si pongono in modo genuino rispetto alla ricerca;
• i soggetti buoni sono quelli che intendono
confermare quella che credono essere l’ipotesi dello sperimentatore;
• i soggetti negativi sono quelli che vogliono invece disconfermare lo sperimentatore;
• i soggetti apprensivi pensano di essere valutati dallo sperimentatore e quindi rispondono in
modo da dare un’immagine positiva di sé.
Validità
c Fattori legati alla situazione sperimentale Riguardano tutti quei comportamenti che il soggetto mette in atto a causa delle
aspettative e delle modifiche che genera la situazione sperimentale che alterano la prestazione del soggetto nel compito.
• Esempio: Effetto placebo
Validità di un test
• Americal Psychological Association quattro aspetti: il contenuto, la validità esterna, la validità rispetto a un criterio e il costrutto.
• Ogni questionario o test psicometrico deve essere sottoposto a una verifica della validità nella quale sono valutate le caratteristiche del test su un campione appositamente creato.
Validità di un test
Validità di contenuto
• La validità di contenuto misura quanto gli item del test misurano dell’argomento
che il test si propone di misurare.
• Per valutare la validità di contenuto ci si affida al giudizio di esperti e alla
letteratura che sull’argomento ha
elaborato materiale a riguardo.
Validità di un test
Validità interna
• la validità interna misura quanto gli item del
test misurano lo stesso costrutto, ovvero la loro correlazione. Ci si aspetta, infatti, che gli item di un test siano fortemente correlati fra loro.
• La validità interna viene solitamente valutata tramite l’analisi fattoriale che permette di
identificare le dimensioni misurate dal
questionario e la correlazione fra le dimensioni e gli item.
Validità di un test
Validità rispetto a un criterio
• La validità rispetto a un criterio misura quanto il questionario è in relazione a altre misure
(che fanno da criterio) che si ipotizza essere legate ad esso.
• Questa validità viene verificata tramite
l’analisi della correlazione fra il questionario e il criterio ed è valutata tramite il coefficiente di correlazione che indica il tipo e la forza
della relazione fra i due.
Validità di un test
Validità rispetto a un criterio
• Validità predittiva nella quale ha rilievo la dimensione temporale, quindi è la
forza con cui il test è in grado di prevedere il rendimento futuro del criterio.
• Validità concorrente nella quale il test e
il criterio sono valutati allo stesso tempo
Validità di un test
Validità di costrutto
La validità di costrutto si verifica tramite una serie di osservazioni e dati che forniscono una
informazione sulle caratteristiche
del costrutto
Validità di un test
All’interno della validità di costrutto vengono distinte:
• validità convergente: esprime il grado di accordo tra due o più misure di uno stesso costrutto
• validità discriminante: valuta il grado di divergenza fra costrutti diversi
• Entrambi i tipi di validità vengono espressi
tramite coefficienti di correlazione
Validità di un test
• Mappa concettuale
• Domande in itinere
Attendibilità
misura l’accuratezza della misurazione
si esprime come capacità nella
misura di produrre sempre gli
stessi risultati in rapporto alla
stima dell’errore casuale
Attendibilità
• Il coefficiente o indice di attendibilità misura il rapporto fra la precisione di
misura e l’errore.
• Ha valori compresi tra 0 (massima
inadeguatezza) e 1 (massima precisione).
• Può essere calcolato attraverso indici di
correlazione diversi a seconda del tipo di
dati che sono considerati.
Attendibilità
Stime dell’attendibilità
Esistono diversi metodi per il
calcolo degli indici di attendibilità ciascun dei quali produce risultati diversi in quanto basato su
considerazioni teoriche particolari.
Attendibilità
Test paralleli: agli stessi soggetti sono
somministrati due forme parallele di un test (ovvero che misurano lo stesso costrutto e hanno la stessa struttura) in tempi di
somministrazione vicini tra loro.
L’attendibilità è calcolata attraverso un indice di correlazione fra i due punteggi.
limite: misura l’interscambiabilità dei due
test che non sono mai realmente equivalenti
Attendibilità
Test-retest: agli stessi soggetti è
somministrato lo stesso questionario ma in tempi diversi.
È calcolata la correlazione fra le due misure.
Questa attendibilità ha l’accezione di stabilità nel tempo.
limite: decisione del tempo che intercorre fra una prova e l’altra che è difficile da stabilire e che inevitabilmente misurato sugli stessi soggetti dovrebbe esser considerato come misura ripetuta.
Attendibilità
Split-half: divide il test a metà e valuta la correlazione fra le due parti.
Va applicato quando il test è suddivisibile in due parti equivalenti che misurano lo stesso costrutto. L’attendibilità deve essere
considerata sul test completo quindi occorre correggere la stima effettuata sulle singole parti.
limite: la divisione split-half è sempre arbitraria.