Laurea in Tecniche di Laboratorio Biomedico Laurea in Fisioterapia
a.a. 2021-2022 STATISTICA
Chiara Airoldi
[email protected]
OBIETTIVI:
1-test di ipotesi
THEORY
1-test di ipotesi
Obiettivo: trarre conclusioni su un parametro della popolazione (nel nostro caso la media di una v.c. continua) utilizzando le informazioni contenute in un campione di osservazioni.
Un approccio è quello visto precedentemente dell’IC, un altro consiste nell’
ESECUZIONE DI UN TEST DI IPOTESI.
È necessario ipotizzare che la media della popolazione sia uguale a un valore postulato (mu0): questa è l’ipotesi nulla.
L’ipotesi alternativa è rappresentata da Ha (Hi) è una seconda ipotesi che si contraddice ad Ho ed è l’ipotesi che il ricercatore vorrebbe verificare.
Rifiutiamo Ho quando, posto che Ho sia vera, la probabilità di avere una media del campione pari o più estrema del valore osservato x_camp è sufficientemente
piccola.
Test di ipotesi
Osservazione: la significatività statistica non implica che il risultato sia
clinicamente o scientificamente significativo: il risultato del test potrebbe avere in realtà scarse conseguenze nella pratica clinica.
Prima di eseguire un test d’ipotesi dobbiamo decidere se siamo interessati alle deviazione da mu0 che possono verificarsi in entrambe le direzioni (cioè
maggiori o minori) o in una sola di esse. In base a questa scelta scegliamo l’area
di una sola o nelle due code della curva appropriata quando calcoliamo il valore
p. (test unilaterale vs test bilaterale)
realtà
decisione
Ho vera Ho falsa Non rifiuto
HO
1-alfa Beta (II tipo)
Rifiuto HO Alfa (I tipo) 1-beta (potenza)
Errore di primo tipo e secondo tipo.
In genere alfa è fissato a 0,05 mentre beta a 0,20 (o 0,10)
Ho: persona «normale»
H1: persona incinta
Alfa= prob di rifiutare H0 quando H0 è vera 1-beta=probabilità di rifiutare Ho quanto Ho è falsa
1. Impostare ipotesi nulla e ipotesi alternativa
2. Capire se la varianza della popolazione è nota oppure se deve essere stimata con quella del campione.
→se la varianza della popolazione è nota allora calcolo la «z osservata» e la confronto
con una «z teorica» che trovo dalle tavole.
Se il test è unilaterale allora utilizzo la parte che fa riferimento a una coda. Se il test è bilaterale faccio riferimento alla parte delle tavole che riporta due code.
→se la varianza della popolazione NON è nota allora calcolo la «t osservata»
e la confronto con una «t teorica» con n-1 gradi di libertà che trovo dalle tavole.
Se il test è unilaterale allora utilizzo la parte che fa riferimento a una coda. Se il test è bilaterale faccio riferimento alla parte delle tavole che riporta due code.
3. Se il valore osservato è più «estremo» di quello teorico allora rifiuto l’ipotesi nulla.
Altrimenti non ho sufficiente evidenza per dire che la differenza osservata è significativa.
Alcuni campioni avranno certe caratteristiche improbabili da osservare se l’ipotesi nulla fosse vera. Di fronte a loro è ragionevole sospettare che l’ipotesi nulla non sia vera e pertanto si debba accettare un’ipotesi alternativa.
Il test di significatività è un criterio per decidere se un campione qualsiasi appartiene alla classe dei «probabili» o degli «improbabili» o, in termini più pratici, è un dispositivo per valutare l’entità della discrepanza tra quanto osservato nel campione e quanto previsto dall’ipotesi nulla.
La linea che divide la classe probabile da quella improbabile è chiaramente arbitraria, ma di solito si definisce in termini di probabilità e si chiama livello di significatività o livello critico indicato generalmente con alfa.
Così si può affermare che un certo risultato è significativo a livello del 5%, se il campione osservato appartiene alla classe dei campioni più distanti dall’ipotesi nulla e in questa classe non ci sono più del 5% di tutti i campioni possibili.
ESEMPIO
Vogliamo verificare che la frequenza di ondulazione media dei serpenti (tutti) 1.369: µ = 1.369 .
La deviazione standard della media della popolazione
σ=0.135.
1. Formulare ipotesi di lavoro e una ipotesi nulla
Ipotesi nulla H
0: l’ipotesi sottoposta a verifica, si riferisce sempre a un valore specifico del parametro della
popolazione (ad esempio μ), e non a una stima campionaria
L’ipotesi alternativa H
1rappresenta la conclusione raggiunta
quando H
0è rifiutata
2. Calcolare la statistica test sui dati
Supponiamo di estrarre casualmente dalla popolazione un campione casuale di 10 serpenti e di aver misurato la loro frequenza di
ondulazione.
La media campionaria di ondulazione è pari a 1.185
Dobbiamo calcolare la statistica test per la media sapendo che la varianza della
popolazione è nota quindi usiamo la seguente formula
Standardizzo (sottraggo la media e divido per la deviazione standard)
Test di ipotesi
3. Calcolare la plausibilità di Ho visti i dati e prendo una decisione
METODO 1
Rifiuto Ho -4.31 è più
piccolo di -
1.96 quindi
rifiuto Ho
METODO 2
Rifiuto Ho: pvalue
<0.05
La probabilità di osservare un valore
<4.31 è inferiore a 0.0001.
Osservazione: sulle tavole non si trovano
i valori con il 4, perchè?
PRACTICE
Si estrae un campione di 10 individui da una
popolazione con varianza dell’età nota e pari a 20. La media campionaria risulta 27 anni. Possiamo
concludere che l’età media di questa popolazione è diversa da 30 anni? (alfa=0,05)
ESERCIZIO 1
Si riportano le misure della circonferenza cranica di un campione di 14 feti con età gestazionali diverse:
22,0 23,0 24,0 26,0 27,0 24,0 26,0 21,0 20,0 22,0 23,0 27,0 28,0 25,0
Verificare con il test t a due code con alfa = 0,05, se la
circonferenza cranica media dei neonati nella popolazione è diversa da 20,0
ESERCIZIO 2
I consumatori sono stai beffati?
Il dipartimento di pesi e misure di orange country ha ricevuto lamentele che la compagnia Windsor Bottling company abbia
derubato i consumatori mettendo meno di 12 once di alcol nei loro contenitori, ma dichiarando sulla etichetta che essi contenevano 12 once.
24 contenitori sono stati scelti a caso e successivamente misurati, il contenuto trovato aveva una media di 11,4 once e una deviazione standard di 0,62 once.
Il presidente della compagnia ha dichiarato che il campione era troppo piccolo per essere significativo.
Utilizzare i dati del campione per verificare l’ipotesi che i consumatori sono stati danneggiati.
Le osservazioni di Harry hanno qualche evidenza?
ESERCIZIO 3
I seguenti dati rappresentano la captazione di ossigeno in ml durante l’incubazione di un campione casuale di 15 sospensioni cellulari
14,0 14,1 14,5 13,2 11,2 14,0 14,1 12,2 11,1 13,7 13,2 16,0 12,8 14,4 12,9 Si può concludere da questi dati che la media della popolazione non sia 12 ml (alfa=0,05)?
ESERCIZIO 4
xi media camp(xi-xcamp)^2 14 13,42667 0,328711 14,1 13,42667 0,453378 14,5 13,42667 1,152044 13,2 13,42667 0,051378 11,2 13,42667 4,958044 14 13,42667 0,328711 14,1 13,42667 0,453378 12,2 13,42667 1,504711 11,1 13,42667 5,413378 13,7 13,42667 0,074711 13,2 13,42667 0,051378 16 13,42667 6,622044 12,8 13,42667 0,392711 14,4 13,42667 0,947378 12,9 13,42667 0,277378
somma 201,4 somma 22,73196
media camp=
somma/n 13,42667 s2
(somma/
n-1) 1,623711
s 1,274249
T Distribution (for a variable T)
Parameters Graph
DF 14 Left -5
Right 5 Probability
Region 1
From (a) -5 To (b) -2,15 P(X between a and b) 0,02466
Region 2
From (c) 2,17 To (d) 5
P(X between c and d) 0,02375 Total probability (1 & 2) 0,04842
0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45
-5 -4 -3 -2 -1 0 1 2 3 4 5 T
Show probability Show a,b,c,d
ESERCIZIO 5
Efficacia di nuovo tipo di alimentazione dei polli.
Quando un allevatore di polli usa un’alimentazione regolare, i nuovi polli nati hanno un peso con distribuzione normale di media 62,2 once. In un esperimento con una mistura di cibo arricchito, sono nati novi polli con i pesi sotto elencati. Usare un livello di significatività pari a 0,01 per testare l’ipotesi che il peso sia maggiore con cibo arricchito.
61,40 62,20 66,90 63,30 66,20 66,00 63,10 63,70 66,60
61,40 62,20 66,90 63,30 66,20 66,00 63,10 63,70 66,60
8,87 4,74 6,36 1,16 3,32 2,63 1,63 0,46 4,94 sum 34,12
sum/(n-1) 4,26
n 9,00 s 2,07
media 64,38 mu_o= 62,20
s 2,07
s/radq(n) 0,69
gdl 8,00
t_oss 3,16
p-value 0,00666
t_teorico 2,90
Ho: u=62,2 Hi: u >62,2
Il pvalue è compreso tra 0,005 e 0,01. si rifiuta Ho, cioè c’è sufficiente
evidenza per dire che il peso medio sia più alto in un’alimentazione
arricchita.
ESERCIZIO 6
Monitoraggio della diossina
La preoccupazione riguardo agli effetti avversi sulla salute spesso rappresenta la causa principale che spinge organi ufficiali ad effettuare ricerche sull’inquinamento.
Qui sotto sono elencate le quantità di diossina presenti nell’aria registrate nel sito di misurazione del World Trade Center nei giorni immediatamente successivi all’attacco terroristico dell’11 settembre del 2001. la diossina è formata da una serie di sostanze chimiche prodotte durante la produzione industriale o in seguito a combustione. I quantitativi riportati sono espressi in nanogrammi per metro cubo (ng/m^3) e sono
in ordine di registrazione a partire da sinistra.
1) Calcolare la media del campione 2) Calcolare la mediana
3) Calcolare la deviazione standard 4) Calcolare la varianza
5) Calcolare il range
6) Costruire IC 95% per stimare media popolazione
7) La EPA utilizza 0.16 come livello di screening. Usare un livello di significatività pari a 0.05 per verificare l’ipotesi che il campione derivi da una popolazione con media inferiore a 0.16
8) Ci sono caratteristiche importanti dei dati non emerse nei precedenti risultati? Se sì, quali?
0.161 0.175 0.176 0.032 0.0524 0.044 0.018 0.0281 0.0268
ESERCIZIO 7
Si rileva che un grande numero di pazienti con il cancro in una certa sede e in una certa fase clinica, ha un tempo medio di sopravvivenza dalla diagnosi di 38.3 mesi con deviazione standard di 43.3 mesi.
Cento pazienti vengono trattati con una nuova tecnica e il loro tempo medio di sopravvivenza è di 46.9 mesi.
Si può spiegare questa differenza apparente della sopravvivenza come fluttuazione casuale?
PS. Provare a rifare i calcoli suppondo che l’ipotesi di interesse
sia soltanto l’incremento della sopravvivenza.
L’indice di massa corporea è calcolato dividendo il peso di un soggetto per il quadrato della sua altezza; esso è misura del grado di sovrappeso di un soggetto. Per la popolazione di uomini di mezza età che svilupperanno il diabete mellito, la distribuzione degli indici di massa corporea basali è approssimativamente normale con una media ed una deviazione standard non note.
Un campione casuale di 58 soggetti selezionati da questo gruppo ha una media di 25kg/m2 ed una deviazione standard pari a 2.7kg/m2
a.Calcolare un intervallo di confidenza al 95% per la media della popolazione
b. Ad un livello di significatività di 0.05, testare se l’indice medio di massa corporea basale della popolazione di soggetti di mezza età che svilupperanno il diabete è uguale a 24 kg/m2 , cioè il valore medio della popolazione che non sarà affetta da tale patologia.
Qual è il valore p del test?
c. cosa si pu concludere?
d. in base all’IC al 95% ci si sarebbe aspettati di dover rifiutare o meno l’Ho?
ESERCIZIO 8
THEORY
1-test di ipotesi
Confronto tra medie
Precedentemente abbiamo confrontato la media non nota di una singola
popolazione con un prefissato valore mu0 noto. Nelle applicazioni pratiche
però la situazione più comune è il confronto tra le medie di due diverse
popolazioni, entrambe non note.
Confronto tra medie
“Si considerino due popolazioni di individui sottoposti a due diversi trattamenti farmacologici. Si vuole valutare se tali trattamenti producono uguali effetti (ipotesi nulla) o diversi (ipotesi alternativa)”
1. Estraggo un campione da ognuna delle due popolazioni ed effettuo le misurazione della variabile in studio sui due campioni calcolando quindi le medie delle due serie.
2. Se le due medie sono diverse, si vuole valutare se tale differenza sia dovuta al caso e quindi i due trattamenti hanno lo stesso effetto oppure se effettivamente si osserva un effetto diverso tra i due trattamenti
3. Stabilito un certo livello di significatività α, è necessario valutare se siamo interessati ad un test unilaterale (ad una coda) o ad un test bilaterale (a due code)
Test unilaterale: il ricercatore si chiede se una media è maggiore dell’altra,
escludendo che una media possa essere minore dell’altra.
Nel test ad una coda:
la zona di rifiuto dell’ipotesi nulla sarà
solamente da una parte della distribuzione.
Test bilaterale: il ricercatore si chiede se le due medie sono significativamente
differenti senza avere indicazioni su quale sia la maggiore
Nel test ad due code:
la zona di rifiuto dell’ipotesi nulla sarà
simmetricamente distribuita dalle due parti
Campioni appaiati
Nella situazione più semplice di auto- accoppiamento vengono confrontati i valori presi sugli stessi soggetti in due momenti diversi.
Un secondo tipo di appaiamento si verifica quando i soggetti di un determinato gruppo sono appaiati con i soggetti di un altro gruppo in modo tale da rendere i due gruppi simili per alcune caratteristiche quali ad esempio età, sesso, etc.
Si studiano le differenze.
Scopo dell’appaiamento: Il confronto tra trattamento e controllo viene effettuato per cercare di controllare possibili fonti di variabilità che potrebbero oscurare la vera differenza tra le due serie di misurazioni
Campioni indipendenti
Spesso non è possibile misurare gli effetti di due differenti trattamenti sugli stessi individui. L'unica possibile strategia di analisi dei dati è quella di
confrontare due campioni
indipendenti.
Per due campioni dipendenti i calcoli vengono effettuati sulla sola colonna delle differenze, mentre nel caso di due campioni indipendenti i calcoli vengono effettuati sulle due serie di osservazioni.
FORMULE CAMPIONI INDIPENDENTI
H0 : 1 = 2 oppure 1 - 2 = 0
H1 per un test ad una coda : H1 : 1 >2 oppure 1 < 2 H1 per un test a due code : H : 1!=2 oppure 1 - 2 != 0
+
−
−
= −
2 1
2 0 1
2 1
1 1
) (
) (
2
n s n
x t x
p
𝑠𝑝𝑜𝑜𝑙2 varianza associata (pooled) nei due gruppi:
Rapport tra la somma delle due devianze e la somma dei rispettivi gradi di libertà.
La t osservata sarà da confrontare con una t con n1+n2-2 gradi di libertà
𝑆𝑝𝑜𝑜𝑙2 = 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22 𝑛1 − 1 + (𝑛2 − 1)
n d d
Media
n
i
i=
==
1( )
) . (
_ 1
1
2
= −
= −
=
s n st
Deviazione
n i
d d
in S s
E . . =
FORMULE CAMPIONI APPAIATI
PRACTICE
1-test di ipotesi
Si misurano i valori di albumina in un campione di 300 soggetti, 85 dei quali disidratati. La media campionaria per questo gruppo è di 6,2 g/100ml con s=1,2g/100 ml. Per i rimanenti la media campionaria è stata di 4,3g/100ml con s=0,8g/100ml.
A) Stabilire se la differenza tra le due medie campionarie è statisticamente significativa a livello alfa=0,01
ESERCIZIO 10
ESERCIZIO 11
In un esperimento pianificato per valutare l’efficacia della
paroxetina per il trattamento della depressione bipolare, i soggetti sono stati valutati usando la Hamilton Depression Scale e si sono ottenuti i risultati riportati sotto.
Usare un livello di significatività 0.05 per verificare l’ipotesi che il gruppo trattamento e il gruppo placebo provengano da
popolazioni con la stessa media. Che cosa suggeriscono i risultati della verifica circa la paroxetina come trattamento per la
depressione bipolare?
Gruppo placebo: n=43, x_camp=21.57 s=3.87
Gruppo trattato con paroxetina n=33 x_camp=20.38 , s=3.91
Ho: mu1=mu2 Hi: mu1!=mu2
Assunto: le varianze sigma1 e sigma2 sono incognite ma Supponiamo che siano uguali
Campioni indipendenti t con (43+33-2)=74 gdl Num=(21.57-20.38)-0
Den=radq(3.87^2/43+3.91^2/33) T_oss=1.322
P_value=0.189 IC95% [-0.60-2.98]
Dato che la statistica test non cade dentro la regione critica, non possiamo rifiutare Ho.
Non c’è sufficiente evidenza statistica per garantire il rifiuto dell’ipotesi che ricevono il placebo e i pazienti che ricevono paroxetina abbiano la stessa media.
Ad 8 individui adulti è stata misurata la pressione (a) in condizioni normali e (b) dopo l'apprendimento di una notizia capace di renderli ansiosi. I dati sono riportati in tabella.
A) Verificare se gli individui in condizioni di ansia manifestano un aumento della pressione sistolica sanguigna mediamente superiore ai 30 mm Hg. Si consideri un errore del primo tipo pari a 0,05.
unità Pre Post Post-pre
1 140 180 40
2 145 175 30
3 140 165 25
4 160 195 35
5 150 180 30
6 145 180 35
7 160 200 40
8 145 190 45
ESERCIZIO 12
ESERCIZIO 13
Verificare gli effetti dell’esercizio fisico.
È stato fatto uno studio per valutare alcuni effetti dell’esercizio fisico. I dati del campione sono riportati di seguito con i pesi espressi in kg.
1) c’è sufficiente evidenza statistica per concludere che la differenza di peso prima e dopo l’esercizio fisico è significativa? Che cosa è
possibile concludere riguardo gli effetti dell’esercizio fisico sul peso 2) Costruire un IC al 95% per le medie delle differenze tra pesi misurati
prima e dopo l’allenamento
pre_allenamento 99 57 62 69 74 77 59 92 70 85
post_allenamento 94 57 62 69 66 76 58 88 70 84
pre_allenamento 99 57 62 69 74 77 59 92 70 85
post_allenamento 94 57 62 69 66 76 58 88 70 84
diff 5 0 0 0 8 1 1 4 0 1
[Diff-mean(diff)]^2 9 4 4 4 36 1 1 4 4 1
mean 2
s 2,75
n 10
gdl 9
e
0,86922 7
t_oss 2,301
t_teorico 2,262
P-value=0.046
C’è sufficiente evidenza per concludere che ci sia una differenza tra i pesi pre allenamento e
postallenamento
ic 0,03 3,97
È stato condotto uno studio per dati appaiati al fine di determinare se la crusca di avena aiuta a ridurre i livelli di
colesterolo sierico in maschi ipercolesterolemici oppure porta ad un incremento. Un campione casuale di quattordici soggetti è stato sottoposto a una dieta con crusca di avena o di fiocchi di granoturco; dopo due settimane, sono stati registrati i livelli di colesterolo legato a lipoproteine a bassa densità (LDL). Ciascun soggetto è stato poi sottoposto all’altra dieta. Dopo altre due settimane, è stato di nuovo registrato il livello di colesterolo LDL di ciascun soggetto. I dati in studio sono di seguito riportati.
A) I due campione di dati sono appaiati o indipendenti?
B) Quali sono ipotesi nulla e alternativa per un test bilaterale?
C) Eseguire il test ad un livello di significatività di 0,05.
D)Provare a condurre il test «sbagliato» e vedere se ci sono delle differenze (es se appaiati provare a considerare indipendenti o viceversa).
soggetto ldl fiocchi ldl crusca
1 4,61 3,84
2 6,42 5,57
3 5,4 5,85
4 4,54 4,8
5 3,98 3,68
6 3,82 2,96
7 5,01 4,41
8 4,34 3,72
9 3,8 3,49
10 4,56 3,84
11 5,35 5,26
12 3,89 3,73
13 2,25 1,84
14 4,24 4,14
ESERCIZIO 14