Trattamento e Analisi statistica dei dati sperimentali
Modulo IV: Inferenza Statistica
L1. Distribuzione standardizzata
Prof. Carlo Meneghini
dip. di Scienze Università Roma Tre
Distribuzione Normale e Standard
µ
σ
x 1
2 µ = 13
σ = 5
σ
z 1
2
Distribuzione Normale Standard
z 1
2
µ σ
µ = 0 σ = 1
Una variabile che segue una distribuzione Normale La distribuzione Normale Standard ha valore atteso
µ=0
e deviazione standard
σ=1
Distribuzione Normale e Standard
x 1
2
z 1
2
x 1
2
z 1
2
Standardizzazione
̅ ̅
1
Normale t-Student
Distribuzione Normale
z 1
2
% 5 . 2
~ ) 2 ( Z < − P
% 1 . 0
~ ) 3 ( Z >
P
% 16
~ ) 1 ( Z < −
P C
95%= (-2 , 2 )
C
99%= (-3 , 3 )
P(-1 < Z < 1)~68%
P(-2 < Z < 2)~95%
P(-3 < Z < 3)~99.8%
Distribuzione Normale
z 1
2 x 1
2
P(µ- 1 σ < X < µ+ 1 σ)~68%
P(µ- 2σ < X < µ+2σ)~95%
P(µ- 3 σ < X< µ+ 3 σ)~99.8%
P(-1 < Z < 1)~68%
P(-2 < Z < 2)~95%
P(-3 < Z < 3)~99.8%
P(Z) P(X)
Esempio
L’indice di massa corporea IMC (o BMC: body mass index) si calcola come rapporto tra la massa, M (kg) e il quadrato dell’altezza h (m) di una persona: IMC = M/h2.
Un’indagine effettuata su un gruppo di 8 studenti del corso di laurea in biologia fornisce il valore medio IMCm=25.8 (kg m-2). La dev.st della distribuzione di IMC è tipicamente σIMC= 4.3 (kg m-2).
Indicando con popolazione: gli studenti del corso di laurea in biologia calcola:
a. un intervallo di confidenza al 95% per il valore vero del BMI della popolazione
b. Il valore limite IMClimche sia maggiore del valore vero della popolazione con probabilità inferiore al 2.5%
c. Il valore limite IMClimche sia minore del valore vero della popolazione con probabilità inferiore al 5%
L’indice di massa corporea IMC (o BMC: body mass index) si calcola come rapporto tra la massa, M (kg) e il quadrato dell’altezza h (m) di una persona: IMC = M/h2.
Un’indagine effettuata su un gruppo di 8 studenti del corso di laurea in biologia fornisce il valore medio IMCm=25.8 (kg m-2). La dev.st della distribuzione di IMC è tipicamente σIMC= 4.3 (kg m-2).
Indicando con popolazione: gli studenti del corso di laurea in biologia calcola:
a. un intervallo di confidenza al 95% per il valore vero del BMI della popolazione
b. Il valore limite IMClimche sia maggiore del valore vero della popolazione con probabilità inferiore al 2.5%
c. Il valore limite IMClimche sia minore del valore vero della popolazione con probabilità inferiore al 5%
C
95%(X) = (µ-2σ
med< X < µ+2σ
med)
p(Z) C
95%(Z)= (-2 < Z < 2 )
N 1.52 kg
a)
C
95%(X) = (22.8 < X < 28.8 ) kg
Esempio
IMCm=25.8 (kg m-2) σIMC= 4.3 (kg m-2) σmed= 1.5 (kg m-2) IMCm=25.8 (kg m-2) σIMC= 4.3 (kg m-2) σmed= 1.5 (kg m-2)
P(Z<-2) = 2.5%
b. calcola il valore limite IMClim che sia
maggiore del valore vero della popolazione con probabilità inferiore al 2.5%
b. calcola il valore limite IMClim che sia
maggiore del valore vero della popolazione con probabilità inferiore al 2.5%
P(Z<0)
P(Z<-2)
P(-2 < Z < 2)~95%
Z
lim= -2
P(1<Z<2)
Esempio
IMCm=25.8 (kg m-2) σIMC= 4.3 (kg m-2) σmed= 1.5 (kg m-2) IMCm=25.8 (kg m-2) σIMC= 4.3 (kg m-2) σmed= 1.5 (kg m-2)
P(Z <-2) = 2.5%
b. calcola il valore limite IMClim che sia
maggiore del valore vero della popolazione con probabilità inferiore al 2.5%
b. calcola il valore limite IMClim che sia
maggiore del valore vero della popolazione con probabilità inferiore al 2.5%
Il rischio di sbagliare affermando che la popolazione da cui proviene il
campione ha un BMI inferiore a 22.8 kg/m
2è minore del 2.5%
P(Z<0)
P(Z<-2)
BMI
lim25.8 - 2
.1.5 22.8 kg m
-2P(X<25.8) P(X<22.8)
Z BMIlim
z
lim=-2
Esempio
IMCm=25.8 (kg m-2) σIMC= 4.3 (kg m-2) σmed= 1.5 (kg m-2) IMCm=25.8 (kg m-2)
σIMC= 4.3 (kg m-2) σmed= 1.5 (kg m-2)
c. Il valore limite IMClimche sia minore del valore vero della popolazione con
probabilità inferiore al 5%
c. Il valore limite IMClimche sia minore del valore vero della popolazione con
probabilità inferiore al 5%
Zlim
Funzione diretta: data z calcola P(Z<z)
Funzione inversa: data P(Z<z) calcola z BMI
lim25.8 1.64
.1.5
28.3 kg m-2
Funzioni dirette e inverse
DISTRIB.NORM.N(xo;media;dev.st;1) => P(X<xo) DISTRIB.NORM(xo;media;dev.st;1) => P(X<xo) DISTRIB.NORM.ST.N(zo;1) => P(Z<zo)
DISTRIB.NORM.ST (zo;1) => P(Z<zo)
INV.NORM.N(p;media;dev.st) => xo t.c. P(X< xo) = p INV.NORM(p;media;dev.st) => xo t.c. P(X< xo) = p INV.NORM.S (p) => zo t.c. P(X< zo) = p
INV.NORM.ST (p) => zo t.c. P(X< zo) = p
Esempio II
L'indice di massa corporea IMC (o BMC: body mass index) si calcola come rapporto tra la massa, M (kg) e il quadrato dell’altezza h(m) di una persona: IMC = M/h2.
Un’indagine effettuata su un gruppo di 8 studenti del corso di laurea in biologia fornisce il valore medio IMCm=25.8 (kg m-2). La dev.st stimata distribuzione di IMC è sIMC= 4.3 (kg m-2).
Indicando con popolazione: gli studenti del corso di laurea in biologia calcola:
a. un intervallo di confidenza al 95% per il valore vero del BMI della popolazione
b. La probabilità che il campione provenga da una popolazione con BMI minore di 23 (kg m-2) c. La probabilità che il campione provenga da una popolazione con BMI maggiore di 28 (kg m-2) L'indice di massa corporea IMC (o BMC: body mass index) si calcola come rapporto tra la massa, M (kg) e il quadrato dell’altezza h(m) di una persona: IMC = M/h2.
Un’indagine effettuata su un gruppo di 8 studenti del corso di laurea in biologia fornisce il valore medio IMCm=25.8 (kg m-2). La dev.st stimata distribuzione di IMC è sIMC= 4.3 (kg m-2).
Indicando con popolazione: gli studenti del corso di laurea in biologia calcola:
a. un intervallo di confidenza al 95% per il valore vero del BMI della popolazione
b. La probabilità che il campione provenga da una popolazione con BMI minore di 23 (kg m-2) c. La probabilità che il campione provenga da una popolazione con BMI maggiore di 28 (kg m-2)
t-Student
Se la dev.st è stimata dal campione i dati seguono
una distribuzione t-
Esempio
a. un intervallo di confidenza al 95% per il valore vero del BMI della popolazione a. un intervallo di confidenza al 95% per il valore vero del BMI della popolazione
Funzione Excel:
INV.T.2T(p;ν) = INV.T.2T(0.05;7) = 2.84 Data p calcola tlimtale che:
0.95 γ
IMCm =25.8 (kg m-2) sIMC = 4.3 (kg m-2) N = 8
σmed= 1.5 (kg m-2) IMCm =25.8 (kg m-2) sIMC = 4.3 (kg m-2) N = 8
σmed= 1.5 (kg m-2)
t
lim-t
lim0.95
0.975
0.025
nota: la funzione INV.T.2T(p;ν) calcola la probabilità associata alle code della distribuzione, quindi p=1-γ
̅̅
C95%(t)= (-2.84< t7< 2.84)
C
95%(X) = (21.5 < X < 30.1 ) kg
% ̅ . ̅ ̅ . ̅
Esempio
b. La probabilità che il campione provenga da una popolazione con BMI minore di 23 (kg m-2) b. La probabilità che il campione provenga da una popolazione con BMI minore di 23 (kg m-2) IMCm =25.8 (kg m-2)
sIMC = 4.3 (kg m-2) N = 8
σmed= 1.5 (kg m-2) IMCm =25.8 (kg m-2) sIMC = 4.3 (kg m-2) N = 8
σmed= 1.5 (kg m-2)
̅̅
23 25.8
1.5 1.87
DISTRIB.T.DS(t;ν) = solo valori positivi di t
DISTRIB.T.2T(t;ν) = + = 2 solo valori positivi di t
DISTRIB.T.N(t;ν;1) =
Nota
DISTRIB.T.DS(t;ν) =
calcola la probabilità associata ad una sola coda della distribuzione tν. Richiede valori positivi di t.
DISTRIB.T.2T(t;ν) = + = 2
calcola la probabilità associata ad una sola coda della distribuzione tν. Richiede valori positivi di t.
Nota: per simmetria si ha: