Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 5
La distribuzione Gaussiana
• È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche
• E’ la distribuzione di probabilità degli errori casuali
• E’ la distribuzione di probabilità delle statistiche campionarie
• E’ la distribuzione limite per altre
distribuzioni di probabilità quando n →∞
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 7
Distribuzione delle differenze tra glicemia misurata al polpastrello ed all’avambraccio
La distribuzione Gaussiana
• È la distribuzione di probabilità che meglio rappresenta molte variabili biologiche
• E’ la distribuzione di probabilità degli errori casuali
• E’ la distribuzione di probabilità delle statistiche campionarie
• E’ la distribuzione limite per altre
distribuzioni di probabilità quando n →∞
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 11
• La distribuzione gaussiana come modello di una distribuzione di probabilità empirica
• Es. istogramma che descrive la
distribuzione di frequenza di una variabile
numerica in un gruppo di 400 soggetti:
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 13
• Aumento progressivamente la
suddivisione dell’istogramma:
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 15
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 17
Distribuzione di frequenza (empirica) Distribuzione di probabilità (teorica)
La forma della distribuzione di probabilità normale
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 19
La formula della distribuzione normale.
E’ definita da Media (µ) e Deviazione Standard (σ)
( ) ( )
2 2
exp 2 2 *
1
σ µ π
σ
−
−
= x
x f
La distribuzione gaussiana o “normale”
comprende una famiglia di curve, i cui
parametri sono Media (µ) e Deviazione
Standard (σ)
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 21
Media (µ): posizione centrale
Deviazione Standard (σ): 'ampiezza' della curva
Il grafico seguente mostra due curve normali con DS=1 (curva nera) e DS=2 (c.rossa). Entrambe hanno media=0 .
y
0. 00 0. 02 0. 04 0. 06 0. 08 0. 10 0. 12 0. 14 0. 16 0. 18 0. 20 0. 22 0. 24 0. 26 0. 28 0. 30 0. 32 0. 34 0. 36 0. 38 0. 40
x0
- 9 - 8 - 7 - 6 - 5 - 4 - 3 - 2 - 1 0 1 2 3 4 5 6 7 8 9 10
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 23
In questo grafico si mostra la relazione tra funzione di densità di probabilità gaussiana
(curva a campana, corrisponde ad una distribuzione normale standard) e la corrispondente funzione cumulativa (curva sigmoide).
-4.0 -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 X
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
GS2
Data una variabile la cui distribuzione di probabilità è gaussiana, possiamo misurare la probabilità corrispondente
a determinati intervalli di valori della variabile
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 25
P=0,025 | x | = 1,960 P=0,025
0,95
0,50 0,50
P=0,025 | x | = 1,960 P=0,025
0,95
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 27
X = 1,645 P=0,05
0,95
Applicazione delle regole della distribuzione gaussiana
Poniamo ad esempio che, data una variabile con distribuzione gaussiana (es. la statura), io sia interessato a calcolare la probabilità di osservare un soggetto con valore x (o inferiore).
Conosco i parametri che descrivono la distribuzione di probabilità (media: µ e Deviazione Standard: σ).
Come procedo?
Corso di laurea in biotecnologie - Corso di Statistica Medica La distribuzione di probabilità gaussiana. 29
p(x<161,49) = ?
p(x>184.5)=?
Soluzione 1: calcolo l’integrale
LA DISTRIBUZIONE DEGLI ERRORI DI MISURA
La distribuzione normale
DISTRIBUZIONE DEGLI ERRORI DI MISURA
Si supponga di eseguire, in condizioni assai simili e con lo stesso metodo analitico, un gran numero di misurazioni della emoglobina glicata, e di riportare in un grafico le frequenze relative dei valori ottenuti (x) con le prime 20, 40, ... 5120 misure.
LA FORMA DELLA DISTRIBUZIONE DEGLI
ERRORI DI MISURA
0 0.03 0.06 0.09 0.12 0.15
75 80 85 9095100105
n=20
0 0,03 0,06 0,09 0,12 0,15
75 80 85 90 95 100105
n=40
0 0,03 0,06 0,09 0,12 0,15
75 80 85 90 95 100105
n=80
0 0.03 0.06 0.09 0.12 0.15
75 8085 90 95100105
n=160
0 0,03 0,06 0,09 0,12 0,15
75 80 85 90 95 100105
n=320
0 0.03 0.06 0.09 0.12 0.15
75 80 85 90 95 100105
n=640
0 0.03 0.06 0.09 0.12 0.15
75 80 85 9095100105
n=1280
0 0,03 0,06 0,09 0,12 0,15
75 80 85 90 95100105
n=2560
0 0,03 0,06 0,09 0,12 0,15
75 80 85 90 95 100105
n=5120
• La più importante distribuzione continua che trova numerose applicazioni nello studio dei fenomeni biologici.
• Proposta da Gauss (1809) nell’ambito della teoria degli errori.
• Detta anche curva degli errori accidentali
La curva di Gauss
Le caratteristiche della distribuzione normale Le caratteristiche della distribuzione normale
1.1.èèsimmetricasimmetricarispetto al valore mediorispetto al valore medio 2.
2.il valore di x = il valore di x = µµoltre che alla media aritmetica coincide con la moda e la oltre che alla media aritmetica coincide con la moda e la mediana
mediana 3.
3.èèasintoticaasintoticaall'asse delle x da entrambi i latiall'asse delle x da entrambi i lati 4.4.èècrescentecrescenteper x<per x<µµe decrescentee decrescenteper x>per x>µµ
σ=σ1=σ2
MEDIA COME PARAMETRO DI POSIZIONE Al variare della media aritmetica (a parità di dev.standard) la curva trasla
sull’asse delle x
DEV STANDARD COME PARAMETRO DI VARIABILITA’
Al variare della deviazione standard la curva modifica la sua
forma
In una distribuzione normale perfetta:
68.26% dei casi sono compresi fra -1 e +1 DS attorno alla media 95.46% dei casi sono compresi fra -2 e +2 DS attorno alla media 99.74% dei casi sono compresi fra -3 e +3 DS attorno alla media INTERVALLI NOTI DI
INTERVALLI NOTI DI PROBABILIT PROBABILITÀÀ
DISTRIBUZIONE DISTRIBUZIONE
NORMALE
NORMALE
Distribuzione normale Distribuzione normale
Distribuzione normale standardizzata Distribuzione normale
standardizzata
La curva di Gauss standardizzata
Si può trasformare una generica funzione gaussiana f(x) con media µ e varianza σ
2, in una funzione gaussiana standard con media 0 varianza 1, se si pone :
( x - µ )
z = σ
STANDARDIZZAZIONE
TAVOLA DEI VALORI DELLA DISTRIBUZIONE STANDARDIZZATA
TAVOLA DEI VALORI DELLA
DISTRIBUZIONE STANDARDIZZATA
ESERCIZIO:
ESERCIZIO:In una popolazione di ragazze di età inclusa tra i 18 e i 25 anni, la concentra-zione di emoglobina nel sangue (x) approssima la distribuzione gaussiana con media µµµµ=13.1 g/dl e deviazione standard σσσσ=0.7 g/dl. In base a queste sole informazioni possiamo calcolare, ad esempio, quante ragazze hanno emoglo-binemia inclusa tra 12.26 e 13.52 g/dl. Infatti:
0 0,1 0,2 0,3 0,4
11 11,7 12,4 13,113,8 14,5 15,2 emoglobine mia (g/dl)
12.26 13.52
µ=13.1 µ=13.1 µ=13.1 µ=13.1 σ=0.7 σ=0.7 σ=0.7 σ=0.7
0 0,1 0,2 0,3 0,4
-3 -2 -1 0 1 2 3
deviata gaussiana standard z f(z)
11% 27%
62%
-1.2 +0.6
Nell'11% delle ragazze i valori di Hb sono minori di 12.26 g/dl, e nel 27%
sono maggiori di 13.52 g/dl. Quindi il 62% delle ragazze ha valori di Hb compresi tra 12.26 e 13.52 g/dl.
z2=
z1=(12.260-.713.10)
7 0
) 10 . 13 - 52 . 13 (
.
= -1.2
= +0.6