Corso di
Il campo dell’inferenza statistica è costituito da metodi utilizzati per
assumere decisioni o per trarre conclusioni su una popolazione e
per tale scopo si basano
sull’informazione contenuta in un campione
Inferenza Statistica
Inferenza Statistica
POPOLAZIONE
Definizione:
si definisce popolazione oggetto l’insieme di tutti quegli elementi che hanno in comune almeno una caratteristica (o attributo)
Campionamento
Una popolazione può essere finita o infinita
Definizione:
un insieme {X 1 ,X 2 ,..,X n } viene detto campione casuale di dimensione n estratto da una popolazione con densità f(.) se la densità congiunta f x 1 ,x 2 ,..,x n (x 1 ,x 2 ,..,x n ) delle n variabili X 1 ,X 2 ,..,X n può essere espresso come:
Campionamento
n n
X X
X x x x f x f x f x
f , ,.., n 1 , 2 ,.., 1 2 ..
2
1
Definizione:
dato un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione si definisce media campionaria la quantità:
Statistiche
n
i
n X i
X n
1
1
Teorema:
dato un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione avente densità f(x), si ha che:
Statistiche
X n X
E n n
2
var
Definizione:
si definisce varianza campionaria di un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione avente densità f(x) la quantità:
Statistiche
n
i
i n
n X X
S n
1 2 2
1
1
Teorema:
dato un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione avente densità f(x), si ha che:
Statistiche
dove 2 è la varianza di f(x)
Teorema:
sia data una popolazione distribuita con densità f(x) avente media e varianza e 2 finite, sia X n la media di un campione casuale di numerosità n estratto da essa, allora la media campionaria segue una distribuzione normale con media e varianza 2 /n al tendere di n all’infinito.
Teorema Limite Centrale
Definizione:
si definisce intervallo fiduciario per il parametro un intervallo entro il quale il parametro può assumere i valori con una prefissata probabilità chiamata livello di fiducia (1- )
Stima per intervalli
L U 1
P
Sia {X 1 ,X 2 ,..,X n } un campione estratto da una popolazione avente distribuzione normale con media e varianza 2 nota.
Stima per intervalli della media
Z X n
Allora la media campionaria è uno stimatore per la media della popolazione ed inoltre segue una distribuzione normale con media e varianza 2 /n.
Consideriamo
Stima per intervalli della media
Si ha che Z segue la distribuzione normale standardizzata, dunque
1
1 2
1 2 Z Z
Z
P
Stima per intervalli della media
e quindi:
Z X Z 1
X
P n n
1
1 2
1 2 Z
n Z X
P n
Stima per intervalli della media
dunque un intervallo fiduciario per la media
Z n n X
Z
X n n
1 2
1 2
Se la varianza 2 non è nota allora si ha che la quantità
Stima per intervalli della media
n S T X
n n
segue una distribuzione chiamata di student
Stima per intervalli della media
e quindi, in modo analogo a quanto appena visto, si ha:
S S
1
1 2 ,
1 1
2 ,
1 n n
n
n t
n S t X
P
Stima per intervalli della media
e dunque un intervallo fiduciario per la media, in questo caso è dato da
n t S
n X t S
X n
n n n
n n
, 1
1 2 1
2 ,
1
Tabella per la distribuzione di student
p
0.9 0.95 0.975 0.98 0.99 0.995
n 0.2 0.1 0.05 0.04 0.02 0.01
1 3.078 6.314 12.706 15.894 31.821 63.656
2 1.886 2.920 4.303 4.849 6.965 9.925
3 1.638 2.353 3.182 3.482 4.541 5.841
4 1.533 2.132 2.776 2.999 3.747 4.604
5 1.476 2.015 2.571 2.757 3.365 4.032
6 1.440 1.943 2.447 2.612 3.143 3.707
7 1.415 1.895 2.365 2.517 2.998 3.499
8 1.397 1.860 2.306 2.449 2.896 3.355
9 1.383 1.833 2.262 2.398 2.821 3.250
10 1.372 1.812 2.228 2.359 2.764 3.169
11 1.363 1.796 2.201 2.328 2.718 3.106
12 1.356 1.782 2.179 2.303 2.681 3.055
13 1.350 1.771 2.160 2.282 2.650 3.012
14 1.345 1.761 2.145 2.264 2.624 2.977
15 1.341 1.753 2.131 2.249 2.602 2.947
Tabella per la distribuzione di student
p 0.9 0.95 0.975 0.98 0.99 0.995
n 0.2 0.1 0.05 0.04 0.02 0.01
1 3.078 6.314 12.706 15.894 31.821 63.656
2 1.886 2.920 4.303 4.849 6.965 9.925
3 1.638 2.353 3.182 3.482 4.541 5.841
4 1.533 2.132 2.776 2.999 3.747 4.604
5 1.476 2.015 2.571 2.757 3.365 4.032
6 1.440 1.943 2.447 2.612 3.143 3.707
7 1.415 1.895 2.365 2.517 2.998 3.499
8 1.397 1.860 2.306 2.449 2.896 3.355
9 1.383 1.833 2.262 2.398 2.821 3.250
10 1.372 1.812 2.228 2.359 2.764 3.169
11 1.363 1.796 2.201 2.328 2.718 3.106
12 1.356 1.782 2.179 2.303 2.681 3.055
13 1.350 1.771 2.160 2.282 2.650 3.012
14 1.345 1.761 2.145 2.264 2.624 2.977
15 1.341 1.753 2.131 2.249 2.602 2.947
16 1.337 1.746 2.120 2.235 2.583 2.921
17 1.333 1.740 2.110 2.224 2.567 2.898
18 1.330 1.734 2.101 2.214 2.552 2.878
Talvolta è interessante poter stimare la differenza fra le medie di due popolazioni.
Stima per intervalli
della differenza tra due medie
Esaminando le varianze delle due popolazioni 2 e
2 , abbiamo tre casi particolari:
2 e 2 sono note;
2 e 2 non note ma uguali;
2 2 2 1
2 2 1
2 2
2
2 1
2
1 X X X n n
X
Se X 1 e X 2 sono distribuite normalmente con varianza nota 2 e 2 , allora la variabile casuale
=X 1 -X 2 è distribuita normalmente con media pari a
- , inoltre si ha:
Stima per intervalli
della differenza tra due medie
(varianze note)
2 2 2 1
2 1
2 2 1
1
n n
X Z X
Considerando la variabile Z così definita
Stima per intervalli
della differenza tra due medie
(varianze note)
1
1 2 2
2 2 1
2 1
2 2 1
1
1 2 Z
n n
X Z X
P
e quindi si ha:
Stima per intervalli
della differenza tra due medie (varianze note)
dunque
1
2 2 2
1 2
2 2
1 X X Z
Z X
X
P
Riassumendo l’intervallo fuduciario per la differenza delle medie risulta
Stima per intervalli
della differenza tra due medie (varianze note)
2 2 2 1
2 1 1 2
2 2 1
1 2
2 2 1
2 1 1 2
2
1 X X Z n n
n Z n
X
X
2 1 1
2 1
2 2 2
2 1 2 1
n n
S n
S S P n
Se le varianze delle popolazioni non sono note ma è ragionevole ritenerle uguali si ha che la miglior stimata per la varianza delle popolazioni è data da:
Stima per intervalli
della differenza tra due medie (varianze non note ma uguali)
e dunque la stima della varianza di è data da
1 2 1 2
1 1
n S n
X T X
p
Quindi, analogamente a quanto già visto, risulta che la quantità T definita da
Stima per intervalli
della differenza tra due medie
(varianze non note ma uguali)
1 22 2 1
2 1
1
1 2 1 2 2 , 1 2
1 2 , 2 2
1 X t n n S X X X X t n n S X X
X
E dunque l’intervallo fiduciario per la differenza delle medie risulta:
Stima per intervalli
della differenza tra due medie (varianze non note ma uguali)
1 S 1
S
:
con
Se le varianze delle popolazioni non sono note e non è ragionevole ritenerle uguali si ha che la quantità T definita da:
Stima per intervalli
della differenza tra due medie (varianze non note e non uguali)
2 2 2 1
2 1
2 2 1
1
n S n
S X T X
Dove è dato da:
Stima per intervalli
della differenza tra due medie (varianze non note e non uguali)
1 1
2
2 2 2 2
1 2 1
2
2 2 2 1
2 1
n n S
n n S
n S n
S
1 2
1 21 2 2 ,
2 1 1
1 2 2 ,
1 X t S X X X X t S X X
X
E dunque l’intervallo fiduciario per la differenza delle medie risulta:
Stima per intervalli
della differenza tra due medie
(varianze non note e non uguali)
n
i
i X n
X n S
V
1
2 2
2
1
Analogamente a quanto visto per media e differenza di medie si può costruire un intervallo fiduciario per la varianza di una popolazione.
Stima per intervalli della varianza
questa segue una distribuzione chiamata
Considerando la quantità definita da:
Stima per intervalli della varianza
E dunque risulta:
1 2 1
1 2 , 2 1
2 2
, 2
1 n
n
n S
P
Stima per intervalli della varianza
E l’intervallo fiduciario:
2 , 2 1 2 2
2 1 2 , 1
2 1 1
n n
n S
n
S
Tabella per la distribuzione 2
p 0.005 0.01 0.02 0.025 0.05 0.1 0.9 0.95 0.975 0.98 0.99 0.995
n
1 3.93E-05 1.57E-04 6.28E-04 9.82E-04 3.93E-03 1.58E-02 2.71E+00 3.84E+00 5.02E+00 5.41E+00 6.63E+00 7.88E+00 2 0.0100 0.0201 0.0404 0.0506 0.1026 0.2107 4.6052 5.9915 7.3778 7.8241 9.2104 10.5965 3 0.0717 0.1148 0.1848 0.2158 0.3518 0.5844 6.2514 7.8147 9.3484 9.8374 11.3449 12.8381 4 0.207 0.297 0.429 0.484 0.711 1.064 7.779 9.488 11.143 11.668 13.277 14.860 5 0.412 0.554 0.752 0.831 1.145 1.610 9.236 11.070 12.832 13.388 15.086 16.750 6 0.676 0.872 1.134 1.237 1.635 2.204 10.645 12.592 14.449 15.033 16.812 18.548 7 0.989 1.239 1.564 1.690 2.167 2.833 12.017 14.067 16.013 16.622 18.475 20.278 8 1.344 1.647 2.032 2.180 2.733 3.490 13.362 15.507 17.535 18.168 20.090 21.955 9 1.735 2.088 2.532 2.700 3.325 4.168 14.684 16.919 19.023 19.679 21.666 23.589 10 2.156 2.558 3.059 3.247 3.940 4.865 15.987 18.307 20.483 21.161 23.209 25.188 11 2.603 3.053 3.609 3.816 4.575 5.578 17.275 19.675 21.920 22.618 24.725 26.757 12 3.074 3.571 4.178 4.404 5.226 6.304 18.549 21.026 23.337 24.054 26.217 28.300 13 3.565 4.107 4.765 5.009 5.892 7.041 19.812 22.362 24.736 25.471 27.688 29.819 14 4.075 4.660 5.368 5.629 6.571 7.790 21.064 23.685 26.119 26.873 29.141 31.319 15 4.601 5.229 5.985 6.262 7.261 8.547 22.307 24.996 27.488 28.259 30.578 32.801 16 5.142 5.812 6.614 6.908 7.962 9.312 23.542 26.296 28.845 29.633 32.000 34.267 17 5.697 6.408 7.255 7.564 8.672 10.085 24.769 27.587 30.191 30.995 33.409 35.718 18 6.265 7.015 7.906 8.231 9.390 10.865 25.989 28.869 31.526 32.346 34.805 37.156
Tabella per la distribuzione 2
p 0.005 0.01 0.02 0.025 0.05 0.1 0.9 0.95 0.975 0.98 0.99 0.995
n
1 3.93E-05 1.57E-04 6.28E-04 9.82E-04 3.93E-03 1.58E-02 2.71E+00 3.84E+00 5.02E+00 5.41E+00 6.63E+00 7.88E+00 2 0.0100 0.0201 0.0404 0.0506 0.1026 0.2107 4.6052 5.9915 7.3778 7.8241 9.2104 10.5965 3 0.0717 0.1148 0.1848 0.2158 0.3518 0.5844 6.2514 7.8147 9.3484 9.8374 11.3449 12.8381 4 0.207 0.297 0.429 0.484 0.711 1.064 7.779 9.488 11.143 11.668 13.277 14.860 5 0.412 0.554 0.752 0.831 1.145 1.610 9.236 11.070 12.832 13.388 15.086 16.750 6 0.676 0.872 1.134 1.237 1.635 2.204 10.645 12.592 14.449 15.033 16.812 18.548 7 0.989 1.239 1.564 1.690 2.167 2.833 12.017 14.067 16.013 16.622 18.475 20.278 8 1.344 1.647 2.032 2.180 2.733 3.490 13.362 15.507 17.535 18.168 20.090 21.955 9 1.735 2.088 2.532 2.700 3.325 4.168 14.684 16.919 19.023 19.679 21.666 23.589 10 2.156 2.558 3.059 3.247 3.940 4.865 15.987 18.307 20.483 21.161 23.209 25.188 11 2.603 3.053 3.609 3.816 4.575 5.578 17.275 19.675 21.920 22.618 24.725 26.757 12 3.074 3.571 4.178 4.404 5.226 6.304 18.549 21.026 23.337 24.054 26.217 28.300 13 3.565 4.107 4.765 5.009 5.892 7.041 19.812 22.362 24.736 25.471 27.688 29.819 14 4.075 4.660 5.368 5.629 6.571 7.790 21.064 23.685 26.119 26.873 29.141 31.319 15 4.601 5.229 5.985 6.262 7.261 8.547 22.307 24.996 27.488 28.259 30.578 32.801 16 5.142 5.812 6.614 6.908 7.962 9.312 23.542 26.296 28.845 29.633 32.000 34.267 17 5.697 6.408 7.255 7.564 8.672 10.085 24.769 27.587 30.191 30.995 33.409 35.718 18 6.265 7.015 7.906 8.231 9.390 10.865 25.989 28.869 31.526 32.346 34.805 37.156 19 6.844 7.633 8.567 8.907 10.117 11.651 27.204 30.144 32.852 33.687 36.191 38.582 20 7.434 8.260 9.237 9.591 10.851 12.443 28.412 31.410 34.170 35.020 37.566 39.997