• Non ci sono risultati.

Stime per intervalli

N/A
N/A
Protected

Academic year: 2021

Condividi "Stime per intervalli"

Copied!
39
0
0

Testo completo

(1)

Corso di

(2)

Il campo dell’inferenza statistica è costituito da metodi utilizzati per

assumere decisioni o per trarre conclusioni su una popolazione e

per tale scopo si basano

sull’informazione contenuta in un campione

Inferenza Statistica

(3)

Inferenza Statistica

POPOLAZIONE

(4)

Definizione:

si definisce popolazione oggetto l’insieme di tutti quegli elementi che hanno in comune almeno una caratteristica (o attributo)

Campionamento

Una popolazione può essere finita o infinita

(5)

Definizione:

un insieme {X 1 ,X 2 ,..,X n } viene detto campione casuale di dimensione n estratto da una popolazione con densità f(.) se la densità congiunta f x 1 ,x 2 ,..,x n (x 1 ,x 2 ,..,x n ) delle n variabili X 1 ,X 2 ,..,X n può essere espresso come:

Campionamento

n        n

X X

X x x x f x f x f x

f , ,.., n 1 , 2 ,..,  12  .. 

2

1

(6)

Definizione:

dato un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione si definisce media campionaria la quantità:

Statistiche

 

n

i

n X i

X n

1

1

(7)

Teorema:

dato un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione avente densità f(x), si ha che:

Statistiche

   

X n X

E n n

2

var 

 

(8)

Definizione:

si definisce varianza campionaria di un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione avente densità f(x) la quantità:

Statistiche

 

 

 

n

i

i n

n X X

S n

1 2 2

1

1

(9)

Teorema:

dato un campione {X 1 ,X 2 ,..,X n } proveniente da una popolazione avente densità f(x), si ha che:

Statistiche

dove 2 è la varianza di f(x)

(10)

Teorema:

sia data una popolazione distribuita con densità f(x) avente media e varianza e 2 finite, sia X n la media di un campione casuale di numerosità n estratto da essa, allora la media campionaria segue una distribuzione normale con media e varianza 2 /n al tendere di n all’infinito.

Teorema Limite Centrale

(11)

Definizione:

si definisce intervallo fiduciario per il parametro  un intervallo entro il quale il parametro può assumere i valori con una prefissata probabilità chiamata livello di fiducia (1-)

Stima per intervalli

L U 1

P

(12)

Sia {X 1 ,X 2 ,..,X n } un campione estratto da una popolazione avente distribuzione normale con media e varianza 2 nota.

Stima per intervalli della media

Z X n

 

Allora la media campionaria è uno stimatore per la media della popolazione ed inoltre segue una distribuzione normale con media e varianza 2 /n.

Consideriamo

(13)

Stima per intervalli della media

Si ha che Z segue la distribuzione normale standardizzata, dunque

 

   

 

   

 1

1 2

1 2 Z Z

Z

P

(14)

Stima per intervalli della media

e quindi:

 

 

    

 

Z X Z 1

X

P n n

  

  

 

 

 

 

 

   1

1 2

1 2 Z

n Z X

P n

(15)

Stima per intervalli della media

dunque un intervallo fiduciario per la media

Z n n X

Z

X n   n

     

  

1 2

1 2

(16)

Se la varianza 2 non è nota allora si ha che la quantità

Stima per intervalli della media

n S T X

n n  

segue una distribuzione chiamata di student

(17)

Stima per intervalli della media

e quindi, in modo analogo a quanto appena visto, si ha:

S S

 

  

 

 

 

 

 

     1

1 2 ,

1 1

2 ,

1 n n

n

n t

n S t X

P

(18)

Stima per intervalli della media

e dunque un intervallo fiduciario per la media, in questo caso è dato da

n t S

n X t S

X n

n n n

nn     

 , 1

1 2 1

2 ,

1   

(19)

Tabella per la distribuzione di student

p

0.9 0.95 0.975 0.98 0.99 0.995

n  0.2 0.1 0.05 0.04 0.02 0.01

1 3.078 6.314 12.706 15.894 31.821 63.656

2 1.886 2.920 4.303 4.849 6.965 9.925

3 1.638 2.353 3.182 3.482 4.541 5.841

4 1.533 2.132 2.776 2.999 3.747 4.604

5 1.476 2.015 2.571 2.757 3.365 4.032

6 1.440 1.943 2.447 2.612 3.143 3.707

7 1.415 1.895 2.365 2.517 2.998 3.499

8 1.397 1.860 2.306 2.449 2.896 3.355

9 1.383 1.833 2.262 2.398 2.821 3.250

10 1.372 1.812 2.228 2.359 2.764 3.169

11 1.363 1.796 2.201 2.328 2.718 3.106

12 1.356 1.782 2.179 2.303 2.681 3.055

13 1.350 1.771 2.160 2.282 2.650 3.012

14 1.345 1.761 2.145 2.264 2.624 2.977

15 1.341 1.753 2.131 2.249 2.602 2.947

(20)

Tabella per la distribuzione di student

p 0.9 0.95 0.975 0.98 0.99 0.995

n  0.2 0.1 0.05 0.04 0.02 0.01

1 3.078 6.314 12.706 15.894 31.821 63.656

2 1.886 2.920 4.303 4.849 6.965 9.925

3 1.638 2.353 3.182 3.482 4.541 5.841

4 1.533 2.132 2.776 2.999 3.747 4.604

5 1.476 2.015 2.571 2.757 3.365 4.032

6 1.440 1.943 2.447 2.612 3.143 3.707

7 1.415 1.895 2.365 2.517 2.998 3.499

8 1.397 1.860 2.306 2.449 2.896 3.355

9 1.383 1.833 2.262 2.398 2.821 3.250

10 1.372 1.812 2.228 2.359 2.764 3.169

11 1.363 1.796 2.201 2.328 2.718 3.106

12 1.356 1.782 2.179 2.303 2.681 3.055

13 1.350 1.771 2.160 2.282 2.650 3.012

14 1.345 1.761 2.145 2.264 2.624 2.977

15 1.341 1.753 2.131 2.249 2.602 2.947

16 1.337 1.746 2.120 2.235 2.583 2.921

17 1.333 1.740 2.110 2.224 2.567 2.898

18 1.330 1.734 2.101 2.214 2.552 2.878

(21)

Talvolta è interessante poter stimare la differenza fra le medie di due popolazioni.

Stima per intervalli

della differenza tra due medie

Esaminando le varianze delle due popolazioni  2 e

2 , abbiamo tre casi particolari:

  2 e  2 sono note;

  2 e  2 non note ma uguali;

(22)

2 2 2 1

2 2 1

2 2

2

2 1

2

1 X X X n n

X

 

   

Se X 1 e X 2 sono distribuite normalmente con varianza nota  2 e  2 , allora la variabile casuale

=X 1 -X 2 è distribuita normalmente con media pari a

-   , inoltre si ha:

Stima per intervalli

della differenza tra due medie

(varianze note)

(23)

 

2 2 2 1

2 1

2 2 1

1

n n

X Z X

 

Considerando la variabile Z così definita

Stima per intervalli

della differenza tra due medie

(varianze note)

(24)

 

  

 

 

 

 

 

   1

1 2 2

2 2 1

2 1

2 2 1

1

1 2 Z

n n

X Z X

P

e quindi si ha:

Stima per intervalli

della differenza tra due medie (varianze note)

dunque

   

 

 1

2 2 2

1 2

2 2

1 X X Z

Z X

X

P

(25)

Riassumendo l’intervallo fuduciario per la differenza delle medie risulta

Stima per intervalli

della differenza tra due medie (varianze note)

   

2 2 2 1

2 1 1 2

2 2 1

1 2

2 2 1

2 1 1 2

2

1 X X Z n n

n Z n

X

X      

       

  

(26)

   

2 1 1

2 1

2 2 2

2 1 2 1

 

n n

S n

S S P n

Se le varianze delle popolazioni non sono note ma è ragionevole ritenerle uguali si ha che la miglior stimata per la varianza delle popolazioni è data da:

Stima per intervalli

della differenza tra due medie (varianze non note ma uguali)

e dunque la stima della varianza di  è data da

(27)

 1 2  1 2

1 1

n S n

X T X

p

   

Quindi, analogamente a quanto già visto, risulta che la quantità T definita da

Stima per intervalli

della differenza tra due medie

(varianze non note ma uguali)

(28)

   

1 2

2 2 1

2 1

1

1 2 1 2 2 , 1 2

1 2 , 2 2

1 X t n n S X X X X t n n S X X

X

 

       

 

E dunque l’intervallo fiduciario per la differenza delle medie risulta:

Stima per intervalli

della differenza tra due medie (varianze non note ma uguali)

1 S 1

S  

:

con

(29)

Se le varianze delle popolazioni non sono note e non è ragionevole ritenerle uguali si ha che la quantità T definita da:

Stima per intervalli

della differenza tra due medie (varianze non note e non uguali)

 

2 2 2 1

2 1

2 2 1

1

n S n

S X T X

   

(30)

Dove  è dato da:

Stima per intervalli

della differenza tra due medie (varianze non note e non uguali)

1 1

2

2 2 2 2

1 2 1

2

2 2 2 1

2 1

 

 

 

 

 

 

 

 

n n S

n n S

n S n

S

(31)

 

1 2

 

1 2

1 2 2 ,

2 1 1

1 2 2 ,

1 X t S X X X X t S X X

X

 

       

 

  

E dunque l’intervallo fiduciario per la differenza delle medie risulta:

Stima per intervalli

della differenza tra due medie

(varianze non note e non uguali)

(32)

  

 

 

 

n

i

i X n

X n S

V

1

2 2

2

1  

Analogamente a quanto visto per media e differenza di medie si può costruire un intervallo fiduciario per la varianza di una popolazione.

Stima per intervalli della varianza

questa segue una distribuzione chiamata

Considerando la quantità definita da:

(33)

Stima per intervalli della varianza

E dunque risulta:

 

  

 

    

 1 2 1

1 2 , 2 1

2 2

, 2

1 n

n

n S

P

(34)

Stima per intervalli della varianza

E l’intervallo fiduciario:

   

2 , 2 1 2 2

2 1 2 , 1

2 1 1

  

   

 

 

n n

n S

n

S

(35)

Tabella per la distribuzione 2

p 0.005 0.01 0.02 0.025 0.05 0.1 0.9 0.95 0.975 0.98 0.99 0.995

n

1 3.93E-05 1.57E-04 6.28E-04 9.82E-04 3.93E-03 1.58E-02 2.71E+00 3.84E+00 5.02E+00 5.41E+00 6.63E+00 7.88E+00 2 0.0100 0.0201 0.0404 0.0506 0.1026 0.2107 4.6052 5.9915 7.3778 7.8241 9.2104 10.5965 3 0.0717 0.1148 0.1848 0.2158 0.3518 0.5844 6.2514 7.8147 9.3484 9.8374 11.3449 12.8381 4 0.207 0.297 0.429 0.484 0.711 1.064 7.779 9.488 11.143 11.668 13.277 14.860 5 0.412 0.554 0.752 0.831 1.145 1.610 9.236 11.070 12.832 13.388 15.086 16.750 6 0.676 0.872 1.134 1.237 1.635 2.204 10.645 12.592 14.449 15.033 16.812 18.548 7 0.989 1.239 1.564 1.690 2.167 2.833 12.017 14.067 16.013 16.622 18.475 20.278 8 1.344 1.647 2.032 2.180 2.733 3.490 13.362 15.507 17.535 18.168 20.090 21.955 9 1.735 2.088 2.532 2.700 3.325 4.168 14.684 16.919 19.023 19.679 21.666 23.589 10 2.156 2.558 3.059 3.247 3.940 4.865 15.987 18.307 20.483 21.161 23.209 25.188 11 2.603 3.053 3.609 3.816 4.575 5.578 17.275 19.675 21.920 22.618 24.725 26.757 12 3.074 3.571 4.178 4.404 5.226 6.304 18.549 21.026 23.337 24.054 26.217 28.300 13 3.565 4.107 4.765 5.009 5.892 7.041 19.812 22.362 24.736 25.471 27.688 29.819 14 4.075 4.660 5.368 5.629 6.571 7.790 21.064 23.685 26.119 26.873 29.141 31.319 15 4.601 5.229 5.985 6.262 7.261 8.547 22.307 24.996 27.488 28.259 30.578 32.801 16 5.142 5.812 6.614 6.908 7.962 9.312 23.542 26.296 28.845 29.633 32.000 34.267 17 5.697 6.408 7.255 7.564 8.672 10.085 24.769 27.587 30.191 30.995 33.409 35.718 18 6.265 7.015 7.906 8.231 9.390 10.865 25.989 28.869 31.526 32.346 34.805 37.156

(36)

Tabella per la distribuzione 2

p 0.005 0.01 0.02 0.025 0.05 0.1 0.9 0.95 0.975 0.98 0.99 0.995

n

1 3.93E-05 1.57E-04 6.28E-04 9.82E-04 3.93E-03 1.58E-02 2.71E+00 3.84E+00 5.02E+00 5.41E+00 6.63E+00 7.88E+00 2 0.0100 0.0201 0.0404 0.0506 0.1026 0.2107 4.6052 5.9915 7.3778 7.8241 9.2104 10.5965 3 0.0717 0.1148 0.1848 0.2158 0.3518 0.5844 6.2514 7.8147 9.3484 9.8374 11.3449 12.8381 4 0.207 0.297 0.429 0.484 0.711 1.064 7.779 9.488 11.143 11.668 13.277 14.860 5 0.412 0.554 0.752 0.831 1.145 1.610 9.236 11.070 12.832 13.388 15.086 16.750 6 0.676 0.872 1.134 1.237 1.635 2.204 10.645 12.592 14.449 15.033 16.812 18.548 7 0.989 1.239 1.564 1.690 2.167 2.833 12.017 14.067 16.013 16.622 18.475 20.278 8 1.344 1.647 2.032 2.180 2.733 3.490 13.362 15.507 17.535 18.168 20.090 21.955 9 1.735 2.088 2.532 2.700 3.325 4.168 14.684 16.919 19.023 19.679 21.666 23.589 10 2.156 2.558 3.059 3.247 3.940 4.865 15.987 18.307 20.483 21.161 23.209 25.188 11 2.603 3.053 3.609 3.816 4.575 5.578 17.275 19.675 21.920 22.618 24.725 26.757 12 3.074 3.571 4.178 4.404 5.226 6.304 18.549 21.026 23.337 24.054 26.217 28.300 13 3.565 4.107 4.765 5.009 5.892 7.041 19.812 22.362 24.736 25.471 27.688 29.819 14 4.075 4.660 5.368 5.629 6.571 7.790 21.064 23.685 26.119 26.873 29.141 31.319 15 4.601 5.229 5.985 6.262 7.261 8.547 22.307 24.996 27.488 28.259 30.578 32.801 16 5.142 5.812 6.614 6.908 7.962 9.312 23.542 26.296 28.845 29.633 32.000 34.267 17 5.697 6.408 7.255 7.564 8.672 10.085 24.769 27.587 30.191 30.995 33.409 35.718 18 6.265 7.015 7.906 8.231 9.390 10.865 25.989 28.869 31.526 32.346 34.805 37.156 19 6.844 7.633 8.567 8.907 10.117 11.651 27.204 30.144 32.852 33.687 36.191 38.582 20 7.434 8.260 9.237 9.591 10.851 12.443 28.412 31.410 34.170 35.020 37.566 39.997

(37)

La quantità:

Stima per intervalli

del rapporto tra le varianze di due popolazioni

segue una distribuzione di Fisher con

=n 1 -1 gradi di libertà a numeratore e

2 1

2 1

2 2

2 2

S

S

F

(38)

Stima per intervalli della varianza

E dunque risulta:

  

 

 

 

 

   

 1

1 2 , 1 ,

1 2

1 2 1

2 2 2 2

, 2 1 ,

1 2 1 2

1 n n n

n f

S S f

P

(39)

Stima per intervalli

del rapporto delle varianze

E l’intervallo fiduciario:

, 2 1 ,

2 1 2

2 1 2

2 2 1 1 2

, 1 ,

2 1 2

2 1

2 1

2 1

 

   

n n f n n

S f S

S

S

Riferimenti

Documenti correlati

la matrice t A di tipo nxm, ottenuta da A scambiando le righe con

L'apposizione può essere introdotta dalle espressioni come, in qualità di, in funzione di o dalla preposizione da:. • Rossi, come avvocato, è

(di Riemann sul carattere locale della convergenza della serie di Fourier) La convergenza o meno in un punto x della serie di Fourier dipende dai valori della funzione in un intorno

26 del Regolamento delle Prestazioni dell’Assicurazione contro gli Infortuni e le Malattie Professionali dell’ENPAIA, è svolta da tre medici, uno nominato dall’ENPAIA (per il

Della richiesta pervenuta da ENPAIA di stipulare la presente convenzione con l’INAIL al fine di poter demandare ai medici dell’Istituto l’attività di

Sperimentalmente : il numero totale di battiti cardiaci nel corso della vita di tutti gli animali è costante ( ~ 6 x 10 8 ). (durata di vita) x (frequenza cardiaca) = (numero

[r]

IN ALCUNI L’UOMO NON E’ INTERVENUTO (ES.: MARE, FORESTA …), PERCIO’ SI TRATTA DI ECOSISTEMI NATURALI; ALTRI INVECE (ES.: CITTA’, CAMPI COLTIVATI …) SONO STATI COSTRUITI