• Non ci sono risultati.

P t i t ti ti h Parametri e statistiche

N/A
N/A
Protected

Academic year: 2022

Condividi "P t i t ti ti h Parametri e statistiche"

Copied!
9
0
0

Testo completo

(1)

P t i t ti ti h Parametri e statistiche

Popolazione opo a o e Parametri a a et Valori fissi, spesso non noti

Statistiche

Campione o

Stimatori

Variabili casuali, le cui determinazioni dipendono dalle particolari dipendono dalle particolari osservazioni scelte

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

P t i t ti ti h Parametri e statistiche

 Parametri: valori caratteristici della popolazione

 Statistiche o v.c. campionarie o stimatori o p

statistiche test: funzioni delle osservazioni campionarie

 Statistica calcolata o stima: numero ottenuto

 Statistica calcolata o stima: numero ottenuto applicando la statistica al campione osservato

 Di t ib i i i l i h l t ti ti

 Distribuzione campionaria: valori che la statistica assume al variare del campione nell’universo campionario

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

Di t ib i i i i

Distribuzioni campionarie

Le conclusioni inferenziali, basate sull’unico campione osservato, devono essere giudicate sulla base della distribuzione di probabilità dei possibili campioni che distribuzione di probabilità dei possibili campioni che potevano essere generati e dei quali quello osservato

tit i li i ti l

costituisce una realizzazione particolare.

(2)

L ti La stima

 Si suppone che la popolazione, seppur incognita, si distribuisca secondo una legge di probabilità completamente caratterizzata sa un

t  d i i di t i

parametro  o da un insieme di parametri.

 Sulla base di un campione casuale X

1

, X

2

, …, X

n

si vuole trovare un valore o un insieme di valori per  che siano la migliore approssimazione possibile del valore incognito della popolazione approssimazione possibile del valore incognito della popolazione.

L ti La stima

La stima puntuale

Per stimare uno stesso parametro si possono usare più statistiche (più stimatori) ognuno delle quali fornisce valori potenziali per il parametro.

La stima per intervalli

Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il parametro della popolazione

 1 2  1

P t    t   

Livello di confidenza

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L ti t l

La stima puntuale

Occorre definire delle regole in base alle quali si possa discriminare tra stimatori alternativi:

1. Proporre stimatori “naturali”

2. Determinare la probabilità con cui uno stimatore tende a produrre stime diverse da 

Proprietà degli stimatori p g

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L ti t l l tt

La stima puntuale: la correttezza

Uno stimatore t è uno stimatore corretto del parametro  se:

 

E t  

  X

E   X è uno stimatore corretto di 

  n 1

  n

E n 1

ˆ

2

 

2

  ˆ

2

è uno stimatore distorto di 

2

 

n

X X

 

2 1

1

i i

X X

S n

 

 è uno stimatore corretto di 

2

(3)

L ti t l La stima puntuale

• Anche se lo stimatore presenta proprietà ottimali, una volta ottenuto il campione le stime difficilmente coincideranno con il parametro incognito

parametro incognito

• A parità di stimatore, campioni diversi conducono a stime diverse

diverse

• Il valore numerico della singola stima non fornisce

informazioni sul probabile campo di variazione delle stime del informazioni sul probabile campo di variazione delle stime del parametro

Stima per intervalli

L’intervallo di confidenza per la media L intervallo di confidenza per la media della popolazione

P l i X N  ;

2

 Popolazione X N  ;

P t

1

   t

2

   1 

 Stimatore di   media campionaria

2

~ ,

X N  

 2

 2

X

X N ,

n

 

 

t

1

t

2

 

~ 0,1 X

n

N

  n

 2

 2

Z

Z

-Z

/2

Z

/2

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L’intervallo di confidenza per la media L intervallo di confidenza per la media della popolazione

 Popolazione X N  ;

2

P t     t    1

P t

1

   t

2

 1 

 Stimatore di   media campionaria

 

Z X

n

 

1 2

 

2 2

1

P t  t   P z

  Z z

n

 

2 2

P z X z

n

 

 

     

 

 

    1

 

2 n 2 1

P z X z

n n

 

 

       

 

  

2 2 1

P z z

n n

X

X  

       

 

  

2 n 2 n

   2 n 2 n

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L’intervallo di confidenza per la media

 

L intervallo di confidenza per la media della popolazione

2 2

P z X z

n

 

 

     

 

 

    1

2 n 2 1

P z X z

n n

 

 

       

 

  

2 2 1

P z z

n n

X

X  

       

 

  

2 n 2 n

   2 n 2 n

Una macchina produce bulloni il cui peso ha distribuzione Normale con media =63 grammi e varianza 2=0,8.

Una macchina produce bulloni il cui peso ha distribuzione Normale con media =incognita e varianza 2=0,8.

e varianza 0,8.

Scegliendo a caso 8 bulloni, qual è l’intervallo che con probabilità 0,95 comprenderà la loro media?

varianza 0,8.

Scelti a caso 8 bulloni, il loro peso medio è risultato pari a 62,6 grammi. Qual è l’intervallo che, con probabilità 0,95, contiene il parametri incognito ?

 

  62,6 1,96 0,89 62,6 1,96 0,89 0,95

8 8

P   

   

 

0,89 0,89

63 1,96 63 1,96 0,95

8 Xn 8

P       

 

63 0,62 n 63 0,62

0,95

P  X    P

62,6 0,62 

62,6 0,62

0,95

62,38 Xn 63,62

0,95

P    P

61,98

63,22

0,95

(4)

L’intervallo di confidenza per la media L intervallo di confidenza per la media della popolazione

2 2

1

P X z X z

n n

 

 

       

 

 

Dopo aver estratto il campione  x

1

, x

2

,  x

n

:

 

2 2

1

P x z x z

n n

 

   

       

 

 

Per 1-= 68%

2

1,00

z

Per 1-= 95%

2

1,96

z

Per 1-= 99%

z  2,58

Per 1 99%

2

2,58

z

L’intervallo di confidenza per la media L intervallo di confidenza per la media della popolazione

Quando il parametro  della popolazione è incognito il miglior Quando il parametro  della popolazione è incognito, il miglior modo per stimarlo è utilizzare la media campionaria.

Quando la numerosità campionaria  

2

Quando la numerosità campionaria n è sufficientemente elevata si ha:

 

 

  

 ; 

X N n E’ quindi possibile dire che, con probabilità 1-, l’intervallo:

x z

2

n

 

contiene il parametro incognito .

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L’intervallo di confidenza per la media L intervallo di confidenza per la media della popolazione

Si supponga di aver estratto 10 campioni di 36 unità da una

l i l di 10 i i 36 P

popolazione normale con media =10 e varianza pari a 36. Per ognuno di questi campioni si è calcolata la media campionaria e l’intervallo di confidenza al 95%

l intervallo di confidenza al 95%.

Estremi dell’intervallo:

1 96 a X

1 96 b   X

a X 1,96 n

  b X 1,96

  n Campione

X Estremo inferiore a

Estremo superiore b 1 8.75 6.79 10.71 2 11.75 9.79 13.71

3 8.45 6.49 10.41

4 9.70 7.74 11.66 5 10.50 8.54 12.46 6 9.00 7.04 10.96

7 11 15 9 19 13 11

7 11.15 9.19 13.11 8 10.50 8.54 12.46 9 7.75 5.79 9.71 10 10.10 8.14 12.06

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L’intervallo di confidenza per la media L intervallo di confidenza per la media della popolazione

16

12 14

ria

8 10

ia campionar

4 6

a, b, med

NO

0 2

1 2 3 4 5 6 7 8 9 10

Num ero del cam pione

(5)

E i i

L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale con media incognita e varianza pari a

Esercizio

una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66.

Per stimare l’altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione.

10 66

X N 58 175 4

0,90

1 0 95



 

~ ; 10,66

X Nn  58 x  175, 4 cm

1 0,95

0,99

 

  



3,265 3,265

175 4 1 64 175 4 1 64 0 90

P   

    P

175 4 0 705 

175 4 0 705

0 90

3,265 3,265

175, 4 1,96 175, 4 1,96 0,95

58 58

P   

   

175, 4 1,64 175, 4 1,64 0,90

58 58

P   

    P

175, 4 0,705

175, 4 0,705

0,90

175, 4 0,840 175, 4 0,840

0,95

P  

  

58

58

 

 

3,265 3,265

175, 4 2,58 175, 4 2,58 0,99

58 58

P   

   

 

175, 4 1,106 175, 4 1,106

0,99

P  

  

58 58

 

E i i

L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale con media incognita e varianza pari a

Esercizio

una variabile con distribuzione Normale, con media incognita e varianza pari a 10,66.

Per stimare l’altezza media si estrae un campione casuale di 58 matricole e si misura l’altezza media, che risulta pari a 175,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 90, del 95 e del 99 per cento contenga il parametro incognito della popolazione.

10 66

X N 58 175 4

0,90

1 0 95



 

~ ; 10,66

X Nn  58 x  175, 4 cm

1 0,95

0,99

 

  



174 7 176 1

0 90

P

  x 0 705

174,6 176,2

0,95

P

 

174,7 176,1

0,90

P

  x 0,705

0,840

,

,

, x 

174,3 176,5

0,99

P

 

,

1,106

 

x 

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L ti i t lli

La stima per intervalli

n >

30?

X  N?

NO NO

? SI SI

noto?

NO

 

2

x t noto? n

SI

2

n

 

2

x z n

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L ti i t lli

La stima per intervalli

La stima della media La stima della media

con distribuzione nota e varianza incognita

con distribuzione nota e varianza incognita X k

2

~ ;

X N    

2

1

1 1

n i i

s x x

n

 

 

con distribuzione nota e varianza incognita

con distribuzione nota e varianza incognita n

X

n

  nX

n

s n

1 i

~ t

n1

2 2 0,95

P X z X z

n n

       

 

 

 

• La funzione di densità della v.c. di Student è sempre simmetrica con valore medio pari a 0 ed assume una La distribuzione t di Student simmetrica, con valore medio pari a 0, ed assume una forma molto simile a quello della Normale standardizzata alla quale tende assai velocemente al crescere dei gradi di libertà.

f(x) f(x)

La distribuzione t di Student

  0 ;  

2

E X Var X n

  n

• Per valori di n piccoli o moderati, la v.c. di Student si caratterizza per una curtosi leggermente più elevata e per code più “pesanti” della v.c. Normale.

XX

(6)

L ti i t lli La stima per intervalli

La stima della media La stima della media

con distribuzione nota e varianza incognita

con distribuzione nota e varianza incognita X k

2

~ ;

X N    

2

1

1 1

n i i

s x x

n

 

 

con distribuzione nota e varianza incognita

con distribuzione nota e varianza incognita n

X

n

  nX

n

s n

1 i

~ t

n1

Esempio Esempio

L’altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media e varianza incognite.

Per stimare l’altezza media si estrae un campione casuale di 18 matricole e si misura l’altezza media, che risulta pari a 175,4 cm, con sqm campionario corretto pari a 4,4 cm. Si definisca l’intervallo che, ad un livello di fiducia del 95% contenga il parametro incognito della popolazione.

2

~ ;

X N~

 

;

n 18 x 175 4cm s 4 4cm 1 0 95 t 2 110

X N

n 18 x175, 4cm s4, 4cm 10,95

X k s

  n

0,025;17 2,110

t

175, 4 2,11 4, 4

 18

 175, 4 2,19 

173,2177,6

173,2 177,6

0,95

P

 

E i i Esercizio

Un'azienda che imbottiglia una bibita gassata vuole indagare sulla forza della pressione interna della bibita presente in una lattina. Supponendo che la forza della pressione sia una v.c.

con s.q.m. 28psi, si consideri un campione casuale di 20 lattine con pressione media pari a 235psi. Si determini un intervallo di confidenza al 95% per la pressione media delle lattine prodotte p p p dall'azienda nel caso in cui il valore della pressione possa essere considerato distribuito normalmente

essere considerato distribuito normalmente.

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

E i i Esercizio

X~ N(?; 28) =28

n=20 x  235 1-=0 95 z  1 , 96 n=20 1-=0,95 1 , 96

2

235 z

x

28 20 96 28 , 1 235 

222 , 73 ; 245 , 27 20 

z=1 96

ldf=90% z=1,64

ldf=95% z=1,96

z=2,33 ldf=95%

ldf=99%

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L ti i t lli

La stima per intervalli

• Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il parametro della popolazione

  1

P t  1    t 2    1  P t    t  

Livello di confidenza

Livello di confidenza

(7)

V C P i i i

 

 

X  B n  ; n  1  

• : numero di successi in n prove

V.C. Proporzione campionaria

 

 

X  B n  ; n  1 

1

X B   

 

: numero di successi in n prove

 

B ;

n    n

 

 

• : proporzione di successi in n prove

  proporzione di successi nella popolazione

p  proporzione di successi in un campione di ampiezza n p  proporzione di successi in un campione di ampiezza n P: v.c proporzione campionaria

1

P ;

n N

n

 

 

  

 

     Z= P -     0;1

1  N

  

n    n    

n

L ti i t lli

La proporzione di successi nella popolazione

La stima per intervalli

La proporzione di successi nella popolazione

1

X  

 Popolazione :

1

X B ;

n n

 

   

 

    

 

 P t

1

   t

2

   1 

 Stim atore di   proporzione cam pionaria P

1

P N ;  

   

 

   Z= P -     0;1

1

N

  

;

n

  n    1

n

 

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L ti i t lli

La proporzione di successi nella popolazione

P   La stima per intervalli

 

1 Z P

n

 

 

1 2   2 2 

1

P t    t     Pz   Z z n

   

2 2

1 1

1

P P z P z

n n

 

   

 

   

       

 

 

 

 Dopo aver estratto il campione  x

1

, x

2

,  x

n

 e sostituendo al parametro ignoto della popolazione il suo stimatore p:

1   1

p p p p 1

P

   

        

2 2

p p p p 1

P p z p z

n n

   

       

 

 

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

L ti i t lli

La stima per intervalli

La proporzione di successi nella popolazione

Quando il parametro  della popolazione è incognito il miglior

La proporzione di successi nella popolazione

Quando il parametro  della popolazione è incognito, il miglior modo per stimarlo è utilizzare la proporzione campionaria.

Quando la numerosità campionaria 1

Quando la numerosità campionaria

n è sufficientemente elevata si ha:1

P ;

n

N

n

 



  

 

    

E’ quindi possibile dire che, con probabilità 1-, l’intervallo:

     

2 2

1 1

p p p p 1

P p z p z

n n

   

       

 

 

contiene il parametro incognito .

 

(8)

E i i Esercizio

La stima di una proporzione La stima di una proporzione

Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma.

Qual è l’intervallo che, ad un livello di fiducia del 95%, comprende il parametro incognito della popolazione?

comprende il parametro incognito della popolazione?

E i i Esercizio

La stima di una proporzione La stima di una proporzione

Da un’indagine condotta su un campione casuale di 280 matricole universitarie è risultato che il 36% si dichiara insoddisfatto della nuova Riforma.

Qual è l’intervallo che, ad un livello di fiducia del 95%, comprende il parametro incognito della popolazione? p p

Parametro:

(Proporzione nella popolazione) Stimatore:

p

(Proporzione campionaria)

 

E Var p

 

1

p N ;

1

Per campioni

;

 

E p Var p

 

 

n Per campioni

grandi

 

 

 

 

~ ; p N

n n=280 p=0,36 1-

= 0,95

 

2

1,96

z

 

  

 

 

     

   

 

 

 

2 2 1

1

P z p z

n

   

   

     

 

        

 

2 2

1 1

1

P p z p z

n n

 

    

     

 

       

 

 

0,36 1 0,36 0,36 1 0,36

0,36 1,96 0,36 1,96 0,95

280 280

P

  

P 0,36 0,056  0,36 0,056 0,95  0,303P

0, 416

0,95

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

E i i Esercizio

Un rivenditore di automobili vorrebbe stimare la proporzione di clienti che posseggono ancora l'automobile acquistata cinque anni prima.

Dai registri del rivenditore si seleziona un campione casuale g di 200 clienti, di cui 82 posseggono ancora l'automobile acquistata cinque anni prima. Si definisca una stima per q q p p intervalli per la proporzione nella popolazione ad un livello di confidenza del 95%

confidenza del 95%.

La stima La stima

Università di Macerata

Università di Macerata –– Facoltà di Scienze Politiche Facoltà di Scienze Politiche -- Anno accademico Anno accademico 20102010--20112011 Cristina Davino Cristina Davino

E i i Esercizio

n=200 1-=0,95 1 , 96

2

  z 41

82 0

p 0 , 41 200 

p

 

 

200 41 , 0 1

* 41 , 96 0 , 1 41 ,

0 

 200

0 3418 ; 0 4781

0 , 3418 ; 0 , 4781

(9)

Dove e come studiare

S B A Di Ci i (2004) St ti ti M t d l i l i

• S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill. Cap. 11 (escluso paragrafi 11.4, 11.5, 11.9), Cap. 12 (escluso paragrafo 12.6).

• D. Piccolo (2004) – Statistica per le decisioni – Il Mulino. Cap. 13 (escluso paragrafi 13.3, 13.4,13.5, 13.6, 13.7, 13.8), Cap. 15 (escluso paragrafi 15 4 15 5 15 6)

paragrafi 15.4, 15.5, 15.6).

• F. Parpinel, C. Provasi (2004) – Elementi di probabilità e statistica per le Scienze Economiche – Giappichelli editore. Cap. 6 (escluso paragrafi pp p ( p g 6.1.1, 6.1.2, 6.2.4).

File “esercizi intervalli di confidenza.pdf”

Popolazione e campione

Riepilogo

Popolazione e campione

 La stima

 La stima puntuale

 Le proprietà degli stimatori p p g

 Intervallo di confidenza per la media

 I ll di fid l i

 Intervallo di confidenza per la proporzione

Riferimenti

Documenti correlati

fortati tutti i Superiori Capitolari, constatando che lo sforzo compiuto dalla nostra Famiglia, dai primi anni delle origini ad oggi, per regolarizzare la

Le attività di comunicazione saranno intraprese già nel mese di dicembre 2021, in preparazione alla Settimana delle Marche, e condotte contemporaneamente in Italia

(servis avec une fondue de Parmigiano Reggiano DOP froide & des lamelles de truffe noire) Tagliolini à la

Tutti i prodotti fotoluminescenti Bright Materials vengono studiati e realizzati su misura, sono personalizzabili e accessoriabili.. Si possono ad esempio scegliere il colore e

Sullo scatterplot riportato sopra, disegnare approssimativamente la retta di regressione della variabile profondità in funzione della variabile flusso e.. riportarne

Sia x1,...,x6 un campione estratto da una popolazione di legge normale di media sconosciuta e varianza uguale a 36 i cui valori sono riportati a lato. 18.1 24.2 33.4 18.5

Se eseguiamo il test k volte sempre con lo stesso input, con k scelte indipendenti del valore casuale a, e se tutte le volte n supera il test positivamente con output “n è primo ”

Mitigation pathways aiming solely at limiting warming to 1.5°C or 2°C without concurrent measures in the food sector, such as through large-scale land-related measures