• Non ci sono risultati.

Elementi di statistica inferenziale classica Lucio Barabesi

N/A
N/A
Protected

Academic year: 2021

Condividi "Elementi di statistica inferenziale classica Lucio Barabesi"

Copied!
168
0
0

Testo completo

(1)

Elementi di statistica inferenziale classica

Lucio Barabesi

(2)

Indice

1 Il campionamento 1

1.1 Il modello statistico 1

1.2 Le statistiche 4

1.3 La verosimiglianza statistica 9

2 La stima per punti 19

2.1 Introduzione 19

2.2 Gli stimatori corretti 21

2.3 Gli stimatori coerenti 22

2.4 Gli stimatori efficienti 23

2.5. Gli stimatori sufficienti 33

3 Le stime di massima verosimiglianza 41

3.1 Il metodo della massima verosimiglianza 41

3.2 Le proprietà degli stimatori di massima verosimiglianza 51 3.3 Le proprietà degli stimatori di massima verosimiglianza per grandi campioni 53 3.4 Alcune esemplificazioni del metodo della massima verosimiglianza 60

4 La verifica di ipotesi 67

4.1 Il test statistico 67

4.2 Il test del rapporto delle verosimiglianze 71

4.3 Alcune applicazioni del test del rapporto delle verosimiglianze 77

5 La stima per intervalli 99

5.1 Gli intervalli di confidenza 99

5.2 La stima per intervalli con grandi campioni 104

5.3 Le regioni di confidenza 107

5.4 Alcuni esempi di intervalli di confidenza 109

6 L'inferenza multivariata 112

6.1 Il campionamento con osservazioni multivariate 112

6.2 La stima per punti con osservazioni multivariate 116 6.3 La verifica di ipotesi con osservazioni multivariate 121 6.4 Le regioni di confidenza con osservazioni multivariate 146

Appendice 149

A.1 Alcune distribuzioni continue 149

A.2 Alcune distribuzioni discrete 155

A.3 Le distribuzioni Chi-quadrato, ed > J 158

A.4 Alcune distribuzioni multivariate 160

Bibliografia 165

(3)

Capitolo 1

Il campionamento

1.1. Il modello statistico

1.1.1. Il campione. Si supponga che un esperimento casuale abbia prodotto un vettore di osservazioni ÐB ß á ß B Ñ" 8 . Questo vettore è detto campione, mentre la quantità è detta8 numerosità campionaria. Ogni campione, una volta osservato, costituisce un risultato acquisito.

Tuttavia, prima del rilevamento, il campione è un vettore di variabili casuali Ð\ ß á ß \ Ñ" 8 con una funzione di ripartizione congiunta J ÐB ß á ß B Ñ8 " 8 .

Se ogni osservazione viene ottenuta nelle medesime condizioni sperimentali e se il campionamento è effettuato in modo da assicurare anche l'indipendenza delle osservazioni, il campione è la realizzazione di un vettore di variabili casuali indipendenti e ugualmente distribuite. In questo caso, il campione è detto casuale e questa è la situazione campionaria a cui verrà fatto riferimento più spesso nel seguito. Se il campionamento è casuale, la funzione di ripartizione congiunta di Ð\ ß á ß \ Ñ" 8 risulta

J ÐB ß á ß B Ñ œ8 " 8 J ÐB Ñ3

3œ"

$8 ,

dove J ÐBÑ è la funzione di ripartizione marginale comune alle \3. Dunque, la funzione di ripartizione congiunta di Ð\ ß á ß \ Ñ" 8 dipende solamente da J ÐBÑ. Di conseguenza, un campione casuale può essere pensato convenientemente come un insieme di realizzazioni8 indipendenti di una variabile casuale con funzione di ripartizione \ J ÐBÑ.

1.1.2. Il modello statistico classico. L'informazione relativa all'esperimento casuale è interamente contenuta nella funzione di ripartizione congiunta J ÐB ß á ß B Ñ8 " 8 . L'insieme delle funzioni di ripartizione ammissibili per l'esperimento casuale delimita una classe dettaY modello statistico. Obiettivo dell'inferenza statistica è quello di fare affermazioni sulla distribuzione di che ha effettivamente generato il campione Y ÐB ß á ß B Ñ" 8 sulla base del campione stesso. L'inferenza sarà maggiormente accurata quanto più è possibile delimitare la classe , compatibilmente con la condizione che contenga effettivamente la distribuzione cheY Y ha generato il campione.

Nella statistica inferenziale classica si assume nota la morfologia funzionale delle funzioni di ripartizione congiunte del modello statistico e si assume che queste siano dello stesso tipo a meno di un insieme di parametri. Se è un vettore di parametri in uno spazio parametrico) 5

@©‘5, tale che J ÐB ß á ß B à Ñ8 " 8 ) è una funzione di ripartizione congiunta per ogni )−@, allora il modello statistico classico dipende solamente da , ovvero)

Y) œ ÖJ À J ÐB ß á ß B à Ñ −8 8 " 8 ) c)× ,

dove c) è una famiglia parametrica di funzioni di ripartizione congiunte. L'obiettivo dell'inferenza si riduce a fare affermazioni su )! − @ il “vero valore” del parametro della distribuzione in Y) che ha generato il campione ÐB ß á ß B Ñ" 8 .

Quando si adotta un campionamento casuale, il modello statistico dipende solo dalla struttura delle funzioni di ripartizione marginali. Se J ÐBà Ñ) è una funzione di ripartizione per ogni ) − @, nel caso di un campionamento casuale il modello statistico classico risulta

(4)

2 Il campionamento

Y) œ J À J ÐB ß á ß B à Ñ œ8 8 " 8 $J ÐB à ÑŸ3 3œ"

8

) ) .

Esempio 1.1.1. Dato un campione casuale da \ µ R Ð ß. 5#Ñ, il modello statistico dipende dal vettore di parametri ) œ Ð ß Ñ. 5 T con @œ‘‚‘, ovvero

Y . 5 F .

. 5ß 8 8 " 8 5

3œ"

8 3

œ J À J ÐB ß á ß B à ß Ñ œ B 

$ Š ‹ .Ÿ …

Esempio 1.1.2. Dato un campione casuale da \ µ IÐ!ß Ñ5 , il modello statistico dipende dal parametro ) œ5 con @œ‘, ovvero

Y 5

5 œ J À J ÐB ß á ß B à Ñ œ "   B5 ÐB Ñ

$ ’ Š ‹“ Ÿ

8 8 " 8 3

3œ"

8 3

Ð!ß∞Ñ

exp I . …

A meno di casi patologici, si può usualmente supporre che ad ogni funzione di ripartizione J ÐB ß á ß B à Ñ8 " 8 ) corrisponda una funzione di densità o funzione di probabilità congiunta 0 ÐB ß á ß B à Ñ8 " 8 ) . Dunque, per semplicità il modello statistico classico può essere specificato in termini di 0 ÐB ß á ß B à Ñ8 " 8 ) , ovvero

Y) œ Ö0 À 0 ÐB ß á ß B à Ñ −8 8 " 8 ) c)× ,

dove c) è una famiglia parametrica di funzioni di densità o funzioni di probabilità congiunte.

Nel caso di un campionamento casuale, il modello statistico classico può essere espresso in termini della funzione di densità o della funzione di probabilità 0 ÐBà Ñ) relativa a J ÐBà Ñ) , ovvero

Y) œ 0 À 0 ÐB ß á ß B à Ñ œ8 8 " 8 $0 ÐB à ÑŸ3 3œ"

8

) ) .

Esempio 1.1.3. Dato un campione casuale da \ µ R Ð ß. 5#Ñ, il modello statistico dell'Esempio 1.1.1 può essere scritto in maniera equivalente come

Y . 5 9

5 5

.

. 5ß 8 8 " 8

3œ"

8 3

œ 0 À 0 ÐB ß á ß B à ß Ñ œ " B 

$ Š ‹ .Ÿ …

Esempio 1.1.4. Dato un campione casuale da \ µ IÐ!ß Ñ5 , il modello statistico dell'Esempio 1.1.2 può essere scritto in maniera equivalente come

Y 5

5 5

5 œ 0 À 0 ÐB ß á ß B à Ñ œ "  B ÐB Ñ

$ Š ‹ Ÿ

8 8 " 8 3

3œ"

8 3

Ð!ß∞Ñ

exp I . …

1.1.3. Lo spazio campionario. Connesso al concetto di modello statistico vi è quello di spazio campionario, ovvero l'insieme V8 di tutte le possibili realizzazioni del campione compatibili con il modello statistico stesso. Se f) è il supporto di 0 ÐB ß á ß B à Ñ8 " 8 ) , allora lo spazio campionario è dato da

(5)

Capitolo 1 3

V8 f

œ .

) )

@

.

Nel caso di un campionamento casuale si ha f8ß) œf)‚ á ‚f), dove f) è il supporto di 0 ÐBà Ñ) .

Esempio 1.1.5. Dato un campione casuale da \ µ R Ð ß "Ñ. , il modello statistico dipende dal parametro ) œ. con @œ‘, ovvero

Y.œ 0 À 0 ÐB ß á ß B à Ñ œ8 8 " 8 . $9ÐB  ÑŸ3 .

3œ"

8

.

Dal momento che f. œ‘, allora si ha f.œ‘‚ á ‚‘œ‘8. Di conseguenza, lo spazio campionario risulta

V8 f

œ . œ 8

. ‘

. . …

Esempio 1.1.6. Dato un campione casuale da \ µ IÐ ß "Ñ- , il modello statistico dipende dal parametro ) œ- con @ œ‘, ovvero

Y- œ 0 À 0 ÐB ß á ß B à Ñ œ8 8 " 8 - $ Ò  ÐB  ÑÓ3 - ÐB  ÑŸ3 -

3œ"

8

Ð!ß∞Ñ

exp I .

Dal momento che f- œ Ð ß ∞Ñ- , allora si ha f- œ Ð ß ∞Ñ ‚ á ‚ Ð ß ∞Ñ- - . Di conseguenza lo spazio campionario risulta

V8 f

œ . œ 8

- ‘

- . …

1.1.4. La parametrizzazione. Un modello statistico può avere varie formulazioni equivalenti, ovvero si possono avere diverse parametrizzazioni. Sia @ÄI con I ©‘5 una funzione vettoriale biunivoca. Se #œ Ð Ñg ) con # −I, il modello statistico Y) può essere espresso come

Y) œ Ö0 À 0 ÐB ß á ß B à Ñ −8 8 " 8 ) c)× œ Ö0 À 0 ÐB ß á ß B à8 8 " 8 g"Ð ÑÑ −# cg"Ð Ñ# × œZ# , ovvero Z# e Y) sono modelli statistici equivalenti.

La preferenza per una certa parametrizzazione è legata all'interpretazione statistica del parametro scelto. In ogni caso sussiste una certa arbitarietà nella parametrizzazione, che può dipendere anche dalla facilità di trattazione matematica del modello statistico selezionato.

Esempio 1.1.7. Dato un campione casuale da \ µ R Ð!ß5#Ñ, il modello statistico dipende dal parametro ) œ5 con @−‘, ovvero

Y 5 9

5 5

5 œ 0 À 0 ÐB ß á ß B à Ñ œ " B

$ Š ‹Ÿ

8 8 " 8

3œ"

8 3

.

La trasformazione 8œ 1Ð Ñ œ5 5# per 5  ! è biunivoca. Quindi, il modello statistico può esserre riparametrizzato in termini della varianza piuttosto che dello scarto quadratico medio, ovvero

(6)

4 Il campionamento

Z 8 9

8 8

8œ 0 À 0 ÐB ß á ß B à Ñ œ " B

$ È È Ÿ

8 8 " 8

3œ"

8 3

.

Generalizzando questo esempio, quando si dispone di un campione casuale da \ µ R Ð ß. 5#Ñ, anche il modello statistico dell'Esempio 1.1.3 può essere scritto in termini della media e della varianza, ovvero

Z . 8 9

8 8

.

. 8ß 8 8 " 8

8

3œ"

œ 0 À 0 ÐB ß á ß B à ß Ñ œ " B 3

$ È È Ÿ .

Per questo modello statistico è conveniente considerare la precedente parametrizzazione, in

quanto permette di semplificare la trattazione matematica. …

Esempio 1.1.8. Si supponga che il campione ÐC ß á ß C Ñ" 8 sia la determinazione di un vettore di variabili casuali Ð] ß á ß ] Ñ" 8 con componenti indipendenti e tali che ] µ R Ð  A ß3 α " 3 5#Ñ. Si assuma inoltre che le componenti del vettore ÐA ß á ß A Ñ" 8 siano quantità note e fisse. Il campione non è casuale, in quanto le non sono ugualmente distribuite. Il modello statistico]3

risultante dipende dal vettore di parametri ) œ Ð ß ß Ñα " 5 T con @œ‘#‚‘ ed è dato da

Y α " 5 9

5 5

α "

α " 5ß ß 8 8 " 8

3œ"

8 3 3

œ 0 À 0 ÐC ß á ß C à ß ß Ñ œ " C   A

$ Π٠.

Si può porre

EÐ] Ñ œ3 α A œ" 3 α A  ÐA  AÑ œ +  ,D"– " 33 ,

dove + œα A , œ"–, " e D œ A  A3 3 –, mentre A œ 8– " A3. Questa riformulazione di

3œ"

8

EÐ] Ñ3 è conveniente, dal momento che le nuove quantità fisse ÐD ß á ß D Ñ" 8 sono tali che

D œ 8 D œ ! Ð+ß ,ß Ñ œ Ð  Aß ß Ñ

" 3œ"8 3 . Inoltre, la trasformazione 8 α "– " 5# è biunivoca, e

quindi il modello può essere riparametrizzato come segue

Z 8 9

8 8

+ß,ß 8 8 " 8

8

3œ"

3 3

8 œ 0 À 0 ÐC ß á ß C à +ß ,ß Ñ œ " C  +  ,D

$ È È Ÿ ,

dove Ð+ß ,ß Ñ −8 ‘#‚‘. Questo modello statistico è fondamentale e costituisce il cosiddetto

modello di regressione lineare (vedi Seber, 1977). …

1.2. Le statistiche

1.2.1. La definizione di statistica. Piuttosto che considerare il campione originale nella sua interezza può essere conveniente talvolta sintetizzarlo in qualche maniera. Dato un modello statistico Y), si dice statistica una trasformazione misurabile

X ÀV8Ä‘

che non dipende da . Un valore ) > œ X ÐB ß á ß B Ñ" 8 è detto realizzazione campionaria di X relativa al campione ÐB ß á ß B Ñ" 8 . Prima del rilevamento la statistica X œ X Ð\ ß á ß \ Ñ" 8 è una variabile casuale, la cui distribuzione dipende dal modello statistico considerato.

La statistica induce una partizione dello spazio campionario in insiemi del tipo EÐ>Ñ œ ÖÐB ß á ß B ÑÀ ÐB ß á ß B Ñ −" 8 " 8 V8ß X ÐB ß á ß B Ñ œ >×" 8 , ovvero in insiemi di campioni per cui il relativo valore della statistica risulta costante.

(7)

Capitolo 1 5

La definizione di statistica può essere estesa ad un vettore di statistiche , doveT V8 Ä‘5

è un vettore di trasformazioni misurabili a componenti che non dipende da .5 ) Esempio 1.2.1. Dato un campione casuale da \ µ R Ð ß Ñ. 8 , si consideri la statistica

X œ \

3œ"

8 3 .

Dal momento che \ µ R Ð ß Ñ3 . 8 , tenendo presente che è una somma di variabili casualiX indipendenti, in base alla proprietà ) della §A.1.2 si ottiene che ii X µ R Ð8 ß 8 Ñ. 8 . … Esempio 1.2.2. Dato un campione casuale \ µ IÐ!ß Ñ5 , si consideri di nuovo la statistica X dell'Esempio 1.2.1. Dal momento che \ µ IÐ!ß Ñ3 5 , tenendo presente che è una somma diX variabili casuali indipendenti, in base alla proprietà ) della §A.1.4 si ha ii X µ KÐ!ß à 8Ñ5 . … 1.2.2. La media campionaria. Dato un modello statistico Y) relativo ad un campionamento casuale da una variabile casuale tale che \ VarÐ\Ñ œ8 ∞, si consideri la statistica media campionaria, la cui realizzazione campionaria è data da

B œ " B 8

– .

3œ"

8 3

Da un punto di vista probabilistico, la media campionaria è data dalla variabile casuale

\ œ " \ 8

– .

3œ"

8 3

Dal momento che e sono finiti, si ha. 8

E – E ,

Ð\Ñ œ " Ð\ Ñ œ 8 3œ"

8

3 .

e, tenendo presente l'indipendenza delle variabili casuali Ð\ ß á ß \ Ñ" 8 , VarÐ\Ñ œ " VarÐ\ Ñ œ

8 8

# .

3œ"

8

3

8

Esempio 1.2.3. Dato un campione casuale da \ µ R Ð ß Ñ. 8 , si consideri la media campionaria

\– \ µ R Ð ß Ñ \–

. Dal momento che 3 . 8 , tenendo presente che è una combinazione lineare di variabili casuali indipendenti, in base alle proprietà ) della §A.1.2 si ha – .

ii \ µ R Ð ß Î8Ñ. 8

Risultano quindi verificati i risultati di questa sezione, in quanto E – e – . Ð\Ñ œ. VarÐ\Ñ œ Î88 … Esempio 1.2.4. Dato un campione casuale da \ µ IÐ!ß Ñ5 , si consideri la media campionaria

\– \ µ IÐ!ß Ñ \–

. Dal momento che 3 5 , tenendo presente che è una combinazione lineare di variabili casuali indipendenti, in base alle proprietà ) della §A.1.4 si ha – .

ii \ µ KÐ!ß Î8à 8Ñ5

Inoltre, per la proprietà ) della §A.1.4, si ha E – e – . Dunque, risultano

i Ð\Ñ œ5 VarÐ\Ñ œ5#Î8

verificati i risultati di questa sezione, in quanto per la IÐ!ß Ñ5 si ha EÐ\Ñ œ5 e VarÐ\Ñ œ5#1.2.3. La varianza campionaria. Dato un modello statistico Y) relativo ad un campionamento casuale da una variabile casuale tale che \ VarÐ\Ñ œ8 ∞, si consideri la statistica varianza campionaria, la cui realizzazione campionaria è data da

(8)

6 Il campionamento

= œ " ÐB  BÑ 8

# #

3œ"

8

3 – .

Da un punto di vista probabilistico, la varianza campionaria è data dalla variabile casuale W œ " Ð\  \Ñ

8

# #

3œ"

8

3

.

Al fine di derivare le proprietà della varianza campionaria, risulta conveniente esprimere =# nel modo seguente

= œ " ÒÐB  Ñ  ÐB  ÑÓ 8

œ " ÐB  Ñ  # ÐB  Ñ ÐB  Ñ  ÐB  Ñ

8 8

œ " ÐB  Ñ  ÐB  Ñ 8

# #

3œ"

8 3

3œ" 3œ"

8 8

3 # 3 #

8

3œ"

3 # #

. .

. . . .

. .

– –

– .

Di conseguenza, la varianza campionaria può essere espressa come W œ " Ð\  Ñ  Ð\  Ñ

8

# # #

3œ"

8

3 . – .

.

Sulla base della precedente relazione, si ottiene che

E E E – – .

ÐW Ñ œ " ÒÐ\  Ñ Ó  ÒÐ\  Ñ Ó œ " Ð\ Ñ  Ð\Ñ œ 8  "

8 8 8

# # #

3œ" 3œ"

8 8

3 . . Var 3 Var 8

Piuttosto che la varianza campionaria W# si adotta spesso la cosiddetta varianza campionaria corretta data da

W œ 8 W œ " Ð\  \Ñ

8  " 8  "

-# # #

3œ"

8

3

.

La varianza campionaria corretta W-# viene spesso preferita a W#, dal momento che gode della proprietà EÐW Ñ œ-# 8.

Esempio 1.2.5. Dato un campione casuale da \ µ R Ð ß Ñ. 8 , si vuole determinare la distribuzione della varianza campionaria corretta W-#. Si consideri le cosiddette statistiche scarto

H œ \  \ œ3 3 - \34 4 4œ"

8

,

dove

- œ  4 Á 3

"  4 œ 3

34

"

8"

8 .

Le statistiche scarto sono variabili casuali Normali, essendo combinazioni lineari di variabili casuali Normali indipendenti in base alla proprietà ) della §A.1.2. Inoltre, dal momento cheii

(9)

Capitolo 1 7

– ,

\ œ . \

4œ"

8

4 4

dove

. œ "

4 8 ,

anche è una combinazione lineare delle medesime variabili casuali Normali indipendenti.–

\ Infine, si ha

Œ

4œ"

8

34 4 #

- . œ  8  "  " "  " œ !

8 8 8

e dunque e sono indipendenti per la proprietà ) della §A.1.2. Di conseguenza, essendo–

H3 \ iii

W œ " H

8  "

# #

- 3

3œ"

8

una trasformata delle statistiche scarto, anche e sono indipendenti. Si può dimostrare che– W-# \

questo risultato è valido solo per questo particolare modello statistico (vedi Wilks, 1962).

Dividendo ora ambo i membri dell'espressione della varianza corretta per e tenendo presente8 la relazione ottenuta per W#, si ottiene la seguente relazione

3œ"

8 3 # # #

Ð\  Ñ W- Ð\  Ñ

œ Ð8  "Ñ 

Î8

. .

8 8 8

. Le variabili casuali \ µ R Ð ß Ñ3 . 8 sono indipendenti e dunque risulta

3œ"

8 3 #

8#

Ð\  Ñ . µ

8 ;

(vedi §A.3.2). Inoltre nell'Esempio 1.2.3 è stato verificato che – , da cui

\ µ R Ð ß Î8Ñ. 8 Ð\  Ñ

Î8 µ

– . .

8 ;

#

"

#

Dal momento che e sono indipendenti, per la proprietà ) della §A.3.2, in base alle–

W-# \ i

relazioni precedenti si deve concludere che

Ð8  "ÑW-# µ

8"

#

8 ; .

Dunque, si ha

E”Ð8  "ÑW-#•œ 8  ", ”Ð8  "ÑW-#•œ #Ð8  "Ñ

8 Var 8

(vedi §A.3.2), da cui

EÐW Ñ œ , Ð8  "ÑW œ #Ð8  "Ñ .

-# -#

8 Var” 8 •

Inoltre, anche è indipendente da , mentre–

W# \

(10)

8 Il campionamento

8W µ

#

8"

#

8 ; ,

da cui

EÐW Ñ œ 8  " , ÐW Ñ œ #Ð8  "Ñ .

8 8

# # #

8 Var # 8 …

1.2.4. La statistica ordinata. Dato un modello statistico Y) relativo ad un campionamento casuale da una variabile casuale , si consideri il vettore \ ÐB ß á ß BÐ"Ñ Ð8ÑÑ i cui elementi sono gli elementi ordinati del campione ÐB ß á ß B Ñ" 8 . Da un punto di vista probabilistico il vettore ÐB ß á ß BÐ"Ñ Ð8ÑÑ è la realizzazione campionaria del vettore di statistiche Ð\ ß á ß \Ð"Ñ Ð8ÑÑ, detto statistica ordinata. Inoltre, la statistica \Ð3Ñ è detta -esima statistica ordinata.i

La mediana campionaria è funzione della statistica ordinata. In effetti, se è dispari, ovvero8 8 œ #6  " dove è un intero, la mediana campionaria è definita come 6 \ œ \~ .

Ð6"Ñ

Alternativamente, se è pari, ovvero , allora la mediana campionaria viene~

8 8 œ #6 \

usualmente definita come ~ . Una realizzazione della mediana campionaria

\ œ Ð\Ð6Ñ \Ð6"ÑÑÎ#

viene indicata con .~B

Se la variabile casuale da cui si sta campionando è continua, allora la distribuzione della\ statistica ordinata può essere ottenuta in una forma semplice. La funzione di densità congiunta di Ð\ ß á ß \Ð"Ñ Ð8ÑÑ risulta (vedi Wilks, 1962)

0Ð\ ßáß\ ÑÐB ß á ß BÐ"Ñ Ð8ÑÑ œ 8x HÐB ß á ß BÐ"Ñ Ð8ÑÑ 0 ÐB à ÑÐ3Ñ

3œ"

8

Ð"Ñ Ð8Ñ I $ ) ,

dove H œ ÖÐB ß á ß BÐ"Ñ Ð8ÑÑÀ  ∞  BÐ"Ñ  á  BÐ8Ñ  ∞×, mentre la funzione di densità marginale di \Ð3Ñ è data da

0 ÐB Ñ œ 8 8  " J ÐB à Ñ Ò"  J ÐB à ÑÓ 0 ÐB à Ñ 3  "

\ Ð3Ñ Ð3Ñ 3" Ð3Ñ 83 Ð3Ñ

Ð3Ñ Œ ) ) ) .

Esempio 1.2.6. Dato un campione casuale da \ µ Y Ð!ß Ñ$ , il modello statistico dipende dal parametro ) œ$ con @œ‘, ovvero

Y $

$ $

$ œ 0 À 0 ÐB ß á ß B à Ñ œ " B

$ Š ‹Ÿ

8 8 " 8

3œ"

8

Ð!ß"Ñ 3

I .

Si consideri la massima statistica ordinata, ovvero \Ð8Ñ. Dal momento che il campione è casuale e la variabile casuale da cui si sta campionando è continua, la funzione di densità di \Ð8Ñ risulta

0 ÐB Ñ œ 8 B " B

\ Ð8Ñ Ð8Ñ 8" Ð!ß"Ñ Ð8Ñ

Ð8Ñ Š $ ‹ $ I Š $ ‹,

ovvero . \Ð8Ñ µ F/Ð!ß à 8ß "Ñ$ Analogamente, . \Ð"Ñ µ F/Ð!ß à "ß 8Ñ$ … Esempio 1.2.7. Dato un campione casuale da \ µ Y Ð!ß Ñ$ , supponendo la numerosità campionaria dispari con 8 œ #6  ", si vuole determinare la distribuzione della mediana campionaria . Dal momento che il campione è casuale e la variabile casuale da cui si sta~

\

campionando è continua, la funzione di densità di ~ risulta

\ œ \Ð6"Ñ

(11)

Capitolo 1 9

0 ÐBÑ œ Ð#6  "Ñ #6 B "  B " B

\ 6

6 6

Ð!ß"Ñ

~ ~ ~ ~ ~

I ,

Œ Œ$ Œ $ $ Œ$

ovvero .~

\ µ F/Ð!ß à 6  "ß 6  "Ñ$ …

1.3. La verosimiglianza statistica

1.3.1. La funzione di verosimiglianza. Dato un modello statistico Y), una volta che il campione ÐB ß á ß B Ñ" 8 è stato osservato, la quantità 0 ÐB ß á ß B à Ñ8 " 8 ) è funzione solo di .) Questa funzione rappresenta la (densità di) probabilità di osservare a priori esattamente il campione ÐB ß á ß B Ñ" 8 che è stato estratto e contiene tutta l'informazione relativa al campione stesso.

Anche una generica funzione del tipo -0 ÐB ß á ß B à Ñ8 " 8 ) , con - œ -ÐB ß á ß B Ñ" 8 costante positiva che non dipende da , offre una informazione equivalente a quella fornita da) 0 ÐB ß á ß B à Ñ8 " 8 ) . Infatti, se si deve scegliere fra due valori e)w )ww in , il criterio fondamentale@ su cui si basa la preferenza è dato dal rapporto

< œ 0 ÐB ß á ß B à Ñ 0 ÐB ß á ß B à Ñ

8 " 8 w

8 " 8 ww

) ) ,

che risulta inalterato moltiplicando numeratore e denominatore per una stessa quantità.

Si dice funzione di verosimiglianza (o verosimiglianza) la funzione PÀ@Ä‘∪ Ö!× data da

PÐ Ñ œ PÐ à B ß á ß B Ñ œ -0 ÐB ß á ß B à Ñ) ) " 8 8 " 8 ) , )− @ .

La notazione PÐ à B ß á ß B Ñ) " 8 viene adottata perchè in alcuni casi si vuole enfatizzare che la verosimiglianza è riferita proprio al campione ÐB ß á ß B Ñ" 8 . Molto spesso viene considerata anche la funzione di log-verosimiglianza, data da

6Ð Ñ œ 6Ð à B ß á ß B Ñ œ) ) " 8 lnPÐ Ñ œ) ln- ln0 ÐB ß á ß B à Ñ8 " 8 ) , )− @ , con la convenzione che 6Ð Ñ œ  ∞) se PÐ Ñ œ !) .

Nel caso di un campionamento casuale la funzione di verosimiglianza risulta PÐ Ñ œ PÐ à B ß á ß B Ñ œ -) ) " 8 0 ÐB à Ñ3 ) )

3œ"

$8 , @ ,

mentre la funzione di log-verosimiglianza si riduce a

6Ð Ñ œ 6Ð à B ß á ß B Ñ œ) ) " 8 -  0 ÐB à Ñ3 ) )

3œ"

8

ln ln , @ .

È sempre opportuno rappresentare graficamente la verosimiglianza o la log-verosimiglianza, almeno quando 5 œ " o 5 œ #. Se 5  #, è possibile ottenere una rappresentazione grafica parziale della verosimiglianza attraverso il concetto di verosimiglianza profilo. Questo argomento verrà analizzato nella §3.1.1. Dal momento che la scelta di è arbitraria, per la- rappresentazione grafica è conveniente standardizzare la verosimiglianza rispetto al suo massimo (se questo è finito), ovvero scegliere - œ "Îmax)−@PÐ Ñ) , in modo tale da ottenere una verosimiglianza normata in Ò!ß "Ó.

Di seguito viene data una serie di esempi che considerano una gamma di funzioni di verosimiglianza al variare del modello statistico.

(12)

10 Il campionamento

Esempio 1.3.1. Dato un campione casuale da \ µ R Ð ß "Ñ. , la verosimiglianza risulta PÐ Ñ œ - ÐB  Ñ œ - Ð# Ñ  " ÐB  Ñ

# œ -  " ÐB  Ñ

#

œ -  8Ò=  ÐB  Ñ Ó −

#

. 9 . 1 .

.

. . ‘

$ $ ” •

– —

š ›

3œ" 3œ"

8 8

3 "Î# 3 #

3œ"

8

3 #

# #

exp

exp

exp – , ,

dove nell'ultimo passaggio si è adoperato la relazione ottenuta nella §1.2.3. Il grafico della verosimiglianza standardizzata per 8 œ & B œ " = œ #, – e # è riportato in Figura 1.3.1.

Nella precedente espressione è stato effettuato un abuso di notazione, nel senso che la costante non è la stessa fra i vari passaggi algebrici. Si adopera questa convenzione per- indicare che la costante contiene una quantità che non dipende dai parametri e nel seguito- verrà adottata senza ulteriore commento.

Inoltre, la verosimiglianza è stata espressa in funzione delle realizzazioni campionarie delle statistiche e – , al fine di ottenere un'espressione più compatta. Questo fatto ha importanti

\ W#

risvolti teorici, come sarà visto nei successivi capitoli. Infine, la log-verosimiglianza risulta 6Ð Ñ œ -  8Ò=  ÐB  Ñ Ó −

. ln # # – . # , . ‘ . …

0.5 0 0.5 1 1.5 2 2.5

0 0.2 0.4 0.6 0.8 1

Figura 1.3.1. Verosimiglianza standardizzata per 8 œ & B œ " = œ #, – e # .

Esempio 1.3.2. Generalizzando l'esempio precedente, dato un campione casuale da

\ µ R Ð ß Ñ. 8 , tenendo presente i risultati della §1.2.3, si ottiene la seguente verosimiglianza

PÐ ß Ñ œ - " B  œ - Ð# Ñ  " ÐB  Ñ

#

œ -  " ÐB  Ñ

#

œ -  8 Ò=  ÐB  Ñ Ó

#

. 8 9 18 .

8 8

.

8

8 .

8

8 .

8

$È È $ ” •

– —

š ›

3œ" 3œ"

8 8

3 "Î# #

3

8Î# #

3œ"

8 3

8Î# # #

exp

exp

exp – ,

dove Ð ß Ñ −. 8 ‘‚‘. Il grafico della verosimiglianza standardizzata per 8 œ & B œ ", – e

= œ ## è riportato in Figura 1.3.2. Infine, la log-verosimiglianza risulta 6Ð ß Ñ œ -  8  8 Ò=  ÐB  Ñ Ó Ð ß Ñ − ‚

# #

. 8 8 . . 8 ‘ ‘

ln ln 8 ## , . …

(13)

Capitolo 1 11

1

0 1

2 3

2 4 6 8

0 0.25

0.5 0.75

1

0 1

2 3

Figura 1.3.2. Verosimiglianza standardizzata per 8 œ & B œ " = œ #, – e # .

Esempio 1.3.3. Dato un campione casuale da \ µ IÐ!ß Ñ5 , si ha la seguente verosimiglianza

PÐ Ñ œ - "  B ÐB Ñ œ -  8B −

5 5 5 ‘

5 5 5

$8 Š ‹ Š ‹

3œ"

3

Ð!ß∞Ñ 3 8

exp I exp , .

La verosimiglianza è stata espressa in funzione della realizzazione della statistica . Il grafico–

\

della verosimiglianza standardizzata per 8 œ & B œ " e – è riportato in Figura 1.3.3. Infine, la log- verosimiglianza risulta

6Ð Ñ œ -  8  8B −

5 5 5 ‘

ln ln 5

, . …

0 0.5 1 1.5 2 2.5

0 0.2 0.4 0.6 0.8 1

Figura 1.3.3. Verosimiglianza standardizzata per 8 œ & B œ " e – . Esempio 1.3.4. Dato un campione casuale da \ µ Y Ð!ß Ñ$ , la verosimiglianza risulta

PÐ Ñ œ - " B œ - B œ - Ð Ñ −

$ $ $ $ $ ‘

$ $ $

$ Š ‹ Š ‹

3œ"

8

Ð!ß"Ñ 3 8 Ð!ß"Ñ Ð8Ñ 8 ÐB ß∞Ñ

I I I Ð8Ñ , ,

dal momento che #3œ"8 IÐ!ß"ÑÐB Î Ñ œ "3 $ quando $  B3 per ogni , ovvero quando si ha 3 $  BÐ8Ñ. La verosimiglianza è stata espressa in funzione della realizzazione della statistica \Ð8Ñ, ovvero

(14)

12 Il campionamento la massima statistica ordinata. Il grafico della verosimiglianza standardizzata per 8 œ & e BÐ&Ñ œ " è riportato in Figura 1.3.4. Infine, la log-verosimiglianza risulta

6Ð Ñ œ$ ln-  8ln$ln IÐBÐ8Ñß∞ÑÐ Ñ$ , $−‘ . …

0 0.5 1 1.5 2 2.5 3

0 0.2 0.4 0.6 0.8 1

Figura 1.3.4. Verosimiglianza standardizzata per 8 œ & B e Ð&Ñ œ ".

Esempio 1.3.5. Dato un campione casuale da \ µ F3Ð"ß :Ñ, il modello statistico dipende dal parametro ) œ : con @œ Ð!ß "Ñ, ovvero

Y: 8 8 " 8 3

3œ"

8

B "B

Ö!ß"×

œ 0 À 0 ÐB ß á ß B à :Ñ œ$: Ð"  :Ñ3 3I ÐB ÑŸ,

da cui si ottiene la seguente verosimiglianza

PÐ:Ñ œ -$: Ð"  :Ñ ÐB Ñ œ -: Ð"  :Ñ : − Ð!ß "Ñ

3œ"

8

B "B 8B 88B

Ö!ß"× 3

3 3I , .

La verosimiglianza è stata espressa in funzione della realizzazione della media campionaria .–

\ Il grafico della verosimiglianza standardizzata per 8 œ & e B œ ! #– . è riportato in Figura 1.3.5.

Infine, la log-verosimiglianza risulta

6Ð:Ñ œln-  8B–ln:  Ð8  8BÑ Ð"  :Ñ : − Ð!ß "Ñ– ln , . …

0 0.2 0.4 0.6 0.8 1

0 0.2 0.4 0.6 0.8 1

Figura 1.3.5. Verosimiglianza standardizzata per 8 œ & B œ ! # e – . .

(15)

Capitolo 1 13 Esempio 1.3.6. Dato il modello di regressione lineare dell'Esempio 1.1.8, la verosimiglianza risulta

PÐ+ß ,ß Ñ œ - " C  +  ,D œ - Ð# Ñ  C  +  ,D

# œ -  " ÐC  +  ,D Ñ Ð+ß ,ß Ñ − ‚

#

8 9 18

8 8 8

8 8 ‘ ‘

8

$È È $ Œ

– —

3œ" 3œ"

8 8

3 3 "Î# 3 3

8Î# # #

3œ"

8

3 3

exp

exp , .

Siano dunque e la media e la varianza di –C =C# ÐC ß á ß C Ñ" 8 , mentre sia

= œ " D

D 8 3

# #

3œ"

8

la varianza di ÐD ß á ß D Ñ" 8 e

= œ " D C

DC 8 3 3

3œ"

8

la relativa covarianza (tenendo presente dall'Esempio 1.1.8 che –D œ !). Dunque, si ha

3œ" 3œ"

8 8

3 3 # 3 3 #

3œ" 3œ" 3œ"

8 8 8

3 # # # # 3 3

3

C D

# # # #

DC

C

ÐC  +  ,D Ñ œ ÒÐC  CÑ  ,D  ÐC  +ÑÓ

œ ÐC  CÑ  , D  8ÐC  +Ñ  #, ÐC  CÑD œ 8=  8, =  8ÐC  +Ñ  #8,=

œ 8 =

– –

– – –

# #

#DC DC

#D

D D

#

 =  8 ,=   8ÐC  +Ñ

= =

Π= Р,

dove è stato tenuto presente che e – . Di conseguenza,

3œ" 3œ"

8 8

3 3

D œ ! ÐC  CÑ œ !

PÐ+ß ,ß Ñ œ -  8 =   ,=   ÐC  +Ñ

# = =

= =

8 8

8

8Î# # #

C

#DC DC

#D

D D

#

exp – Œ – —Ÿ ,

con Ð+ß ,ß Ñ −8 ‘#‚‘. La verosimiglianza è stata espressa in funzione delle realizzazioni delle statistiche

] œ " ] 8

– ,

3œ"

8 3

e

W œ " Ð]  ] Ñ–

C# 8 #

3œ"

8 3

e della statistica

W œ " D ]

DC 8 3 3

3œ"

8

. Infine, la log-verosimiglianza risulta

(16)

14 Il campionamento

6Ð+ß ,ß Ñ œ -  8  8 =   ,=   ÐC  +Ñ

# # = =

= =

8 8

ln ln 8РC# Π#

#DC DC

#D

D D

#

– ,

con .Ð+ß ,ß Ñ −8 ‘#‚‘ …

Esempio 1.3.7. Dato un campione casuale da \ µ IÐ ß Ñ- 5 , il modello statistico dipende dal vettore di parametri ) œ Ð ß Ñ- 5 T con @ œ‘‚‘, ovvero

Y - 5 -

5 5

-

- 5ß 8 8 " 8 3

3œ"

8 3

Ð!ß∞Ñ

œ 0 À 0 ÐB ß á ß B à ß Ñ œ "  B  ÐB  Ñ

$ expΠI ٠.

La verosimiglianza risulta

PÐ ß Ñ œ - "  B  ÐB  Ñ

œ -  8B  ÐB  Ñ

œ -  8B  Ð Ñ Ð ß Ñ − ‚

- 5 -

5 5

-

5 - -

5

5 - - - 5 ‘ ‘

5

$ Œ

Œ Œ

3œ"

8 3

Ð!ß∞Ñ 3

8 Ð!ß∞Ñ Ð"Ñ

8

Ð∞ßB Ñ

exp

exp exp

I –

I –

I Ð"Ñ , ,

dove si è tenuto conto che #3œ"8 IÐ!ß∞ÑÐB  Ñ œ "3 - quando -  B3 per ogni , ovvero quando si3 ha -  BÐ"Ñ. La verosimiglianza è stata espressa in funzione delle realizzazioni delle statistiche

\– \ 8 œ & B œ # B œ "

e . Il grafico della verosimiglianza standardizzata per , – e è riportato

Ð"Ñ Ð"Ñ

in Figura 1.3.6. Infine, la log-verosimiglianza risulta

6Ð ß Ñ œ -  8  8B   Ð Ñ Ð ß Ñ − ‚

- 5 5 - - - 5 ‘ ‘

ln ln 5 ln

IÐ∞ßB ÑÐ"Ñ , . …

0

0.25 0.5 0.75 1 1

2 3 4

0 0.25

0.5 0.75

1

0 25 0.5 0.75 1

Figura 1.3.6. Verosimiglianza standardizzata per 8 œ & B œ # B, – e Ð"Ñ œ ".

Esempio 1.3.8. Dato un campione casuale \ µ Y Ð ß  Ñ- - $ , il modello statistico dipende dal vettore di parametri ) œ Ð ß Ñ- $ T con @ œ‘‚‘, ovvero

(17)

Capitolo 1 15

Y - $

$ $

-

- $ß 8 8 " 8

3œ"

8

Ð!ß"Ñ 3

œ 0 À 0 ÐB ß á ß B à ß Ñ œ " B 

$ I Œ Ÿ,

da cui

PÐ ß Ñ œ - " B  œ - B  B 

œ - Ð Ñ Ð  Ñ Ð ß Ñ − ‚

- $ $

$ $ $ $

- - -

$ - - $ - $ ‘ ‘

$ Œ Œ Œ

3œ"

8

Ð!ß"Ñ 3 8 Ð!ß"Ñ Ð"Ñ Ð!ß"Ñ Ð8Ñ

8

Ð∞ßB Ñ ÐB ß∞Ñ

I I I

I Ð"Ñ I Ð8Ñ , ,

dal momento che #83œ" Ð!ß"ÑI ÒÐB  ÑÎ Ó œ "3 - $ quando -  B 3 -$ per ogni , ovvero quando3 si ha -  BÐ"Ñ e -  B$ Ð8Ñ. La verosimiglianza è stata espressa in funzione delle realizzazioni delle statistiche \Ð"Ñ e \Ð8Ñ. Il grafico della verosimiglianza standardizzata per 8 œ & B, Ð"Ñ œ "

e BÐ&Ñ œ # è riportato in Figura 1.3.7. Infine, la log-verosimiglianza risulta

6Ð ß Ñ œ- $ ln-  8ln$lnIÐ∞ßB ÑÐ"Ñ Ð Ñ - lnIÐBÐ8Ñß∞ÑÐ  Ñ Ð ß Ñ −- $ , - $ ‘‚‘. …

0

0.25 0.5 0.75 1 1

1.5 2

0 0.25

0.5 0.75

1

0 25 0.5 0.75 1

Figura 1.3.7. Verosimiglianza standardizzata per 8 œ & B, Ð"Ñ œ " B e Ð&Ñ œ #.

Esempio 1.3.9. Dato un campione casuale da \ µ T 9Ð Ñ. , il modello statistico dipende dal parametro ) œ. con @œ‘, ovvero

Y . . .

. œ 0 À 0 ÐB ß á ß B à Ñ œ Ð  Ñ ÐB Ñ

B x Ÿ

8 8 " 8 $ 3

3œ"

8 B

3 Ö!ß"ßá×

exp

3

I .

Di conseguenza, la funzione di verosimiglianza risulta

PÐ Ñ œ - Ð  Ñ ÐB Ñ œ - Ð  8 Ñ −

. . .B x . . . ‘

I , .

$

3œ"

8 B

3 Ö!ß"ßá× 3 8B

exp exp

3

La verosimiglianza è stata espressa in funzione della realizzazione della media campionaria .–

\ Il grafico della verosimiglianza standardizzata per 8 œ & e B œ "– è riportato in Figura 1.3.8.

Infine, la log-verosimiglianza risulta

6Ð Ñ œ. ln-  8  8B. –ln. . , −‘ . …

(18)

16 Il campionamento

0 0.5 1 1.5 2 2.5 3

0 0.2 0.4 0.6 0.8 1

Figura 1.3.8. Verosimiglianza standardizzata per 8 œ & B œ " e – .

Esempio 1.3.10. Dato un campione casuale da \ µ PÐ ß "Ñ. , il modello statistico dipende dal parametro ) œ. con @œ‘, ovvero

Y. œ 0 À 0 ÐB ß á ß B à Ñ œ. " Ð  ± B .± Ñ

# Ÿ

$

8 8 " 8 3

3œ"

8

exp .

In questo caso si ha la seguente verosimiglianza

PÐ Ñ œ -. exp  ± B .± œ -exp  ± B .± .−‘

3œ" 3œ"

8 8

3 Ð3Ñ , .

La verosimiglianza è stata espressa in funzione della realizzazione della statistica ordinata Ð\ ß á ß \Ð"Ñ Ð8ÑÑ. Nelle Figure 1.3.9 e 1.3.10 è riportato il grafico della verosimiglianza standardizzata per una numerosità pari ed una dispari. Infine, la log-verosimiglianza risulta

6Ð Ñ œ. ln-  ± B .± œln-  ± B .± .− ‘

3œ" 3œ"

8 8

3 Ð3Ñ , . …

0 2 4 6

0 0.2 0.4 0.6 0.8 1

Figura 1.3.9. Verosimiglianza standardizzata per e .

8 œ % ÐB ß B ß B ß B Ñ œ Ð  "ß #ß %ß *ÑÐ"Ñ Ð#Ñ Ð$Ñ Ð%Ñ

(19)

Capitolo 1 17

0 2 4 6 8

0 0.2 0.4 0.6 0.8 1

Figura 1.3.10. Verosimiglianza standardizzata per e .

8 œ &

ÐB ß B ß B ß B ß B Ñ œ Ð  "ß #ß %ß &ß *ÑÐ"Ñ Ð#Ñ Ð$Ñ Ð%Ñ Ð&Ñ

Esempio 1.3.11. Si consideri la variabile casuale discreta con funzione di probabilità\ 0 ÐBÑ œ " ÐBÑ

\ R IÖ"ßáßR × ,

dove R − . Questa variabile casuale è la versione discreta di una Uniforme. Dato un campione casuale, il modello statistico dipende dal parametro ) œ R con @œ, ovvero

YR 8 8 " 8 3

3œ"

8

Ö"ßáßR ×

œ 0 À 0 ÐB ß á ß B à R Ñ œ " ÐB Ñ

R Ÿ

$ I .

Di conseguenza, la funzione di verosimiglianza risulta

PÐR Ñ œ - " ÐB Ñ œ -R ÐB Ñ œ -R ÐR Ñ

$R

3œ"

8

Ö"ßáßR × 3 8 Ö"ßáßR × Ð8Ñ 8 ÖB ßB "ßá×

I I I Ð8Ñ Ð8Ñ ,

con R −, e dove si è tenuto conto che #83œ" Ö"ßáßR ×I ÐB Ñ œ "3 quando R   B3 per ogni ,3 ovvero quando si ha R   BÐ8Ñ. La verosimiglianza è definita solo sugli interi positivi, ovvero lo spazio parametrico. Inoltre, la verosimiglianza è stata espressa in funzione della realizzazione della statistica \Ð8Ñ. Il grafico della verosimiglianza standardizzata per 8 œ % e BÐ%Ñ œ # è riportato in Figura 1.3.11. Infine, la log-verosimiglianza risulta

6ÐR Ñ œln-  8lnR ln IÖBÐ8ÑßBÐ8Ñ"ßá×ÐR Ñ R − ,  . …

2 3 4 5 6

0 0.2 0.4 0.6 0.8 1

Figura 1.3.11. Verosimiglianza standardizzata per 8 œ % B e Ð%Ñ œ #.

(20)

18 Il campionamento

Esempio 1.3.12. Si consideri la variabile casuale continua con funzione di densità\ 0 ÐBÑ œ #B ÐBÑ  #Ð"  BÑ ÐBÑ

: "  :

\ IÐ!ß:Ó IÐ:ß"Ñ ,

dove : − Ð!ß "Ñ. Questa variabile casuale è detta anche Triangolare. In questo caso, dato un campione casuale, il modello statistico dipende dal parametro ) œ : con @œ Ð!ß "Ñ, ovvero

Y: 8 8 " 8 3 3

3œ"

8

Ð!ß:Ó Ð:ß"Ñ

œ 0 À 0 ÐB ß á ß B à :Ñ œ #B ÐB Ñ  #Ð"  BÑ ÐB Ñ

: "  : Ÿ

$ ” I I • .

Di conseguenza, la verosimiglianza risulta

PÐ:Ñ œ - #B ÐB Ñ  #Ð"  B Ñ ÐB Ñ

: "  :

œ - #B ÐB Ñ  #Ð"  B Ñ ÐB Ñ

: "  :

$ ” •

$ ” •

3œ"

8 3 3

Ð!ß:Ó 3 Ð:ß"Ñ 3

3œ"

8 Ð3Ñ Ð3Ñ

Ð!ß:Ó Ð3Ñ Ð:ß"Ñ Ð3Ñ

I I

I I .

La verosimiglianza è stata espressa in funzione della realizzazione della statistica ordinata Ð\ ß á ß \Ð"Ñ Ð8ÑÑ. Dalla Figura 1.3.12, si può notare la struttura complessa che può assumere la

verosimiglianza per questo modello. …

0 0.2 0.4 0.6 0.8 1

0 0.2 0.4 0.6 0.8 1

Figura 1.3.12. Verosimiglianza standardizzata per 8 œ $ ÐB ß B ß B Ñ œ Ð! #ß ! %ß ! )Ñ e Ð"Ñ Ð#Ñ Ð$Ñ . . . .

(21)

Capitolo 2

La stima per punti

2.1. Introduzione

2.1.1. La definizione di stimatore. Una volta scelto il modello statistico Y), un primo obiettivo dell'inferenza è quello di selezionare un valore di sulla base del campione osservato. Il) procedimento di stima fa corrispondere ad ogni campione ÐB ß á ß B Ñ −" 8 V8 un valore )−@, ovvero considera un vettore di funzioni ~ a componenti, detto stimatore, tale che

K 5 K~

ÀV8Ä@ .

Uno stimatore è per definizione un vettore di statistiche. La realizzazione campionaria dello stimatore ~ ~ è detta stima. Questo tipo di procedimento di stima è detto per

)œKÐB ß á ß B Ñ" 8

punti perchè ad ogni campione fa corrispondere un punto dello spazio parametrico.

In questo capitolo vengono discusse una serie di proprietà desiderabili per uno stimatore ~. K Tuttavia, anche se lo stimatore gode di proprietà ottimali, si deve sottolineare fin da ora che la stima può essere molto differente dal “vero valore” del parametro ~ a causa della variabilità

) )!

campionaria. Dunque, in un procedimento di stima per punti, la stima deve sempre essere~ )

accompagnata da un indice di “precisione” dello stimatore ~ nello stimare il vero parametro .

K )!

Questo argomento verrà trattato in maggiore dettaglio nel prossimo capitolo.

2.1.2. I problemi regolari di stima. Al fine di ottenere un procedimento di stima con proprietà desiderabili, è opportuno definire alcune condizioni a cui il modello statistico deve preferibilmente sottostare. Dato un modello statistico Y), si dice che il problema di stima è regolare se:

a) il modello statistico è identificabile, ovvero le distribuzioni 0 ÐB ß á ß B à Ñ8 " 8 ) specificate dal modello statistico Y) sono distinte per valori distinti di ) −@;

b) lo spazio parametrico è un aperto di @ ‘5; c) le derivate

`

` 0 ÐB ß á ß B à Ñ

) 8 " 8 )

e

`

` ` 0 ÐB ß á ß B à Ñ

#

8 " 8

) )T )

esistono per ogni ) −@ e per ogni ÐB ß á ß B Ñ −" 8 V8 (a meno di insiemi di probabilità nulla);

d) risulta

( (

V8 V8

` `

` 0 ÐB ß á ß B à Ñ . œ ` 0 ÐB ß á ß B à Ñ .

) 8 " 8 ) / ) 8 " 8 ) /

e

( (

V8 V8

` `

` ` 0 ÐB ß á ß B à Ñ . œ ` ` 0 ÐB ß á ß B à Ñ .

# #

8 " 8 8 " 8

) )T ) / ) )T ) / ,

(22)

20 La stima per punti dove l'integrazione è da intendersi opportunamente estesa alle componenti del vettore o della matrice e dove una scrittura del tipo

(V8

1 ÐB ß á ß B Ñ .8 " 8 /

va interpretata come integrale di Riemann o come somma su V8 a secondo che il vettore di variabili casuali Ð\ ß á ß \ Ñ" 8 sia continuo o discreto.

Nel caso di un campionamento casuale, la condizione ) si riduce a richiedere che lea distribuzioni 0 ÐBà Ñ) specificate dal modello statistico siano distinte per valori distinti di )−@. La condizione ) si riduce all'esistenza delle derivatec

`

` 0 ÐBà Ñ

) )

e

`

` ` 0 ÐBà Ñ

#

) )T )

per ogni ) − @ e per ogni B −f) (a meno di insiemi di probabilità nulla), mentre la condizione d) risulta

( (

f) f)

` `

` 0 ÐBà Ñ . œ ` 0 ÐBà Ñ .

) ) / ) ) /

e

( (

f) f)

` `

` ` 0 ÐBà Ñ . œ ` ` 0 ÐBà Ñ .

# #

) )T ) / ) )T ) / .

La condizione ) permette di individuare in maniera univoca una specifica distribuzione aa partire dal valore del parametro e quindi di ottenere procedimenti di stima coerenti. La condizione ) serve a imporre che il vero valore del parametro b )! non sia sulla frontiera di .@ Infine, le condizioni ) e ) sono condizioni di regolarità matematica, che vengono adoperate nelc d seguito per ottenere alcune proprietà degli stimatori. Le condizioni )- ) sono soddisfatte nellaa d gran parte dei modelli statistici di uso comune.

Esempio 2.1.1. Dato un campione casuale da \ µ R Ð ß "Ñ. , la condizione ) è verificata ina quanto

9ÐB ."Ñ œ ÐB 9 .#Ñ

per ogni solo se B ." œ.#. La condizione ) è verificata dal momento che b @œ‘. È immediato verificare la condizione ), dal momento chec

`

` ÐB  Ñ œ  ÐB  Ñ

.9 . 9w .

e

`

` ÐB  Ñ œ ÐB  Ñ

#

#

ww

. 9 . 9 .

esistono per ogni .−‘ e B −‘. Inoltre, risulta

` `

` ÐB  Ñ .B œ ` ÐB  Ñ .B œ !

.( 9 . . ( 9 .

∞ ∞

#

# ,

Riferimenti

Documenti correlati

Durante i numerosi sopralluoghi effettuati sia in occasione dei rilievi della rete che durante alcuni eventi meteorici, oltre che dalla verifica della rete con il metodo

Con un campione di n = 100 la forma della distribuzione delle medie è praticamente normale con un valore medio di 0.7502. La cosa importante è che, per campioni

In ambito digitale, i mezzi di proprietà, che spesso costituiscono lo strumento più economico 69 di investimento pubblicitario, devono poter trasmettere l’identità del brand, in

Trovare il versore con la stessa direzione e lo stesso verso

La seguente Proposizione fornisce un risultato di particolare rilevanza nel caso in cui le componenti del v.v.a. indipendenti, allora dalla Proposizione 4.2.5 si ottiene..

In pratica, essendo l’estrazione del campione del tutto casuale, la conoscenza di tali valori sintetici permette di determinare una misura della variabilità della

(b) il punto di arrivo del nuotatore sulla riva opposta di quanto risulta spostato in direzione parallela alla corrente del fiume rispetto al punto

Ogni qualvolta abbiamo necessità di studiare un carattere di una popolazione ampia (per esempio l’altezza dei diciottenni italiani) ricorriamo a delle metodologie che ci consentano