() ()= () () () []= () () n  1 Η F X X X X , , , , … … … … =…= , , , , X X X X F n − 1 Η S E = Η = SX Η X , … ⎛⎝⎜⎞⎠⎟ , , X X , … , X 1 1 1 ⎛⎝⎜⎞⎠⎟ ⎛⎝⎜⎞⎠⎟ ⎛⎝⎜⎞⎠⎟ ⎡⎣⎤⎦ ES X X X X , , , , … … … S , , , X X X = ~ ~ ~ N N N , , , () X − EX () () ~ n − 1 S S X

(1)

Statistica

µ Definizioni:

Ø

X

₁

, …, X

n variabili aleatorie indipendenti e tali che

F

_X

1

= … = F

_X_n si dicono campione.

Ø Siano

X

₁

,…, X

_n

~ N ( µ,σ

²

)

con

µ

e

σ

² incogniti. Per determinare i parametri incogniti si fa

“inferenza statistica”.

Ø Siano

X

₁

,…, X

n campioni e

ϑ

parametro incognito:

§ Una statistica è una funzione del campione

S = S X (

₁

,…, X

_n

)

^.

§ Uno stimatore di

ϑ

è una statistica utile per stimare

ϑ

.

µ Media Campionaria:

Ø È uno stimatore non distorto di

µ

^à

X

_n

= 1 n X

_k

k=1

∑

n ^.

Ø Sia

X

₁

,…, X

n campione con media

µ

, varianza

σ

².

§

E X ( )

n

⁼ ^µ

^.

§ Se

X

₁

, …, X

_n

~ N ( µ,σ

²

)

^à

^X

ⁿ

^~ ^⎛ _⎝⎜ ^{µ, σ} _n

²

^⎞ _⎠⎟

^.

§ Se

n  1

^à

X

n

≈ N µ, σ

²

n

⎛

⎝⎜

⎞

⎠⎟

^.

Ø

X

_n

~ N µ, σ

²

n

⎛

⎝⎜

⎞

⎠⎟

^.

µ Varianza campionaria:

Ø È uno stimatore non distorto di

σ

²à

S

_n²

= 1

n − 1 ( X

_k

− X

n

)

²

k=1

∑

n ^.

Ø La varianza campionaria si può calcolare anche così:

S

_n²

= 1

n − 1 X

²_i

− nX

²

i=1

∑

n

⎛

⎝⎜

⎞

⎠⎟

^. Ø

E S ⎡⎣ ⎤⎦ = σ

²_n ²^.

Ø Teorema:

§ Sia

X

₁

,…, X

_n

~ N ( µ,σ

²

)

campione:

•

X

n

, S

²_n sono indipendenti.

•

X

n

− µ

σ n ~ N 0,1 ( )

^.

•

(

n− 1

)

σ

² ^~

χ

²

(

n− 1

)

^.

µ Teoria della stima:

Ø Sia

X

₁

,…, X

n campione con

ϑ

parametro incognito.

§

Η

_n

= Η X (

₁

, X

₂

,…, X

_n

)

stimatore di

ϑ

^.

Η

n è uno stimatore corretto (non distorto) se

E [ ] Η

_n

⁼ ^ϑ

^.

(2)

§ Nota d’aiuto per esami: Se abbiamo

X

v.a. con

E X [ ] ⁼ ^µ

^,

^{Var X} ( ) ⁼ ^σ

². Possiamo determinare

E X ⎡⎣ ⎤⎦

² con la formula inversa della varianza, ossia

E X ⎡⎣ ⎤⎦ = Var X

²

( ) ^{+ E X} [ ]

²

⁼ ^σ

²

⁺ ^µ

²^.

§ Definiamo distorsione

= Bias Η ( )

_n

^: ^{= E Η} [ ]

n

⁻ ^ϑ

^.

• Se

Bias ( ) Η

_n

^{→ 0}

con

n → ∞

diciamo che

Η

n è asintoticamente corretto.

• Se

Bias ( ) Η

_n

^{= 0}

à corretto.

Ø

Η

n è consistente se ∀

ε

> 0 à

P ( Η

_n

− ϑ > ε ) ^{→ 0}

^.

Ø Errore quadratico medio (Mean Square Error): MSE

( )

Ηn ^{= E Η}^⎡_⎣

(

ⁿ⁻

^ϑ )

²^⎤_⎦^.

§ MSE

( )

Η ^{= Var H}

( )

^{+ Bias H}

( )

²^.

Ø

Η

n è consistente in media quadratica se

MSE ( ) Η

_n

^{→ 0}

con

n → ∞

. Ø

Η

n è corretto se e soltanto se

E [ ] Η

_n

⁼ ^ϑ

^.

Ø Confronto tra stimatori:

§ MSE H

( )

₁ ^{< MSE H}

( )

² ^⇔ ^{MSE H}

( )

¹

MSE H

( )

₂ ^{< 1} in questo caso è preferibile adottare

H

₁ come stimatore, nel caso contrario

H

₂.

µ Metodo della massima verosimiglianza:

Ø Strategia: lo stimatore di massima verosomiglianza

ϑ

è definito come il valore di

ϑ

che rende massima

f x (

₁

, x

₂

, …, x

_n

| ϑ )

, che è la funzione di massa o densità congiunta, quando i valori osservati sono

x

₁

, x

₂

,…, x

n. Nel calcolare il valore di

ϑ

che massimizza

f

è meglio utilizzare il

log f x _⎡⎣ (

₁

, x

₂

,…, x

_n

| ϑ ) _⎤⎦

, sapendo che entrambe le funzioni assumono il massimo in corrispondenza dello stesso valore di

ϑ

. Quindi: si scrive

log f x _⎡⎣ (

₁

, x

₂

,…, x

_n

| ϑ ) _⎤⎦

, si fa la derivata di tale funzione ed infine si prende il valore di

ϑ

in cui abbiamo il massimo.

Ø Ricorda che

f x (

₁

, x

₂

,…, x

n

) ⁼ ^f

^Xi

( ) x

_i

i=1

∏

n , siccome sono tutte variabili aleatorie indipendenti.

Mentre usando i logaritmi e le sue proprietà

log f x _⎡⎣ (

₁

, x

₂

, …, x

n

) _{⎤⎦ = log f} _⎡⎣

X_i

( ) x

_i

_⎤⎦

i=1

∑

n che è più

semplice da derivare.

µ Metodo dei momenti:

Ø Sia

X

₁

, X

₂

,…, X

_n

~ f x, ( ϑ

1

, ϑ

2

,…,ϑ

k

)

^.

Ø Definiamo:

§

m

_h

:= E X ⎡⎣ ⎤⎦

^h momento

h

-‐esimo.

§

m

_h

:= 1

h X

_i^h

i=1

∑

n momento campionario

h

-‐esimo. Sono tutti termini noti.

(3)

Ø Strategia: facciamo un sistema eguagliando i momenti

h

-‐esimi ai momenti campionari

h

-‐esimi. La soluzione del sistema sarà

ϑ = ϑ (

₁

,ϑ

₂

,…,ϑ

_k

)

^.

E X [ ]

₁

^{= m}

¹

( ^ϑ

¹

^,ϑ

²

^,…,ϑ

^k

) ^{= m}

¹

⁼ ¹ _n ^X

ⁱ

i=1

∑

n

E X ⎡⎣ ⎤⎦ = m

₁² ²

( ϑ

1

,ϑ

2

,…,ϑ

k

) ^{= m}

²

⁼ ¹

n X

_i²

i=1

∑

n

…

E X ⎡⎣ ⎤⎦ = m

₁^k ^k

( ϑ

1

,ϑ

2

,…,ϑ

k

) ^{= m}

^k

⁼ ¹

n X

_i^k

i=1

∑

n

⎧

⎨

⎪ ⎪

⎩

⎪ ⎪

µ Teorema stimatori:

Ø Ipotesi: Sia

X

₁

, X

₂

,…, X

_n

~ f x | ( ϑ )

con

ϑ

incognito.

ϑ

 = MLE

( ) ϑ

ossia

ϑ

è uno stimatore di massima verosimiglianza di

ϑ

(MLE = Maximum Likelyhood Estimator).

Ø Tesi:

1.

Bias ( ) ϑ 

n

^{→ 0}

con

n → +∞

.

2.

MSE ( ) ϑ 

n

^{→ 0}

(Errore quadratico medio).

3.

ϑ

 ≈ Nn

ϑ

, 1 nE ∂

∂

ϑ

^{log f x |}

( ϑ )

⎛⎝⎜ ⎞

⎠⎟

⎡ 2

⎣⎢ ⎤

⎦⎥

⎛

⎝

⎜⎜

⎜⎜⎜

⎞

⎠

⎟⎟

⎟⎟⎟

con

n  1

^.

4. Se

ϑ

* è uno stimatore di

ϑ

che soddisfa 1. 2. 3.

⇒

MSE ( ) ϑ * ^{≥ MSE} ( ) ^ϑ

^.

Ø Corollario:

§ Sia

τ = h ϑ ( )

con

h :  → 

^,

τ = h ϑ ( ) ^{= MSE} ^{( )} ^τ

^.

§

τ

 ≈ N h |

(

^=τ

ϑ )

^,

(

^{h ' |}

^ϑ )

nE ∂

∂

ϑ

^{log f x |}

( ϑ )

⎛⎝⎜ ⎞

⎠⎟

⎡ 2

⎣⎢ ⎤

⎦⎥

⎛

⎝

⎜⎜

⎜⎜⎜

⎞

⎠

⎟⎟

⎟⎟⎟

.

µ Intervalli di confidenza:

Ø Molte volte è utile sapere quanto la nostra stima sia esatta, per far ciò si utilizzano gli intervalli di confidenza.

Ipotesi

ϑ

Intervallo bilaterale Intervallo sinistro Intervallo destro

σ

² nota

µ

X ± z

_α

2

σ

n

−∞, X + z

_α

σ n

⎛ ⎝⎜ ⎞

⎠⎟

X − z

_α

σ n , ∞

⎛ ⎝⎜ ⎞

⎠⎟

σ

² non nota

µ

X ± t

_α

2,n−1

S

n

−∞, X + t

_α

2,n−1

S n

⎛

⎝⎜

⎞

⎠⎟

X − t

_α

2,n−1

S n , ∞

⎛

⎝⎜

⎞

⎠⎟

(4)

µ

non nota

σ

²

n − 1

( ) ^S

²

χ

²_α

2,n−1

, ( n − 1 ) ^S

²

χ

²

1− α2,n−1

⎛

⎝

⎜ ⎜

⎜

⎞

⎠

⎟ ⎟

⎟

0, ( n − 1 ) ^S

²

χ

1²−α,n−1

⎛

⎝⎜

⎞

⎠⎟

n − 1

( ) ^S

²

χ

²_α,n−1

,∞

⎛

⎝⎜

⎞

⎠⎟

µ Stime per la differenza tra le medie di due popolazioni normali:

Ø Siano

X

₁

, X

₂

,…, X

N e

Y

₁

,Y

₂

,…,Y

m due campioni estratti da popolazioni normali differenti con

µ

1

,σ

1² i parametri della prima e

µ

2

, σ

²2 i parametri della seconda.

Ø

X := 1

n X

₁

i=1

∑

n ^e

^{Y :=} _m ¹ ^Y

^j j=1

∑

m sono gli stimatori di massima verosomiglianza dei

µ

₁

, µ

₂

rispettivamente.

Ø

S

₁²

: = 1

n − 1 ( X

_i

− X )

i=1

∑

n ^e

^S

¹²

^:= _m ¹ _{− 1} ( ^Y

^j

^{− Y} )

j=1

∑

m sono gli stimatori di

σ

1²

,σ

²2 rispettivamente.

Ø Definiamo

N := n + m − 2

e

S

_p

:= ( n − 1 ) ^S

²1

+ m − 1 ( ) ^S

²2

N

che viene definita varianza campionaria “pooled”.

Ø Con

σ

1

,σ

2 note: l’intervallo bilaterale è

X − Y ± z

_α

2

σ

₁²

n + σ

²₂

m

mentre l’intervallo sinistro è

−∞, X − Y + z

_α

σ

₁²

n + σ

²₂

m

⎛

⎝ ⎜ ⎞

⎠ ⎟

^.

Ø Con

σ

₁

,σ

₂ NON note MA uguali: l’intervallo bilaterale è

X − Y ± t

_α

2, N

⋅ S

_p

1 n + 1

m

mentre l’intervallo sinistro è

−∞, X − Y + t

_α,N

⋅ S

_p

1 n + 1 m

⎛

⎝⎜

⎞

⎠⎟

^.

µ Intervalli di confidenza approssimati per la media di una distribuzione di Bernoulli:

Ø Poniamo

p  := X

n

stimatore del parametro di Bernoulli

p

con

X =

numero di valori

1

nel campione bernoulliano.

Ø L’intervallo di confidenza bilaterale è p ± z_α

2

 1− pp

( )

n , quello sinistro

−∞, p + z

_α

 1− p p ( )

n

⎛

⎝

⎜ ⎜

⎞

⎠

⎟ ⎟

, quello destro è

p  − z

_α

 1− p p ( )

n , ∞

⎛

⎝

⎜ ⎜

⎞

⎠

⎟ ⎟

^.

µ Verifica delle ipotesi:

Ø Un’ipotesi statistica è normalmente un’affermazione su uno o più parametri della distribuzione di popolazione.

Ø Facendo un test (o verifica) di una data ipotesi

H

(che solitamente viene chiamata ipotesi nulla)

(5)

§ Errore di seconda specie: quando accettiamo

H

₀ quando in realtà è falsa.

Ø Verifica di un ipotesi sulla media di una popolazione normale:

§ Con varianza nota:

• Vogliamo verificare l’ipotesi nulla

H

₀

: µ = µ

0. Siccome

X := 1 n X

_i

i=1

∑

n è lo stimatore puntuale naturale per

µ

, sembra ragionevole accettare

H

₀ quando

X

non è troppo lontano da

µ

0.

•

α

= P errore di I specie

( )

^{= P}µ0

(

X−

µ

₀ > c

)

è la probabilità di commettere un errore di prima specie, ossia rifiutiamo l’ipotesi (

µ = µ

₀) mentre in realtà è vera.

• Con opportuni passaggi otteniamo che si rifiuta

H

₀ se

X − µ

₀

σ n > z

_α

2

, si accetta

H

₀ se

X − µ

0

σ n ≤ z

_α

2

.

• Spesso non si fissa in anticipo il livello di significatività, ma si osservano i dati e si ricava il p-‐

dei-‐dati (p-‐value) corrispondente che fa da spartiacque tra l’accettare e il rifiutare. Per prima cosa si calcola

v = X − µ

0

σ n

, poi il valore ottenuto lo scriviamo

P Z

(

> v

)

= P z > v

( )

+ P z < −v

( )

^{= 1− Φ v}

( )

^{+ 1− Φ v}

( )

^{= 2 1− Φ v}

( ( ) )

. Se esso risulta molto maggiore di quanto siamo disposti ad accettare come probabilità di un errore di prima specie, accettiamo l’ipotesi; se invece la probabilità è molto piccola possiamo rifiutare il dato senza aver paura di aver commesso un errore di prima specie.

• Ora discutiamo la possibilità degli errori di seconda specie introducendo una nuova funzione

β

chiamata curva OC (curva operativa caratteristica, operating characteristic curve) che rappresenta appunto la probabilità di accettare

H

₀ quando la media reale è

µ

:

β µ ( ) ^{= P}

µ

0

− µ σ n − z

_α

2

≤ Z ≤ µ

0

− µ σ n + z

_α

2

⎛

⎝⎜

⎞

⎠⎟ = Φ µ

0

− µ σ n + z

_α

2

⎛

⎝⎜

⎞

⎠⎟ − Φ µ

0

− µ σ n − z

_α

2

⎛

⎝⎜

⎞

⎠⎟

^.

• Supponiamo di cercare il valore di

n

con il quale la probabilità di accettare

H

₀

: µ = µ

₀ quando il valore è

µ

1, sia approssimativamente pari ad un valore

β

fissato, la formula è:

n≈ z_α

2

+ z_β

⎛

⎝⎜

⎞

⎠⎟

σ µ

1−

µ

0

⎡

⎣

⎢⎢

⎢

⎤

⎦

⎥⎥

⎥

2

.

Statistica

µ Definizioni:

X

, …, X

F

= … = F

X

,…, X

~ N ( µ,σ

)

µ

σ

X

,…, X

ϑ

S = S X (

,…, X

)

ϑ

ϑ

µ Media Campionaria:

µ

X

= 1 n X

∑

X

,…, X

µ

σ

E X ( )

= µ

X

, …, X

~ N ( µ,σ

)

X

~ ⎛ ⎝⎜ µ, σ n

⎞ ⎠⎟

n  1

X

≈ N µ, σ

n

⎛

⎝⎜

⎞

⎠⎟

X

~ N µ, σ

n

⎛

⎝⎜

⎞

⎠⎟

µ Varianza campionaria:

σ

S

= 1

n − 1 ( X

− X

)

∑

S

= 1

n − 1 X

− nX

∑

⎛

⎝⎜

⎞

⎠⎟

E S ⎡⎣ ⎤⎦ = σ

X

,…, X

~ N ( µ,σ

)

X

, S

X

− µ

σ n ~ N 0,1 ( )

⁼ ^µ

^X

^~ ^⎛ _⎝⎜ ^{µ, σ} _n

^⎞ _⎠⎟

⁼ ^ϑ

E X [ ] ⁼ ^µ

^{Var X} ( ) ⁼ ^σ

( ) ^{+ E X} [ ]

⁼ ^σ

⁺ ^µ

^: ^{= E Η} [ ]

⁻ ^ϑ

^{→ 0}

^{= 0}

− ϑ > ε ) ^{→ 0}

^ϑ )

^{→ 0}

⁼ ^ϑ