2. Linearit` a del valore atteso e sua applicazione agli stimatori

(1)

Legge Gamma e Legge Chi quadro

Sia G una variabile aleatoria di legge Gamma di parametri a e λ reali positivi, G ∼ Γ(a, λ), la cui funzione di densit`a `e:

f_G(x) = λ^a

Γ(a) e^−λx x^a−1 per x ≥ 0 dove Γ(·) `e la funzione Gamma completa: Γ(a) =R+∞

0 e^−x x^a−1dx che ha le propriet`a:

- Γ(a) = (a − 1)Γ(a − 1) e in particolare per gli interi Γ(n) = (n − 1)!

- Γ ₂ⁿ = ^(n−2)!!₂_(n−1)/2^√^π per n dispari e Γ ⁿ₂ = ₂^(n−2)!!_(n−2)/2 per n pari.

Sia Y la variabile aleatoria definita come:

Y = ϕ(G) = λG

Si ha: Y ∼ Γ(a, 1). Infatti, per la formula di cambiamento di variabile la densit`a di Y `e:

f_Y(y) = f_X ϕ⁻¹(y) d ϕ⁻¹(y)

dx = λ^a

Γ(a) e^−λ^y^λ y λ

a−1 1 λ = 1

Γ(a) e^−y y^a−1 Il parametro λ viene usualmente chiamato “parametro di scala”.

(fare attenzione che nei software statistici spesso il parametro di scala `e 1/λ).

Sia C_n una variabile aleatoria di legge Chi quadro a n gradi di libert`a C_n ∼ χ_[n]. Si ha:

C_n∼ Γ n 2,1

2

Quindi se M = ¹₂C_n, allora M ∼ Γ ⁿ₂, 1

Concludendo si ha che la variabile aleatoria G può essere approssimata utilizzando una variabile aleatoria di legge Chi quadro con un numero di gradi di libertà pari all’intero più vicino a 2a (si ha l’uguaglianza per a intero):

C2a = 2λG

Si possono perci`o utilizzare le tavole della legge Chi quadro per trovare i quantili della legge Gamma nel seguente modo:

α = IP (G > l_α) = IP (2λ G > 2λ l_α) = IP (C_2a > 2λ l_α) e quindi

l_α = 1 2λ c_α

(2)

Stimatori: approfondimenti

1. Stimatori preferibili e ammissibili

Siano U e V stimatori di un parametro θ.

1. U si dice preferibile a V se:

MSE_U(θ) ≤ MSE_V(θ) ∀θ

Se per almeno un θ vale la disuguaglianza stretta si dice che U `e strettamente preferibile a V .

2. Se non esistono stimatori preferibili a U allora U `e detto ammissibile.

ESEMPI

Uniforme Sia X ∼ U nif orm(0, θ) Consideriamo i due stimatori di θ:

T = max X_i R = 2X

A fianco sono riportate le due distribuzioni di T e R, nel caso in cui θ = 5.

Si ha (si veda la dimostrazione sul libro a pag. 171-3): ⁰ ⁵ ¹⁰

2

1

0

θ

M SET(θ) = 2 θ²

(n + 2)(n + 1) M SER(θ) = 1 3 nθ² Quindi T `e preferibile a R; infatti:

MSE_T(θ) ≤ MSE_R(θ) ∀θ Bernoulli Sia X ∼ Bernoulli(p)

Indichiamo con S_n la v.a. P X_i. Consideriamo i due stimatori di p : P = X =ˆ S_n

n e R = S_n+ a

n + a + b

R `e uno stimatore che dipende da due parametri reali positivi a e b che permettono di utilizzare informazioni a priori sul parametro p (R `e uno stimatore bayesiano). Si ha:

M SE_P_ˆ(p) = p(1 − p) n

M SE_R(p) = p² (a + b)²− n + p(n − 2a(a + b)) + a² (n + a + b)²

(3)

In entrambi i casi i MSE sono delle parabole con la concavit`a verso il basso. Si ha

M SE_R(0) = a²

(n + a + b)² e M SE_R(1) = b² (n + a + b)² A fianco sono riportati a linea continua il grafico di M SEPˆ(p) e a linea tratteggiata quelli di M SER(p) per diverse scelte dei parametri a e b.

Entrambi gli stimatori sono ammissibili. _0.0 _0.2 _0.4 _0.6 _0.8 _{1. 0}

0.025 0.020 0.015 0.010 0.005 0.000

2. Linearit` a del valore atteso e sua applicazione agli stimatori

Sia X una variabile aleatoria. Se a e b sono costanti reali, si ha:

E(aX + b) = aE(X) + b cio`e, se g `e una funzione lineare, si ha:

E(g(X)) = g(E(X)) . Applichiamo questo risultato agli stimatori.

Se T `e uno stimatore di una parametro θ con E(T ) = a + bθ, allora R = T − a

b `e stimatore non distorto di θ . ESEMPI

Normale Sia X ∼ N (µ, σ²) Lo stimatore T =

P

i(^Xi−X)²

n `e stimatore di σ² con E(T ) = ⁿ⁻¹_n σ²; quindi S² = _n−1ⁿ T

`

e stimatore non distorto di σ².

Uniforme Sia X ∼ U nif orm(0, θ)

Lo stimatore T = max{Xi} `e stimatore di θ con E(T ) = _n+1ⁿ θ; quindi R = ⁿ⁺¹_n T `e stimatore non distorto di θ.

3. Disuguaglianza di Jensen e sua applicazione agli stimatori

Sia X una variabile aleatoria.

1. Se g `e una funzione convessa si ha:

E(g(X)) ≥ g(E(X)) Caso notevole: E(X²) ≥ E(X)².

2. Se g `e una funzione concava si ha:

E(g(X)) ≤ g(E(X))

(4)

Applichiamo questo risultato agli stimatori.

ESEMPI

Esponenziale. Stimatore di λ. Sia X ∼ E xp(λ) Si ha: E(X) = E(X) = _λ¹. T = _X¹ `e stimatore di λ e si ha:

E

1 X

≥ 1

E(X)

ovvero E

1 X

≥ λ

Possiamo dire che ¹

X “sovrastima in media” λ.

Facendo i calcoli esatti si ottiene E _X¹ = _n−1ⁿ λ, che `e - appunto - maggiore di λ.

Normale. Stimatore di σ. Sia X ∼ N (µ, σ²)

S² `e stimatore non distorto di σ². Consideriamo S, S =√

S², stimatore di σ; si ha:

E(S) ≤

√

σ² ovvero E(S) ≤ σ Possiamo dire che S “sottostima in media” σ.

Facendo i calcoli esatti si ottiene E(S) = _(n−3)!!^(n−2)!!^√_n−1 σ, che `e - appunto - minore di σ.

3. Calcoli espliciti per i valori attesi di alcuni stimatori

ESEMPI

Esponenziale. Stimatore di λ. Sia X ∼ E xp(λ). Si ha: E(X) = ¹_λ. Indichiamo con Y la v.a. P Xi. Si ha: Y ∼ Γ(n, λ).

La v.a. T = ψ(Y ) = _{P X}ⁿ

i `e stimatore di λ. Il valore atteso di T `e:

E(T ) = Z

ψ(y)f_Y(y)dy = Z +∞

0

n y

λⁿ

(n − 1)! e^{−λ y} yⁿ⁻¹ dy

= n

n − 1 λ Z +∞

0

λⁿ⁻¹

(n − 2)! e^{−λ y} yⁿ⁻² dy = n n − 1 λ Quindi stimatore non distorto di λ `e:

T₁ = n P X_i

Normale. Stimatore di σ. Sia X ∼ N (µ, σ²) Stimatore non distorto di σ² `e S² =

P(^Xⁱ^−X)²

n−1 . Indichiamo con Y la v.a.

P(^Xi−X)²

σ² . Si ha: Y ∼ Γ ⁿ⁻¹₂ ,¹₂.

(5)

La v.a. S, S = √

S² `e stimatore di σ. Il valore atteso di S `e:

E(S) = E

r Y

n − 1 σ

!

= σ

√n − 1

Z +∞

0

y^1/2

1 2

(n−1)/2

Γ ⁿ⁻¹₂ e^−y/2y^{(n−1)/2−1} dy

= σ

√n − 1

Z +∞

0 1 2

n/2−1/2

Γ ⁿ₂ −¹₂ Γ ⁿ₂ Γ ⁿ₂ e

−y/2 y^n/2−1 dy = σ

r 2

n − 1

Γ ⁿ₂ Γ ⁿ⁻¹₂ Stimatore non distorto di σ `e quindi:

qX

Xi − X2 Γ ⁿ⁻¹₂

√2 Γ ⁿ₂

Possiamo ulteriormente sviluppare lo stimatore, utilizzando la seguente propriet`a della funzione gamma completa:

Γn 2

= (n − 2)!!

2^(n−1)/2

√π per n dispari e Γn 2

= (n − 2)!!

2^(n−2)/2 per n pari Per cui, a seconda se n `e pari o dispari, uno stimatore non distorto di σ `e:

q

P Xi− X2 (n−2)!!

(n−3)!!

p_π

2

per n dispari e q

P Xi− X2 (n−2)!!

(n−3)!!

q2 π

per n pari

(6)

Intervalli di confidenza: approfondimenti

1. Quantit` a pivotale

Sia X una variabile aleatoria con legge dipendente da un parametro θ (detto anche parametro naturale) su cui si vuol fare inferenza.

Una quantit`a pivotale `e una variabile aleatoria che sia funzione delle v.a. campionarie e del parametro θ e la cui legge sia nota e non dipenda dal parametro.

Nel caso di una v.a. X di legge Normale, X ∼ N (µ, σ²), quantit`a pivotali usate per gli intervalli di confidenza della media e della varianza sono:

X − µ σ/√

n

X − µ S/√

n

S²(n − 1) σ²

2. Intervalli di confidenza quando V(X) ` e funzione di E(X)

Sia X una variabile aleatoria tale che:

E(X) = φ(θ) e V(X) = h(φ(θ)) con φ funzione monotona ESEMPI

θ E(X)(= φ(θ)) V(X)(= h(φ(θ)))

Bernoulli p p p(1 − p)

Poisson λ λ λ

Geometrica p 1/p (1 − p)/p²

Esponenziale λ ¹_λ 1/λ²

A. Metodi approssimati.

Si basano sull’approssimazione della distribuzione di X con quella di una v.a. normale per grandi campioni :

X ∼ N

φ(θ),h(φ(θ)) n

ovvero X − φ(θ) qh(φ(θ))

n

∼ N (0, 1)

Da cui:

1 − α = P



−z_α< X − φ(θ) qh(φ(θ))

n

< z_α



 (1)

Si pu`o procedere in due modi: stimare la varianza di X con h(X) oppure risolvere in θ le disuguaglianze della formula (1).

A1. Stimando la varianza di X con h(X), la formula (1) diventa:

1 − α = P



−z_α < X − φ(θ) qh(X)

n

< z_α



= P



X − z_α s

h(X)

n < φ(θ) < X + z_α s

h(X) n





(7)

Se φ `e monotona crescente, l’intervallo di confidenza per θ a livello 1 − α `e:



φ⁻¹



X − zα

s h(X)

n



, φ⁻¹



X + zα

s h(X)

n









Se φ `e monotona decrescente, i limiti dell’intervallo di confidenza sono invertiti.

NOTA: Non si stima V(X) con lo stimatore S² in quanto in tal modo si avrebbero due stime diverse per un solo parametro: φ⁻¹(X) e uno funzione di S² (ad esempio, se h fosse invertibile, φ⁻¹(h⁻¹(S²)).

A2. Si risolvono in θ le disuguaglianze della formula (1). Questo metodo può comportare calcoli più complicati ma produce intervalli più precisi.

B. Metodi esatti.

Si usano quando si conosce una quantit`a pivotale che sia funzione diP X_i. ESEMPI

Esponenziale. Sia X ∼ E xp(λ)

A. Per grandi campioni, X ∼ N _λ¹,_λ¹2n quindi la quantit`a pivotale `e ^X−1^λ¹ λ√

n

A1. Si stima la standard deviation di X con ^√^X_n. Bisogna risolvere le disuguaglianze:

−z_α < X − ¹_λ X/√

n < z_α da cui

X

1 − z_α

√n

< 1 λ < X

1 + z_α

√n

e quindi un intervallo di confidenza a livello 1 − α per λ `e:

1 X

1 1 + ^√^z^α_n

! , 1

X

1 1 − ^√^z^α_n

!!

A2. Bisogna risolvere in λ le disuguaglianze:

−zα < X − ¹_λ

1 λ √

n

< zα

da cui

− z_α

√n < λX − 1 < z_α

√n

e quindi un intervallo di confidenza a livello 1 − α per λ `e:

1 X

1 − z_α

√n

, 1

X

1 + z_α

√n

Osserviamo che tale intervallo `e centrato in _X¹

(8)

Confrontiamo le ampiezze degli intervalli di confidenza trovati con i due metodi precedenti. Indichiamo con k la quantit`a ^√^z^α_n.

A1: ¹

X 1

1−k− _1+k¹ = ¹

X 2k

1−k² A2: ¹

X (1 + k − 1 + k) = ¹

X 2k

In entrambi i casi l’ampiezza dell’intervallo tende a 0 per n che tende all’infinito, ma con il metodo A2 l’ampiezza `e minore di quella trovata con il metodo A1.

B. Si ha: P X_i ∼ Γ(n, λ), quindi quantit`a pivotali sono:

2 λX

X_i ∼ χ²_[2n] oppure 2 λ n X ∼ χ²_[2n]

Tramite le tavole della distribuzione Chi quadro si possono trovare due valori c₁ e c2 tali che:

1 − α = P c1 < 2 λ n X < c₂ Quindi un intervallo di confidenza per λ a livello 1 − α `e:

1 X

c₁ 2n, 1

X c₂ 2n

.

Bernoulli. Sia X ∼ Bernoulli(p) Denotiamo come di consueto X con ˆP . A. Per grandi campioni la quantit`a pivotale `e q^{P −p}^ˆ

p(1−p) n

A1. Si stima la standard deviation di ˆP con

qP (1− ˆˆ P ) n . Bisogna risolvere le disuguaglianze:

−z_α < P − pˆ qP (1− ˆˆ P )

n

< z_α

e quindi un intervallo di confidenza a livello 1 − α per pa `e:

P −ˆ z_α

√n

qP (1 − ˆˆ P ), ˆP + z_α

√n

qP (1 − ˆˆ P )

In questo caso particolare in cui P Xi e P X_i² coincidono si potrebbe usare come stimatore di V( ˆP ) la v.a. S²_ˆ

P: S_P²_ˆ = S_X²

n = 1 n

P X_i²

n − 1 − n n − 1 X²

= X

n − 1 − X²

n − 1 = 1 n − 1

P (1 − ˆˆ P )

L’intervallo di confidenza risulterebbe diverso dal precedente solo per la presenza di n − 1 al posto di n.

A2. Bisogna risolvere in p le disuguaglianze:

−z_α< P − pˆ qp(1−p)

n

< z_α

(9)

da cui

−z_α

rp(1 − p)

n < ˆP − p < z_α

rp(1 − p) n ovvero

ˆP − p2

< z_α² p(1 − p) n Ponendo k = ^z_n²^α si ottiene la seguente disuguaglianza:

p²(1 + k) − p (k + 2 ˆP ) + ˆP² < 0 Le soluzioni dell’equazione corrispondente sono:

k + 2 ˆP ± q

k²+ 4k ˆP (1 − ˆP ) 2(1 + k)

e quindi un intervallo di confidenza a livello 1 − α per p `e:



 P +ˆ ^z_2n^α²

1 +^z_n²^α

−zα

q

zα

2n

2

+^{P (1− ˆ}^ˆ _n^{P )} 1 +^z_n²^α

,

P +ˆ ^z_2n^α² 1 +^z_n²^α

+ zα

q

zα

2n

2

+^{P (1− ˆ}^ˆ _n^{P )} 1 +^z_n²^α





Poisson. Sia X ∼ Poisson(λ).

A. Per grandi campioni la quantit`a pivotale `e ^X−λ√

λ n

A1. Si stima la standard deviation di X con qX

n. Un intervallo di confidenza a livello 1 − α per λ `e:



X − zα

s X

n, X + zα

s X

n





A2. Bisogna risolvere in λ le disuguaglianze:

−z_α < X − λ qλ

n

< z_α

da cui

λ²− λ

2X + z²_α n

+ X² < 0 Le soluzioni dell’equazione corrispondente sono:

X + z_α² 2n ±

s

z_α² 2n

2

+ X z_α² n e quindi un intervallo di confidenza a livello 1 − α per p `e:



X + z²_α 2n −

s

z²_α 2n

2

+ X z_α²

n, X + z_α² 2n +

s

z_α² 2n

2

+ X z²_α n





(10)

Verifica di ipotesi: approfondimenti

1. Il p-value

Il test si pu`o effettuare:

• Determinando preventivamente le regioni di accettazione di H₀e H₁ per lo stimatore considerato (sulla base del livello α) e osservando a quale delle due appartiene la stima x ottenuta nel campione

• Calcolando il p-value della stima x e confrontandolo con α. Che cos’`e il p-value?

E la probabilit`` a sotto H₀ di ottenere un valore campionario pi`u lontano dall’ipotesi principale e pi`u vicino all’alternativa di quello ottenuto effettivamente nel campione x

Sia la “forma” della regione di rifiuto di H₀ sia il p-value dipendono dal tipo di ipotesi alternativa si considera:

unilaterale destra, unilaterale sinistra, bilaterale.

I grafici si riferiscono a diversi test sul valore atteso di X.

H₀ : µ = µ₀

H₁ : µ > µ₀ oppure H₁ : µ < µ₀ oppure H₁ : µ 6= µ₀ Il p-value deve essere confrontato con il livello di significativit`a del test. Se `e minore di α l’ipotesi principale

`

e rifiutata.

m₀ p

p/2

m₀ x p

m₀ x m₀ x

p

p/2

a

0 0

H accettata

H rifiutata₁ H accettata₁ H rifiutata

m₀

Esempi

Consideriamo due test sul valore atteso di una variabile aleatoria X con distribuzione normale e varianza nota uguale a 4.

Si utilizza come statistica test la variabile aleatoria X.

Test unilaterale sinistro

H₀ : µ = 10 H₁ : µ < 10 La regione di rifiuto dell’ipotesi principale `e del tipo (−∞, c).

Sulla base di 36 osservazioni campionarie si ottiene un valore campionario x = 9.4 Il p-value `e:

p = P⁰ X < 9.4 = P X − 10

2/6 < 9.4 − 10 2/6

= P (Z < −1.8) = 0.03593 A livello di significativit`a del 5% si rifiuta l’ipotesi principale.

Test bilaterale

H0 : µ = 10 H1 : µ 6= 10

(11)

La regione di rifiuto dell’ipotesi principale `e del tipo (−∞, c₁) ∪ (c₂, ∞).

Sulla base di 36 osservazioni campionarie si ottiene un valore campionario x = 10.4.

La distanza, in valore assoluto, dall’ipotesi principale `e: δ = |10.4 − 10| = 0.4.

Il p-value `e:

p = P X − 10 < −0.4 + P X − 10 > 0.4 = P |X − 10| > 0.4

= 2 P X − 10

2/6 < −0.4 2/6

= 2 P (Z < −1.2) = 2/0.11507 = 0.23014 Alle soglie usuali di livello di significativit`a si accetta l’ipotesi principale.

2. La potenza di un test

La potenza di un test è una funzione del parametro P (θ): è la probabilità di accettare l’ipotesi alternativa H1.

Indichiamo con Θ₀ l’insieme a cui appartiene il parametro quando H₀ `e vera e con Θ₁ l’insieme a cui appartiene il parametro quando H₁ `e vera.

- Se θ ∈ Θ1, P (θ) è la probabilità di effettuare la scelta corretta: P (θ) = 1−β(θ) - Se θ ∈ Θ₀, P (θ) è la probabilità di effettuare la scelta sbagliata: P (θ) = α(θ) Il grafico a fianco rappresenta la potenza del test:

H₀ : µ ≤ 12 H₁ : µ > 12

dove µ `e il valore atteso di una v.a. con legge normale di varianza nota pari a 2.

E evidenziato il valore della potenza e dell’errore di se-` conda specie in corrispondenza del valore di µ uguale a 13.5.

15 14 13 12 11 1.0

0.5

0.0

ipotesi alternativa H1 1-β(13.5) β

α 1-α

La probabilità di accettare l’ipotesi alternativa, quando questa è vera, aumenta all’aumentare della numerosità campionaria.

Se nella popolazione `e vera l’ipotesi alternativa e se i valori del parametro sotto H₁ e sotto H₀ sono molto vicini, solo con grandi campioni si riesce ad avere una probabilit`a alta di effettuare la scelta corretta.

I grafici a fianco rappresentano la potenza del test:

H₀ : µ ≤ 12 H₁ : µ > 12 per due diverse numerosit`a campionarie.

Ad esempio, in corrispondenza di un valore atteso µ uguale a 13.5 si ha:

P_n₁(13.5) ' 0.70 e P_n₂(13.5) ' 0.95 con n₁ < n₂

15 14 13 12 11 1.0

0.5

0.0

ipotesi alternativa H1 1-β(13.5)

Confrontiamo ora la potenza di due test sul valore atteso di una v.a. con legge normale di varianza nota pari a 2, uno unilaterale e uno bilaterale.

(12)

I grafici a fianco rappresentano la potenza dei due test:

H₀ : µ ≤ 12 H₁ : µ > 12 a linea tratteggiata e

H₀ : µ ≤ 12 H₁ : µ 6= 12 a linea continua.

14 13 12 11 10 1.0 0.8 0.6 0.4 0.2 0.0

Osserviamo che il test unilaterale è più potente (ma non di molto) nell’insieme (12, +∞), mentre quello bilaterale è molto più potente nell’insieme (−∞, 12).

3. Determinazione della numerosit` a campionaria fissati α e β

Consideriamo un test sul valore atteso di una variabile con legge normale di varianza nota σ² del tipo:

H0 : µ = µ0 H1 : µ = µ1

Vogliamo determinare la numerosit`a campionaria che assicura determinate probabilit`a di errore di prima e seconda specie. Indicando con s la soglia della regione di rifiuto di H₀, se µ₁ > µ₀) si ha:

α = P X > s|µ = µ⁰ = P X − µ₀ σ/√

n > s − µ₀ σ/√

n

= P X − µ₀ σ/√

n > zα

β = P X < s|µ = µ¹ = P X − µ₁ σ/√

n < s − µ₁ σ/√

n

= P X − µ₁ σ/√

n < −zβ

Dalle due equazioni:

s − µ₀ σ/√

n = z_α e s − µ₁ σ/√

n = −z_β si ottiene:

n = (z_α+ z_β)² σ² (µ₀− µ₁)² e questo vale anche nel caso µ1 < µ0.

Osserviamo che la numerosit`a campionaria deve essere tanto maggiore quanto pi`u:

- `e minore la distanza fra i valori attesi sotto le due ipotesi;

- `e maggiore la varianza;

- sono minori i due errori (e quindi zα e zβ maggiori).

4. Test di uguaglianza delle medie di due v.a. Normali sulla stessa popolazione

Consideriamo le variabili casuali X₁ e X₂ definite su una stessa popolazione con distribuzione normale rispettivamente N (µ₁, σ₁) e N (µ₂, σ₂). Si vuole verificare se i valori attesi delle due variabili sono uguali.

(13)

Essendo X₁ e X₂ definite sulla stessa popolazione, si pu`o considerare la variabile aleatoria D, differenza fra X₁ e X₂ su ogni elemento della popolazione:

D(ω_i) = X₁(ω_i) − X₂(ω_i)

Tale variabile aleatoria ha distribuzione normale N (µ_D, σ_D); il valore atteso `e µ₁− µ₂ e la varianza `e σ₁²+ σ₂²− 2Cov(X₁, X₂), in genere sconosciuta.

Il test sull’uguaglianza dei valori attesi di X₁ e X₂ si riconduce al test sulla nullit`a del valore atteso di D, che viene effettuato tramite la quantit`a pivotale:

D − µ_D S_D/√

n

Esempio

L’effetto di due sonniferi A e B `e stato provato nei riguardi di uno stesso gruppo di 10 persone sofferenti d’insonnia. Nella tabella sono riportate, indicandole con xA e xB le variazioni nelle ore di sonno provocate in ciascun paziente dalla sommi- nistrazione del sonnifero A e del sonnifero B. Si assume che le variazioni di ore di sonno siano modellabili con variabili aleatorie normali. Si vuole verificare l’ipotesi che i due sonniferi abbiano uguale efficacia. Nell’ultima colonna `e riportata la differenza fra xA e xB.

paz. xA xB d 1 1.9 0.7 1.2 2 0.8 -1.6 2.4 3 1.1 -0.2 1.3 4 0.1 -1.2 1.3 5 -0.1 -0.1 0.0 6 4.4 3.4 1.0 7 5.5 3.7 1.8 8 1.6 0.8 0.8 9 4.6 0.0 4.6 10 3.4 2.0 1.4 La media campionaria di D è 1.58 e la varianza campionaria è 1.513, quindi la realiz- zazione campionaria della quantità pivotale sotto l’ipotesi di uguaglianza dell’effetto dei sonniferi vale: _0.389^1.58 = 4.06 per cui viene rifiutata l’ipotesi di uguaglianza dell’effetto.

5. Test di uguaglianza delle varianze di due v.a. Normali

Consideriamo le variabili casuali X₁ e X₂ indipendenti con distribuzione normale rispettivamente N (µ₁, σ₁) e N (µ₂, σ₂). Si vuole verificare, sulla base di informazioni tratte da due campioni di X₁ e X₂, se le varianze delle due variabili sono uguali. Pi`u precisamente le ipotesi del test sono:

H₀ : σ²₁ = σ₂² e H₁ : σ₁² 6= σ₂²

Indichiamo rispettivamente con n₁ e n₂ le numerosit`a dei due campioni di X₁ e X₂. Consideriamo le variabili casuali S₁² e S₂², varianze campionarie di X₁ e X₂. Si ha:

S₁²(n₁− 1)

σ₁² ∼ χ²_[n₁_−1] e S₂²(n₂− 1)

σ₂² ∼ χ²_[n₂_−1]

Inoltre tali variabili sono indipendenti, essendo X₁ e X₂ indipendenti e cos`ı S₁² e S₂². Ricordiamo che il rapporto di due variabili aleatorie indipendenti, ciascuna con legge chi-quadro divise per i loro gradi di libert`a `e una variabile aleatoria con legge F di Fisher.

Consideriamo la quantit`a pivotale:

S₁² S₂²

σ₂² σ₁²

(14)

Se H₀ `e vera, la statistica F :

F = S₁² S₂² ha legge F_[n₁−1,n2−1].

Il test `e bilaterale e la regione di rifiuto dell’ipotesi principale `e:

[0, c₁] ∪ [c₂, +∞) con α₁ = P(F < c1) , α₂ = P(F > c2) e α₁+ α₂ = α Per un test unilaterale del tipo:

H₀ : σ²₁ = σ₂² e H₁ : σ₁² > σ₂² allora la regione di rifiuto dell’ipotesi principale `e:

[c, +∞) con α = P(F > c) e simmetricamente per un test unilaterale sinistro.

Determinazione dei quantili “sinistri” di una v.a. di Fisher

Le tavole della legge di Fisher tipicamente forniscono i valori dei quantili “destri”, cio`e permettono di determinare, per α fissato (al 5% e all’1%), il valore di c tale che

α = P(F > c) Se F ∼ F_[n₁−1,n₂−1] allora:

α = P(F > c) = P 1 F < 1

c

con 1

F ∼ F_[n₂_−1,n₁_−1]

quindi sulle tavole si legge il valore 1/c e si calcola c.

6. Confronto fra intervalli di confidenza e test

Consideriamo una variabile aleatoria X di valore atteso µ.

Indichiamo con:

- kB = zα √σ

n semi ampiezza dell’intervallo di confidenza bilaterale - k_U = z_α^∗ ^√^σ_n

Si ha:

Tipo Intervallo di confidenza Regione di accettazione di H₀ bilaterale (x − k_B, x + k_B) (µ₀− k_B, µ₀+ k_B) unilaterale destro (−∞, x + kU) (−∞, µ0+ kU) unilaterale sinistro (x − k_U, +∞) (µ₀− k_U, +∞)

Osserviamo che l’intervallo di confidenza per µ dipende da x, mentre la regione di accettazione di H₀ dipende da µ₀.