• Non ci sono risultati.

Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un’automobile elettrica. La durata osservata xi

N/A
N/A
Protected

Academic year: 2021

Condividi "Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un’automobile elettrica. La durata osservata xi"

Copied!
16
0
0

Testo completo

(1)

Supponiamo che un fabbricante stia introducendo un nuovo tipo di batteria per un’automobile elettrica. La durata osservata x i delle i-esima batteria ` e la realizzazione (valore assunto) di una variabile aleatoria X i . Si pu` o assumere che le X i abbiano la stessa

distribuzione incognita. Per ottenere informazioni sulla

distribuzione si costruiscono e mettono in funzione un certo numero n di batterie. La durata di ciascuna batteria fornisce l’insieme di dati x 1 , x 2 , .., x n . La media campionaria della durata ` e

¯

x n = x 1 + .... + x n

n

Le lettere maiuscole X i indicano la variabili aleatorie (prima

dell’esperimento), quelle minuscole x i ne indicano le realizzazione

(il numero ottenuto dopo l’esperimento).

(2)

E’ naturale chiedersi alcune cose sulla media campionaria ¯ x n

• c’entra qualcosa con il valore atteso µ delle variabili X i ?

• posso dire che legge ha, ossia come ` e distribuita?

Alla prima domanda risponder` a la Legge dei Grandi Numeri. Se n ` e ”molto” grande, ¯ x n sar` a molto prossima a µ (vedremo poi quanto prossima).

Rispondere alla seconda domanda in generale non ` e semplice, ma

se n ` e ”abbastanza” grande con buona approssimazione ` e una

realizzazione di una variabile normale per il Teorema del Limite

Centrale (vedremo poi come determinarne i parametri).

(3)

Siano X 1 , X 2 ,...., X n ,... variabili aleatorie indipendenti e tutte con la stessa distribuzione , con valore atteso E(X 1 ) = ... = E(X n )=

µ e stessa varianza var (X i )=σ 2 , i = 1, 2..., n.

Sia Y n = X 1 + ... + X n , per la propriet` a della media:

E(Y n ) = E(X 1 ) + E(X 2 )... + E(X 2 )= nµ e per le propriet` a della varianza

var(Y n ) = var(X 1 ) + var(X 2 ) + ..var(X n )= nσ 2 Si ha inoltre che

X ¯ n = X 1 + ... + X n n = Y n

n per cui

E( ¯ X n ) = µ, var( ¯ X n ) = σ 2 /n

(4)

Esercizio. I risultati di un test sul livello di potassio nel sangue di un individuo variano sia a causa dell’imprecisione dello strumento di misurazione, sia perch` e il livello stesso varia nel tempo.

Sappiamo che per un certo individuo le letture successive del livello di potassio oscillano intorno a un valore atteso µ con deviazione standard σ = 0.3. Quattro letture specifiche generano i dati

3.6, 3.9, 3.4, 3.5

La media campionaria per il livello medio di potassio per questa persona ` e

3.6 + 3.9 + 3.4 + 3.5

4 = 3.6

mentre la deviazione standard della media campionaria ` e

√ σ

n = 0.3

2 = 0.15

(5)

LEGGE DEI GRANDI NUMERI

Si vede che la variabile X ¯ n , che ha sempre valore atteso µ, ha varianza inversamente proporzionale ad n (ossia uguale a σ/n).

Nel limite n → ∞ (ossia per n molto grande) la varianza diventa nulla, questo significa che la media campionaria diventa una variabile certa con valore µ.

Questo risultato ` e pi` u correttamente descritto dal seguente teorema:

Teorema. Si dimostra (ma non qui) che per n → ∞ e per ogni a strettamente positivo:

P | ¯ X n − µ| > a → 0

In altre parole la probabilit` a che ¯ X n sia diversa da µ diventa nulla

quando n diventa molto grande. Con un certo abuso di termini e di

notazione) possiamo dire che X ¯ n → µ quando n → ∞.

(6)

Se n ` e grande ma non infinito si avr` a : P 

| ¯ X n − µ| > a  ' 0.

Cosa significa?

L’asserzione vale per ogni a strettamnte positivo. Per fissare le idee immaginiamo che sia molto piccolo, ad esempio a = 0.01.

µ −a µ µ +a

La probabilit` a che la media campionaria osservata ¯ x n cada fuori dall’intervallo colorato in figura ` e trascurabile (' 0) se n

` e abbastanza grande.

La probabilit` a che la media campionaria osservata ¯ x n cada

dentro l’intervallo colorato in figura ` e ' 1 se n ` e abbastanza

grande.

(7)

MEDIA TEORICA ' MEDIA OSSERVATA

La legge dei grandi numeri dice che il valore osservato

¯

x n = (x 1 + .. + x n )/n della variabile aleatoria X ¯ n = (X 1 + .. + X n )/n

` e con grande probabilit` a vicino a µ se n ` e grande.

Quindi se non conosco µ, ne posso dare una stima con x ¯ n che ` e una realizzazione della statistica campionaria X ¯ n . Se n ` e grande, la probabilit` a che ¯ X n e µ siano ”molto diversi” ` e quasi zero.

Si noti che µ ` e la media teorica a priori di ciascuna osservazione (un parametro della distribuzione delle X i ) mentre

¯

x n = (x 1 + .. + x n )/n ` e una media a posteriori delle osservazioni.

(8)

IL TEOREMA DEL LIMITE CENTRALE

Siano X 1 , X 2 ,...., X n ,... variabili aleatorie indipendenti e tutte con la stessa distribuzione , con valore atteso E(X 1 ) = ... = E(X n )=

µ e stessa varianza var (X i )=σ 2 , i = 1, 2..., n.

Sia Y n = X 1 + ... + X n , abbiamo visto che:

E(Y n )= nµ var(Y n )= nσ 2

Teorema. Per le propriet` a del valore atteso e della varianza, la variabile

Z ¯ n = Y n − nµ σ √

n

ha media 0 e varianza 1. Inoltre si dimostra (ma non qui) che per n sufficientemente grande (nel limite n → ∞) ha

distribuzione normale.

(9)

In altre parole, nel limite n → ∞ Z ¯ n = Y n − nµ

σ √

n → N(0, 1) = Z

Quindi per n grande (ma non infinito) la probabilit` a P(¯ Z n < x) ` e circa uguale a P(Z < x) dove Z ` e una normale standard N(0, 1).

Se vogliamo calcolare probabilit` a relative a ¯ Z n possiamo utilizzare quelle relative a N(0,1) come approssimazione.

Tenendo presente che Y n /n = ¯ X n possiamo anche scrivere Z ¯ n = X ¯ n − µ

σ/ √

n → N(0, 1) = Z

Si ricordi ancora una volta che in questo contesto X ¯ n ` e la statistica

campionaria di cui la ¯ x n ` e una realizzazione (risultato di una

misurazione o esperimento). Anche Y ¯ n e Z n sono statistiche

campionarie.

(10)

DISTRIBUZIONE DELLE MEDIA CAMPIONARIA (VARIANZA NOTA)

Anche la somma di n variabili identicamente distribuite ` e approssimativamente normale, infatti:

Y n = σ √

n ¯ Z n + nµ ' σ √

n N(0, 1) + nµ = N(nµ, σ √ n)

La media campionaria ` e anch’essa approssimativamente normale:

X ¯ n = Y n

n ' σ

√ n N(0, 1) + µ 'N(µ, σ/ √ n).

Il valore atteso µ x ¯

n

della media camionaria ` e uguale a µ mentre la varianza σ x ¯

n

della media campionaria ` e uguale a σ/ √

n e quindi

decresce come l’inverso della radice quadrata della dimensione del

campione. Come abbiamo visto con la legge dei grandi numeri, per

un ipotetico campione infinito, la media campionaria coincide

identicamente con µ.

(11)

E IN PRATICA?

Il Teorema del limite centrale lascia aperta la questione di quanto il campione debba essere numeroso affinch` e l’approssimazione sia valida.

Se le variabili X i sono variabili gaussiane il problema non si pone perch´ e qualsiasi combinazione lineare di variabili gaussiane ` e anch’essa gaussiana. In tal caso, la distribuzione di X n ` e gaussiana per ogni n (quella di ¯ Z n ` e normale standard). Altrimenti si accetta la seguente regola pratica.

• Se la legge delle X 1 , . . . ,X n non ` e troppo asimmetrica, a livello empirico si ` e stabilito che n ≥ 30 va bene.

Per convincerci dell’asserzione consideriamo il caso in cui la

distribuzione delle X i ` e esponenziale (non importa qui sapere la

definizione). Confrontiamo i grafici delle densit` a delle somme

standardizzate di queste variabili indipendenti per n = 5, n = 10

n = 20 e n = 50 con il grafico di una N(0, 1).

(12)

In blu la N(0, 1), in azzurro la ¯ Z 5 , in magenta la ¯ Z 10 , in celeste la

¯

(13)

Esercizio. Il livello di colesterolo nel sangue di una popolazione di lavoratori ha una media 202 e una deviazione standard 14.

Viene selezionato un campione di 36 lavoratori, si approssimi la probabilit` a che la media campionaria dei loro livelli di

colesterolo sia compresa tra 198 e 206.

X ¯ 36 ha distribuzione approssimatemente normale con valore atteso µ = 202 e deviazione standard σ/ √

n = 14/ √

36 = 7/3, quindi Z ¯ 36 =

X ¯ 36 − 202

7/3 ' N(0, 1) = Z

P(198 < ¯ X 36 < 206) = P  198 − 202

7/3 < ¯ Z 36 < 206 − 202 7/3



' P(−1.714 < Z < 1.714) = φ(1.714) − φ(−1.714) = 0.913

dove φ ` e la solita funzione di distribuzione della normale standard.

(14)

RIASSUMENDO

Per un campione di numerosit` a n estratto da una popolazione con distribuzione di media µ e varianza σ si ha che

I µ ¯ x

n

= µ per ogni n,

I σ ¯ x

n

= σ/ √

n per ogni n,

I X ¯ n ` e distribuita normalmente per ogni n se le X i sono gaussiane,

I X ¯ n ` e distribuita quasi normalmente se n ` e grande (n > 30) anche se le X i non sono gaussiane.

I X ¯ n → µ quando n → ∞ (non realizzabile in pratica).

Si noti che la media campionaria ` e approssima il parametro µ ma la sua precisione (σ ¯ x

n

= σ/ √

n) viene definita in base ad una varianza

σ nota. Vedremo cosa fare quando la varianza ` e incognita.

(15)

STIME PUNTUALI Definizione 1

Se la stima di un parametro della distribuzione delle X i ` e data da un singolo numero ottenuto dalle misurazioni relative a un campione, tale valore ` e detto stima puntuale del parametro.

Esempio La media campionaria osservata ¯ x n ` e una stima del parametro µ della distribuzione delle variabili aleatorie X i . Il numero (stima) ¯ x n ` e una realizzazione dello stimatore X n .

La statistica ¯ X n ha valore atteso µ, quindi, in questo caso, il valore atteso dello stimatore ` e uguale al parametro che si vuole stimare.

Definizione 2

Uno stimatore con valore atteso uguale al parametro che si

vuole stimare si dice corretto (o non distorto).

(16)

La media campionaria X ¯ n = (X 1 + .. + X n )/n ` e quindi uno stimatore corretto di µ.

Definizione 3

Se due statistiche sono entrambe stimatori corretti di un parametro, la statistica con minore varianza ` e detta stimatore pi` u efficiente.

La stima ottenuta con la media campionaria ` e tanto pi` u accurata tanto pi` u il campione ` e numeroso. Infatti ¯ x n ` e un valore osservato di ¯ X n la cui varianza ` e σ/n. Pertanto se si considerano due campioni di taglia m e n con m > n si avra che ¯ X m ` e pi` u efficiente di ¯ X n nello stimare il parametro µ.

In seguito potremo confrontare con l’efficienza di altri stimatori

corretti diversi dalla media campionaria.

Riferimenti

Documenti correlati

385 da cui risulti che il concorrente (o componente di una eventuale A.T.I.) ha sempre fatto fronte ai propri impegni con regolarità e puntualità e che è idoneo a far fronte

(6) Provare che un grupppo di ordine 12 possiede sempre o un 2-Sylow normale o un 3-Sylow normale.. (7) Sia G un gruppo semplice di

Universit` a degli Studi di Roma “Tor Vergata”.. CdL in Matematica

[3] — Determinare il numero di classi di isomorfismo dei gruppi abeliani di

I lavoratori possono partecipare a questa azione solidale versando, VOLONTARIAMENTE, una somma pari ad UN’ORA DI LAVORO tramite delega alla propria azienda.. Anche le aziende

Nel aso

L'Atri Cup, così come definita dagli esperti del settore, è una mini olimpiade che da più di un quarto di secolo ospita in Atri (TE) circa 2000 atleti provenienti da diverse

Se teniamo conto che il cambiamento degli stili di vita dei cittadini è un elemento imprescindibile per promuovere le politiche di qualità dell’aria, questo risultato evidenzia