• Non ci sono risultati.

Teorema del limite centrale TCL

N/A
N/A
Protected

Academic year: 2021

Condividi "Teorema del limite centrale TCL"

Copied!
21
0
0

Testo completo

(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)

Teorema del limite centrale TCL

Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni di distribuzioni possono essere qualsiasi purché abbiano valori attesi e varianze comparabili.

L’enunciato del teorema è il seguente:

Sia X una variabile casuale somma di variabili casuali xi

X = Σ ai xi

indipendenti ciascuna avente legge di distribuzione qualsiasi ma con valori attesi comparabili e varianze finite dello stesso ordine di grandezza.

la distribuzione di probabilità della variabile X tende, all’aumentare del numero delle variabili aleatorie xi , alla distribuzione normale con

valore atteso E(X) = Σai E(xi)

e varianza Var(X) = Σai2 Var(xi) .

(11)

Distribuzione di probabilità di xmedio = Σxi/N

Un‘applicazione notevole del TLC è la determinazione della distribuzione di probabilità della media campionaria

La media campionaria è una particolare combinazione lineare xmedio = Σxi/N

delle misure xi che sono variabili aleatorie ripetute e indipendenti proveniente da una stessa distribuzione che può essere qualsiasi (uniforme, binomiale..) di cui si suppone debba esistere valore atteso e varianza finiti (anche se non noti).

(12)

TCL: Valor medio e varianza della distribuzione delle medie

L’enunciato del TCL in questo caso si formula nel modo seguente:

Sia dato un campione di N variabili casuali statisticamente indipendenti tra loro e provenienti da una distribuzione di probabilità ignota qualsiasi della quale esistono sia il valore medio atteso  che la varianza σ2 ( anche se non note)

Sotto queste condizioni la distribuzione delle medie campionarie che si possono ottenere da un numero M di campioni della stessa v.a.

tende al crescere di N alla distribuzione normale con valor medio e varianza (e quindi deviazione standard) dati dalle relazioni seguenti Xmedio = σ2medie = σ2/N

σmedie = σ /N

(13)

Naturalmente, il termine “grande” è relativo. Tanto più la distribuzione della popolazione è diversa dalla normale, tanto maggiore deve essere la dimensione N del campione affinché sia sensato applicare il teorema del limite centrale.

La regola euristica è che un campione con N  30 sia sufficientemente grande da giustificare l’applicazione del teorema del limite centrale.

Un problema nasce quando la distribuzione della popolazione è discreta. In questo caso, l’applicazione del teorema porta ad approssimare la distribuzione discreta con una distribuzione continua. Questo problema si risolve introducendo quella che viene chiamata la “correzione di continuita”

(14)

Gli studenti hanno già verificato nei risultati della loro esperienza (lancio dei dadi) il significato della convergenza statistica della media campionaria al valore atteso della popolazione da cui il campione è estratto.

Nell’esempio qui riportato viene visualizzata la convergenza deli valor medio di campioni di dimensioni N crescenti al valore atteso

= 10.5 della distribuzione di probabilità relativa alla comparsa di una faccia di un dado equiprobabile di 20 facce.

(15)

Se non si conosce a priori la deviazione standard vera  si usa la sua miglior approssimazione x e la convergenza statistica stabilita dal teorema del limite centrale si pone come

Questo importantissimo risultato verrà ottenuto anche in seguito usando la propagazione degli errori (cap.8 del Cannelli)

Esso permette di calcolare deviazione standard delle medie dalla deviazione standard delle singole misure;

Si osservi che la deviazione standard delle medie è 1/N volte più piccolo della deviazione standard delle singole misure; questo implica che le medie campionarie si distribuiscono intorno alla media delle medie (che si suppone essere il valore vero ) con una curva di distribuzione di Gauss la cui dev. standard è più stretta di quella della distribuzione delle misure di un fattore 1/N

(16)
(17)

Convergenza delle distribuzioni Binomiale e di Poisson alla distribuzione di Gauss

Una maniera alternativa per giustificare la convergenza delle distribuzioni Binomiale e di Poisson alla distribuzione di Gauss

è basata sul Teorema del Limite Centrale.

Infatti la variabile k (Binomiale e di Poisson) che indica il numero di “successi” in n prove ,può essere vista come la somma di n variabili aleatorie, ciascuna delle quali assume un

valore 0 o 1 con probabilità p e q k = i =1,nxi xi = 0,1

Allora al crescere di n, la variabile aleatoria somma deve presentare una distribuzione di probabilità che tende a quella

normale.

(18)
(19)
(20)

Approssimazione gaussiana della distribuzione Binomiale e di Poisson

La distribuzione Binomiale Bn,p(k) = (nk) pk q(n-k) per p e q non troppo piccoli tende alla distribuzione di Gauss per valori di n → ∞ Bn,p(k) ≈ GX,σ(x) con X = np e deviazione standard σ = √npq

Se la Binomiale è simmetrica l’approssimazione è già soddisfacente per np  5,

se asimmetrica devono essere np  5 e nq  5

La distribuzione di Poisson Pμ(K) = e−μμK/K! tende alla distribuzione di Gauss per valori del valor medio μ→ ∞

Pμ(K) ≈ GX,σ(X) con X = μ e deviazione standard σ = √μ Si considera che per μ 9 l’approssimazione sia soddisfacente

(21)

Riferimenti

Documenti correlati

Si osservi che la deviazione standard delle medie è 1/N volte più piccolo della deviazione standard delle singole misure; questo implica che le medie campionarie si

Trovare media, mediana, moda, varianza e deviazione standard dei seguenti dati non ordinati e non raggruppati... Nel rilevare l’altezza in cm di un gruppo di reclute si ` e ottenuta

Una lettura attenta della dimostrazione appena completata rivela che l’ipotesi che le variabili aleatorie X i siano indipendenti `e stata usata pi`u volte, mentre quella che

9) Una certa sostanza radioattiva impiega 80.000 anni per decrescere del 75% della sua massa iniziale.. Dell'acqua si riversa nel lago in ragione di 100 litri al secondo e contiene

Il nuovo metodo di produzione viene implementato e vengono registrati i valori giornalieri di produzione per 20 giorni, trovando una media dei valori pari a 25.8, con

I pezzi prodotti, per poter essere assemblati correttamente, devono avere un certo diametro compreso tra 4.8 e 5.2 cm.. Supponiamo che il diametro dei pezzi prodotti, sempre

E’ un teorema di convergenza della binomiale alla gaussiana, che si a¢ anca al teorema degli eventi rari.. Qui, per vedere la convergenza, bisogna standardizzare la binomiale S n (Z n

ii) (3 pt) Si decide di adottare un test unilaterale destro al 90% per capire se il nuovo metodo di rifornimento aumenta la produzione, basato su un cam- pione di numerosità 20. Se