0.1 Il teorema limite centrale

(1)

0.1 Il teorema limite centrale

Teorema 0.1. (Teorema limite centrale). Sia (X_i)_i∈N una successione di variabili aleatorie i.i.d. che ammettono momento secondo finito, con media µ e con varianza σ²non nulla. Allora, indicando con Z_nla variabile aleatoria

Zn:=

√n

σ (X_n− µ) , (0.1)

e con Z una variabile aleatoriaN(0, 1), si ha

n→+∞lim P(Z_n≤ x) = P(Z ≤ x) , ∀x ∈ R . (0.2) Di conseguenza, Zn→ Z in legge.

Dimostreremo il teorema sotto l’ipotesi aggiuntiva che le variabili aleatorie Xi

ammettano momento terzo finito. Iniziamo con alcuni lemmi ausiliari.

Lemma 0.2. Denotiamo conC_b³l’insieme delle funzioni da R in R le cui prime tre derivate esistono e sono funzioni continue e limitate su R. Sia (Zn)_n≥1una successione di variabili aleatorie, e Z una variabile aleatoria la cui funzione di ripartizione F_Z `e continua. Supponiamo che per ogni g ∈C_b³si abbia che

n→+∞lim E[g(Z_n)] = E[g(Z)]. (0.3) Allora

n→+∞lim F_Z_n(x) = F_Z(x) , ∀x ∈ R .

Dimostrazione. Fissiamo arbitrariamente x ∈ R. Per ogni k ≥ 1, `e possibile costruire due funzioni g_ke ˜g_kinC_b³tali che, come mostrato in Figura 0.1,

1(−∞,x−¹_k](z) ≤ ˜g_k(z) ≤ 1_(−∞,x](z) ≤ g_k(z) ≤ 1(−∞,x+¹_k](z) , ∀z ∈ R . Ad esempio, si pu`o scegliere g_k(z) = f_[x,x+1

k](z) e ˜g_k(z) = f_[x−1

k,x](z), dove

f_[a,b](z) :=











1 se z ≤ a

1 −^(z−a)³

(b−a)³

_(b−z)3

(b−a)³ se a ≤ z ≤ b

0 se z ≥ b

.

Per definizione di funzione di ripartizione, per ogni variabile aleatoria W F_W(x) = P(W ≤ x) = E(1{W ≤x}) = E(1(−∞,x](W )) .

(2)

!

"

0 1

x−1

k x x + 1

k

˜

gk gk

Figura 0.1 Una rappresentazione grafica delle funzioni gke ˜gk, che approssimano dall’alto e dal basso la funzione indicatrice 1_(−∞,x](·).

Di conseguenza, per monotonia del valor medio, F_W x−¹_k = Eh

1(−∞,x−¹_k](W )

i≤ E[ ˜g_k(W )] ≤ E1_(−∞,x](W )

= F_W(x) ≤ E[gk(W )] ≤ Eh

1(−∞,x+¹_k](W ) i

= F_W x+¹_k , in particolare

F_W x−¹_k ≤ E[ ˜gk(W )] ≤ F_W(x) ≤ E[gk(W )] ≤ F_W x+¹_k .

Usiamo ora queste disuguaglianze, per W = Z_ne W = Z, insieme con l’ipotesi (0.3) per g = g_k, ottenendo che per ogni k ∈ N fissato

lim sup

n→+∞

F_Z_n(x) ≤ lim

n→+∞E[g_k(Z_n)] = E[gk(Z)] ≤ F_Z x+¹_k , lim inf

n→+∞F_Z_n(x) ≥ lim

n→+∞E[ ˜g_k(Z_n)] = E[ ˜g_k(Z)] ≥ F_Z x−¹_k , quindi

F_Z x−¹_k ≤ lim inf

n→+∞F_Z_n(x) ≤ lim sup

n→+∞

F_Z_n(x) ≤ F_Z x+¹

k . (0.4) Essendo F_Z continua,

k→+∞lim F_Z x−¹_k = lim

k→+∞F_Z x+¹_k = F_Z(x) , pertanto prendendo il limite k → +∞ in (0.4) troviamo

lim inf

n→+∞F_Z_n(x) = lim sup

n→+∞

F_Z_n(x) = F_Z(x) , ∀x ∈ R ,

(3)

che conclude la dimostrazione. ut Veniamo dunque a un lemma cruciale.

Lemma 0.3. Siano V,Y, Z tre variabili aleatorie indipendenti, tali che Y, Z ammettono momento terzo finito, e inoltreE(Y ) = E(Z), E(Y²) = E(Z²). Allora per ogni g∈C_b³, ponendo C:= sup_x∈R|g⁰⁰⁰(x)|, vale la disuguaglianza

|E[g(V +Y )] − E[g(V + Z)]| ≤C

6E(|Y |³) + E(|Z|³) .

Dimostrazione. La formula di Taylor per funzioni di classeC³con resto integrale ci d`a, per ogni x, h ∈ R

g(x + h) = g(x) + g⁰(x)h +1

2g⁰⁰(x)h²+ R₂(x, h), dove

R₂(x, h) =1 2

Z x+h x

(x + h − t)²g⁰⁰⁰(t) dt . In particolare

|R₂(x, h)| ≤C

6|h|³. (0.5)

Si ricava facilmente che

g(x + h) − g(x + k) = g⁰(x)[h − k] +1

2g⁰⁰(x)[h²− k²] + R₂(x, h) − R₂(x, k). (0.6) Ponendo x = V, h = Y, k = Z e prendendo il valor medio, otteniamo

E[g(V +Y )] − E[g(V + Z)] = E[g⁰(V )(Y − Z)] + 1

2E[g⁰⁰(V )(Y²− Z²)]

+ E[R2(V,Y ) − R₂(V, Z)].

Essendo V,Y, Z indipendenti e E(Y ) = E(Z), E(Y²) = E(Z²), si ha che E[g⁰(V )(Y − Z)] = E[g⁰(V )] E[(Y − Z)] = 0 , E[g⁰⁰(V )(Y²− Z²)] = E[g⁰⁰(V )] E[(Y²− Z²)] = 0 ,

avendo usato il fatto che g⁰ e g⁰⁰ sono funzioni limitate, dunque g⁰(V ) e g⁰⁰(V ) ammettono valor medio finito. Ricordando (0.5), otteniamo

E[g(V +Y )]− E[g(V + Z)]

=

E[R₂(V,Y ) − R₂(V, Z)]

≤ E[|R₂(V,Y )|] + E[|R2(V, Z)|] ≤ C

6 E(|Y |³) + E(|Z|³) ,

ossia la tesi. ut

(4)

Il seguente risultato rappresenta il “cuore” della dimostrazione.

Proposizione 0.4. Siano Y₁,Y₂, . . . ,Y_n variabili aleatorie i.i.d. che ammettono momento terzo finito, tali che E(Y₁) = 0, E(Y₁²) = 1. Analogamente, siano W₁,W₂, . . . ,W_nvariabili aleatorie i.i.d. che ammettono momento terzo finito, tali cheE(W₁) = 0, E(W₁²) = 1. Allora, ponendo C := sup_x∈R|g⁰⁰⁰(x)|, per ogni g∈C_b³si ha

E

g Y₁+ · · · +Y_n

√n

− E

g W₁+ · · · +W_n

√n

≤C 6

E(|Y₁|³) + E(|W₁|³)

√n .

Dimostrazione. Sia Y := (Y₁,Y₂, . . . ,Y_n) e W := (W1,W₂, . . . ,W_n). Il risultato da dimostrare dipende solo dalle distribuzioni individuali di Y e W , ma non dalla distribuzione congiunta di (Y,W ). Non è perciò restrittivo assumere che Y e W siano indipendenti, cioè che tutte le variabili aleatorie Y₁,Y₂, . . . ,Y_n,W₁,W₂, . . . ,W_nsiano indipendenti. L’idea chiave consiste nello scrivere la seguente somma telescopica:

E

g Y₁+ · · · +Y_n

√n

− E

g W₁+ · · · +W_n

√n

=

n−1

∑

k=0

E

g Y₁+ · · · +Y_k+Y_k+1+W_k+2+ · · · +W_n

√n

− E

g Y₁+ · · · +Y_k+W_k+1+W_k+2+ · · · +W_n

√n

=

n−1 k=0

∑

E

g

V_k+Y_k+1

√n

− E

g

V_k+W_k+1

√n

,

dove abbiamo posto

V_k := Y₁+ · · · +Y_k+W_k+2+ · · · +W_n

√n .

Per il Lemma 0.3

E

g

V_k+Y_k+1

√n

− E

g

V_k+W_k+1

√n

≤C 6

E(|Y₁|³) + E(|W1|³) n√

n ,

pertanto

(5)

E

g Y₁+ · · · +Y_n

√n

− E

g W₁+ · · · +W_n

√n

≤

n−1

∑

k=0

E

g

V_k+Y_k+1

√n

− E

g

V_k+W_k+1

√n

≤ nC 6

E(|Y1|³) + E(|W1|³) n√

n = C

6

E(|Y1|³) + E(|W1|³)

√n ,

che `e quanto volevamo dimostrare. ut

Osservazione 0.5.Dalla proposizione precedente segue il fatto, assolutamente non banale e non intuitivo, che

n→+∞lim

E

g Y₁+ · · · +Y_n

√n

− E

g W₁+ · · · +W_n

√n

= 0 (0.7) indipendentementedalle distribuzioni delle Y_ie delle W_i(purch´e soddisfino le ipotesi

della Proposizione 0.4). ut

Possiamo finalmente completare la dimostrazione (con l’ipotesi aggiuntiva che le variabili X_iammettano momento terzo finito). Si noti che le variabili normali non sono ancora apparse nella dimostrazione. Le introduciamo ora: sia (W_i)_i∈Nuna successione di variabili aleatorie i.i.d. con W_i∼ N(0, 1). Dato che le variabili normali sono stabili per combinazioni lineari affini e somma di variabili aleatorie indipendenti, si

ha W₁+ · · · +W_n

√n ∼ N(0, 1), ∀n ∈ N , quindi, se Z ∼ N(0, 1) e g ∈C_b³,

E

g W₁+ · · · +W_n

√n

= E[g(Z)] . (0.8)

Usando le notazioni nell’enunciato del Teorema 0.1, poniamo ora Y_i := Xi− µ

σ , ∀i ∈ N . Osserviamo inoltre che, per verifica diretta,

Z_n =Y₁+ . . . +Y_n

√n , ∀n ∈ N , (0.9)

E immediato verificare che E(Y` _i) = 0, E(Y_i²) = 1, pertanto sono soddisfatte le ipotesi della Proposizione 0.4. Possiamo dunque applicare la relazione (0.7), che grazie a (0.8) e (0.9) si scrive come

n→+∞lim E [g (Z_n)] = E[g(Z)] , ∀g ∈Cb³.

(6)

Non resta che applicare il Lemma 0.2, e il Teorema 0.1 `e dimostrato.

Osservazione 0.6.Una lettura attenta della dimostrazione appena completata rivela che l’ipotesi che le variabili aleatorie X_i siano indipendenti è stata usata più volte, mentre quella che siano identicamente distribuite non è mai stata usata pienamente e può essere notevolmente indebolita: ad esempio, tutto funziona se

E(X_i) e E(X_i²) non dipendono da i ∈ N , sup

i∈N

E(|X_i|³) < +∞ .

Questa osservazione amplia il raggio di validit`a del teorema limite centrale e raffor- za dunque il valore di universalit`a della distribuzione normale, come distribuzione approssimata della somma di variabili aleatorie indipendenti, non necessariamente

con la stessa distribuzione. ut