V a ri a b ili c a s u a li
•Unavariabile casualeX e’una funzione definita sullo spazio campionario Ωche associa ad ogni evento E ⊂Ωun unico numero reale. •Esempi: somma dei punteggi nel lancio di due dadi, numero di pezzi difettosi in un lotto, variazione giornaliera nel rendimento di un titolo, numero di prodotti di un certo tipo venduti giornalmente in un particolare punto vendita9E
1E
2E 8E
7E4E
6E 5E
3E 1x
6x 4x5x 2x3x
X
Ω
•Una variabile casuale può essere classificata comediscretao continua. •Una variabile casualediscretapuò assumere un insieme discreto (finito o numerabile) di numeri reali. •Una variabile casualecontinuapuò assumere tutti i valori compresi in un intervallo reale.
ΩΩΩΩ d is cr e to V .C . d is cr e ta ΩΩΩΩ co n ti n u o V .C . d is cr e ta o c o nt inu a V a ri a b ili c a s u a li d is c re te
•UnavariabilecasualediscretaXècaratterizzatadallasuafunzione di probabilitàcheassocia ad ognuno dei valori xila corrispondente probabilitàP(X=xi). •La funzionedi probabilitàdeveverificarele due proprietà: •Unavariabilealeatoriadiscretapuòanchecaratterizzarsiattraverso la suafunzionedi ripartizionechefacorrispondereaivalorixle probabilitàcumulate P(X≤x): •La funzionedi ripartizioneverificale seguentiproprietà: F(x) ènon decrescente( )
iXPi∀≥,0( )
1=∑
iiXP( ) ( ) ( ) ∑
≤==≤= xwwXPxXPxF( ) ( )
1lim0lim== ∞→−∞→xFexF xxE s e m p io
•Corrispondenza tra eventi e valori della variabile casuale X={somma dei punteggi}, nella prova “lancio di due dadi” X23456789101112 P(x) F(x)1361 362 363 364 365 366 365 364 363 362 361 361 363 366 3610 3615 3621 3626 3630 3633 3635
00,2
0,4
0,6
0,8
1 12345678910111213x
F(x)
•Rappresentazione grafica della funzione di ripartizione per l’esempio del lancio di due dadi
V a ri a b ili c a s u a li c o n ti n u e
•Unavariabilecasualecontinua Xècaratterizzatadallasuafunzione di densità, f(x) tale chel’area sottesa alla funzione, in un intervallo, è pari alla probabilitàche Xassuma un valore in quell’intervallo: •La funzionedi densitàdeveverificarele proprietà: La probabilitàche la v.c.assuma un particolare valore è0. •Unav.a. continua puòanchecaratterizzarsiattraversolafunzionedi ripartizione: •La funzionedi ripartizioneverificale proprietàgiàvistein precedenza; inoltreper v.a. continue, essaèassolutamentecontinua.( ) ( ) ∫
=≤≤b adxxfbXaP
( )
0≥xf( )
1=∫
+∞ ∞−dxxf( ) ( ) ( ) ∫
∞−=≤=x dwwfxXPxFE s e m p io
•Si consideri la v.a. X che può assumere tutti i valori dell’intervallo reale [a ; b] in modo che tutti i sottointervalli di uguale ampiezza abbiano la stessa probabilità. •La funzione di densitàè •La funzione di ripartizione è( ) [ ]
∈ −= altrimenti
baxse abxf 0
;1
( ) [ ]
>∈ −−< = bxse
baxse ab
axaxse xF 1
;
0 Funzionedi densitàdi probabilitàFunzionedi ripartizione
V a lo re a tt e s o d i u n a v .a .
•Ilvalore attesodi una v.c.X, èdefinito come se la v.c. èdiscreta se la v.c. ècontinua •Il valoreattesodi unafunzioneY = g(x),dellav.a. X, può esserecalcolatocome: se la v.c. èdiscreta se la v.c. ècontinua( ) ( ) ∫
+∞ ∞−=dxxxfXE
( ) ( ) ∑
= iiixPxXE( ) ( ) ( ) ∫
+∞ ∞−=dxxfxgYE( ) ( ) ( ) ∑
= iiixPxgYEE s e m p io v .a . d is c re ta
•X={somma dei punteggi}, nella prova “lancio di due dadi” X23456789101112 P(x) F(x)1361 362 363 364 365 366 365 364 363 362 361 361 363 366 3610 3615 3621 3626 3630 3633 3635
( )
7 361 12 362 11 363 10364 9 36
5 8 36
6 7 36
5 6 36
4 5 36
3 4 36
2 3 36
1 2 =+++
+++++++=XE
E s e m p io v .a . c o n ti n u a
•Si consideri la v.a. X definita nell’intervallo [a ; b] vista prima( ) ( ) ( ) ( ) ( )
222222 ba ab
ab ab
x xfdx ab
x dxxxfXE
b a
b a
b a+ = −− = −= −==
∫ ∫ V a ri a n z a d i u n a v .a .
•Lavarianzadi una v.c.X, èdefinita come •A seconda del tipo di v.a., la precedente definizione diventa se la v.c. èdiscreta se la v.c. ècontinua •La varianzapuòessere, in modoequivalente, definitacome: •Si definiscedeviazionestandard di X, la radicequadratadella suavarianza( ) ( ) ( ) ( ) ∫
+∞ ∞−−=dxxfXExXV2
( ) ( ) ( ) ( ) ∑
−= iiixPXExXV2( ) ( ) [ ] { }
2 XEXEXV−=( ) ( ) ( ) [ ]
22 XEXEXV−=( ) ( )
XVXSD=M e d ia e V a ri a n z a d i u n a c o m b in a z io n e lin e a re
•Sia Y una combinazione lineare di una v.c.X, ossia Y = a+bX, dove ae bsono delle costanti. Si possono allora dimostrare le seguenti proprietà: •Ponendo a = -E(X)e b = 1/SD(X),si ottiene una variabile aleatoria Y standardizzata, ossia, con valore atteso 0 e deviazione standard 1.( ) ( ) ( )
XVbbXaVYV2 =+=( ) ( ) ( )
XbEabXaEYE+=+=( ) ( )
XSDXEX Y− =
( )
1=YV( )
0=YEM o d e lli d i v .a . d is c re te : v .a . d i B e rn o u lli
•Una v.a. Bernoulliana, indicata come X∼Bernoulli(π)assume solo due valori, 1 o 0, rispettivamente con probabilitàπ e 1-π. •La funzione di probabilitàdi una v.a. di Bernoulliè: •Media e varianza di una Bernoulliana sono rispettivamente: •Tutte le prove che producono solo due possibili risultati generano v.c.di Bernoulli: il lancio di una moneta, il superamento o meno di un certo livello di inflazione, l’aumento o meno della quotazione di un titolo, l’acquisto o meno di un certo prodotto, la difettositào l’integritàdi un certo pezzo…( ) ( )
1,011 =−==− xperxXPxx ππ( ) ( ) ( )
πππ−==1XVeXEM o d e lli d i v .a . d is c re te : v .a . B in o m ia le
•La v.a. Binomialeèuna distribuzione discretache si utilizza quando si èin presenza di n prove indipendenti(es. n estrazioni con ripetizione o nestrazioni da una popolazione infinita), ciascuna prova ha solo due esitipossibili, indicati come successo e insuccesso (es. difettoso/non difettoso, aumento/decremento, acquisto/mancato acquisto), e la probabilitàπ(es. tasso di difettosità) di osservare un successo in una singola prova rimane costanteper tutte le prove. •Una v.a. Binomiale si indica come X∼Binomiale(π;n)e la sua funzione di probabilitàè:( ) ( )
10,,1,01≤≤=−
==− πππenxper x
n xXPxnx K •Una v.a. Binomiale può essere ottenuta considerando la somma di v.c.di Bernoulli, indipendenti e identicamente distribuite: dove Xi∼Bernoulli(π), indipendentemente per ogni i. •Media e varianza di una Binomiale sono rispettivamente: •Una v.a. Binomiale ècaratterizzata dalle seguenti proprietà: Il valore atteso e la varianza crescono al crescere di n; Per π=0,5 la distribuzione èsimmetrica rispetto al valor medio (n/2); Per n→∞la distribuzione tende ad essere simmetrica rispetto al valor medio.
∑
==+++=n iinXXXXX 121K
( ) ( ) ( )
πππ−==1nXVenXE 0,0000,050
0,100
0,150
0,200
0,250
0,300 01234567891011121314151617181920
Binomiale(20;0,5)
Binomiale(7;0,5)
E s e m p i d i B in o m ia le
E s e m p io
•Un’industria che produce tappi di sughero sa che il tasso di difettositàdei macchinari a disposizione èdel 5%. Per controllare giornalmente che tale tasso rimanga invariato, il responsabile del controllo di qualitàogni giorno estrae 20 tappi a caso tra quelli prodotti e osserva quanti di essi risultano difettosi. Èpiùprobabile che si trovi ad osservare 1 solo tappo difettoso o nessun tappo difettoso? E qual èinvece la probabilitàdi osservarne 2?•Indichiamo con: πla probabilitàdi produrre un tappo difettoso; nil numero di tappi estratti; Xil numero di tappi difettosi tra quelli estratti. •Le informazioni a disposizione sono: π= 0,05; n= 20; •Vogliamo calcolare P(X= 0), P(X= 1) e infine P(X= 2).
( ) ( ) ( ) ( )
020000!20! (0)10,0510,050,3585 0!0!0!200!nn PXpp n
−− ==−=−= −−
( ) ( ) ( ) ( )
120111!20! (1)10,0510,050,3774 1!1!1!201!nn PXpp n
−− ==−=−= −−
( ) ( ) ( ) ( )
220222!20! (2)10,0510,050,1887 2!2!2!202!nn PXpp n
−− ==−=−= −− 051015200
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4 X
P(X )
Distribuzione di probabilità della variabile "n° di tappi difettosi osservati"
M o d e lli d i v .a . d is c re te : v .a . d i P o is s o n
•Una v.a. di Poisson, indicata come X∼Poisson(λ)può assumere qualsiasi valore intero x ≥0. •La funzione di probabilitàdi una v.a. di Poissonè: •Mediae varianzadi una Poissonsono rispettivamente: •La distribuzione di Poissonèadeguata per approssimare v.a. che rappresentano conteggi: il numero di persone che arrivano ad uno sportello in un certo intervallo di tempo, il numero di errori di battitura in una pagina, il numero di incidenti in un tratto stradale, il numero di rimborsi chiesti in un giorno ad una compagnia assicurativa…( )
∞≤≤===− λλλ 0,2,1,0 !Kx x
e xXP
x
( ) ( )
λλ==XVeXE•In generale, una v.a. discreta che rappresenta il numero di volte che si realizza un certo evento aleatorio in un dato intervallo (di tempo o di spazio) può essere approssimata bene da una Poissonese, suddividendo l’intervallo in tanti sottointervalli, valgono le seguenti condizioni La probabilitàdi osservare esattamente un evento nel sottointervallo ècostante La probabilitàdi osservare piùdi un evento nel sottointervallo èpari a zero Il verificarsi di un evento in un sottointervallo èindipendente dal verificarsi di un evento in un altro sottointervallo •Una v.a. di Poissonècaratterizzata dalle seguenti proprietà: Se Xi∼Poisson(λi) indipendentemente per ogni i = 1,…,n, allora X ∼Poisson(λ1+λ2+…+λn), dove X = X1+X2+…+Xn. La v.a. Binomiale al crescere di ne per πpiccolo, tende ad una v.a. di Poissoncon parametroλ= nπ.
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40 1234567891011121314151617
Poisson(1) Poisson(3) Poisson(7)
E s e m p i d i v .a . d i P o is s o n
•Una v.a. Normale(o Gaussiana) X, indicata come X∼N(µ;σ2), può assumere valori su tutto l’asse reale. •La funzione di densitàè •Mediae varianzadi una normale sono rispettivamente: •La Normale gode delle seguenti proprietà: Ogni trasformazione lineare di una v.a. Normale èancora una v.a. Normale La somma di v.c.Normali indipendenti èancora una v.c.Normale con media e varianza pari, rispettivamente, alla somma delle medie edelle varianze delle v.c.Normali.( ) ( )
0 21 exp 2
12 2
2 ≥∞≤≤∞− − −=σµ σµ πσ
x xf
M o d e lli d i v .a . c o n ti n u e : v .a . N o rm a le ( ) ( )
2 σµ==XVeXE 0,000,15
0,30
0,45
0,60
0,75 -4,5-3,0-1,50,01,53,04,5
N(0;1)
σ2=0,5 σ2 =2 σ2=3 σ2=4
E s e m p i d i v .a . N o rm a li
0,000,15
0,30
0,45 -1,50,01,53,04,56,07,5
µ=0µ=1µ=2µ=3µ=4µ=5
•Se la v.a. Xha una distribuzione normale con parametri µeσ2, allora Z= (X-µ)/σèancora una v.a. Normale con media 0 e varianza 1. La v.a. Zènota comeNormale standardizzatae si indica come Z∼N(0;1). •La funzione di densitàdella Normale standard è
( )
−
=2 2
1 exp 2
1 zzf π 0,00
0,15
0,30 -1,960,001,96
0,95
•La funzione di ripartizionedi una v.a. Normale standard viene in genere indicata come Φ(•), ossia •I valori della funzione di ripartizione di una Normale standard sono tabulati e questo semplifica i calcoli delle aree sottese dalla funzione di densità. •Esempio: Calcolo dell’area sottesa nell’intervallo [-2,2]
( ) ( )
zzZPzFΦ=≤=)(( ) ( ) ( ) ( ) [ ] ( )
9540197702122 212 22,,=−⋅=−Φ=Φ−−Φ=−Φ−Φ ESEMPIO Un’industria che produce componenti sta valutando la possibilitàdi fornire una grossa ditta. I macchinari sono settati per produrre componenti con un diametro di 10mm, tuttavia non tutti i pezzi prodotti hanno esattamente la stessa dimensione. Ènoto invece che il diametro dei pezzi prodotti segue una distribuzione normale con media 10mm e deviazione standard 0,5mm. La ditta che dovrebbe acquistare questi pezzi può utilizzare esclusivamente componenti con un diametro compreso tra 9 e 11 mm. Si vuole stabilire se almeno il 90% della produzione di componenti incontri le necessitàdella ditta.567891011121314150
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8Densità della variabile "diametro" -5-4-3-2-10123450
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8Densità standardizzata Indichiamo con X la variabile “diametro”:
( )
911 911X PXPµµµ σσσ−−− ≤≤=≤≤= ( )
9545,022 5,01011 5,0109 =≤≤−=
− ≤≤− =ZPZP
ESEMPIO Un punto vendita di una catena di fast food ha cominciato ad offrire un servizio di consegna pasti a domicilio. Per battere la concorrenza il proprietario ha deciso di offrire il pasto gratis ai clienti che ricevono la consegna con un ritardo eccessivo. Dato l’attuale margine di profitto, il proprietario conclude che è possibile offrire un numero di pasti gratis pari al 2,5% delle ordinazioni. Sapendo che il tempo di consegna si distribuisce approssimativamente in maniera normale con media pari a 20 min. e deviazione standard pari a 5 min., il proprietario vuole determinare un livello soglia per il tempo d’attesa, oltre il quale fornire il pasto gratis, in modo tale che il numero di pasti gratis offerti non superi il 2,5% delle ordinazioni. Indichiamo con X la variabile “tempo di attesa”e con x la soglia da determinare:
( )
0,025Xxx PXxPPZµµµ σσσ−−− =≥=≥=≥ Dalle tavole della distribuzione normale otteniamo:( )
0,0251,96PZ=≥ Quindi1,96xµ σ− =e1,961,9652029,8xσµ=+=⋅+=0510152025x=?35400
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.1Densità della variabile "tempo di consegna" 0,025 -5 -3 -1 0 1 1,963 5 0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Densità standardizzata 0,025
Perchéla distribuzione normale ècosìimportante? Molti fenomeni tendono naturalmente ad avere una distribuzione campanulare ben approssimabile con una distribuzione normale. Ossia èun modello teorico che si adatta bene a molti dati empirici. Èfacilmente trattabile da un punto di vista matematico. In molte applicazioni, conclusioni basate sull’assunzione di normalitàdei dati non sono seriamente affette da scostamenti dalla normalitàcontenuti. Ma soprattutto Deve la sua importanza all’esistenza del teorema del limite centrale.
Banconota da 10 Marchi con l’immagine di Carl Friedrich Gauss e la funzione di densitànormale.
Il teorema del limite centrale Siano X1,…, Xn, nvariabili casuali indipendenti e identicamente distribuite (i.i.d.) con media E(Xi) =µe varianza V(Xi) = σ2entrambefinite. Sia Sn= X1+…+Xn, la lorosommaavente media E(Sn) = nµe varianzaV(Sn) = nσ2. Allora per n →∞, Sntende a distribuirsi normalmente. Un enunciato equivalente del teorema stabilisce che, posto e restando valide le condizioni enunciate sopra, si ha che la variabile converge, per n →∞, ad una Normale standard. ESEMPIO Siano X1,…, Xn, nvariabili bernoulliane indipendenti con identica probabilitàdi successo p(quindi E(X1) = pe V(X1) = p(1-p)). Abbiamo visto che la loro somma Sn= X1+…+Xnsi distribuisce come una variabile binomiale con media E(Sn) = npe varianzaV(Sn) = np(1-p). In virtùdel teorema del limite centrale, per n →∞, Sntende a distribuirsi normalmente.
∑
==n iinX nX 1
1
( )
σµnX Zn n− =v
La v.c. Binomiale può essere vista come somma di n variabili casuali Bernoulliane iid, quindi pern abbastanza grande la sua distribuzione è molto simile ad una
( ) ( )
πππ−1 ;nnN Se consideriamo una successione di Poisson( )
11λPoisson~X,( )
212λλ+Poisson~X,( )
3213λλλ++Poisson~X, ....con 0>iλ, seλλλλ====...321 si ha che la distribuzione di nX può essere approssimata, per n grande, da una( )
λλn ;nN. La v. c. Chi-quadratonX si può ottenere come somma di n variabili casuali Normali standardizzateindipendential quadrato, quindi, pern abbastanza grande, la sua distribuzione è molto simile ad una( )
nnN2 ;.A p p lic a z io n i d e l te o re m a
•Una v.a. Chi-quadratoX, indicata come X∼χ2(g),può assumere valori nell’intervallo [0;∞]. •La funzione di densitàè •Mediae varianzadi una Chi-quadratosono rispettivamente: •Una v.a. χ2(g)si può ottenere come somma dei quadrati di g v.a. Normali standardizzate indipendenti, ossiaM o d e lli d i v .a . c o n ti n u e : C h i- q u a d ra to ( ) ( )
gXVegXE2==()01 2
≥
Γ=−− xperxxf
xg g g
22 2e 2
1
( )
22 22 12 gZZZg+++=KχE s e m p i d i v .a . C h i- q u a d ra to
0,000,05
0,10
0,15 0,07,515,022,530,0
()42χ ()82χ ()122 χ ()202χ All’aumentare di g la distribuzione tende ad una N(g;2g)
•Una v.a. t di StudentT, indicata come T∼Student(g),può assumere valori nell’intervallo [-∞;∞]. •Una v.a. T∼Student(g)si può ottenere come rapporto tra una v.a. Normale standardizzata e la radice quadrata di una v.a. Chi-quadratodivisa per i suoi gradi di libertà, ossia dove Z∼N(0,1)eY∼χ2(g).
M o d e lli d i v .a . c o n ti n u e : t d i S tu d e n t
gYZ T=•Una v.a. F di FisherX, indicata come X∼Fisher(ν1,ν2),può assumere valori nell’intervallo [0;∞]. •Una v.a. X∼Fisher(ν1,ν2)si può ottenere come rapporto tra due v.a. Chi-quadratodivise per i loro gradi di libertà, ossia dove Y1∼χ2(ν1)eY2∼χ2(ν2).
M o d e lli d i v .a . c o n ti n u e : F d i F is h e r
2211 νν Y
Y X= •Unavariabile aleatoria doppia(X,Y)èuna funzione definita sullo spazio campionario Ω, che associa a ogni risultato ωiuna coppia di numeri reali (x,y). •Una v.a. doppia ècompletamente definita dalla suafunzione di probabilitàcongiuntao dalla suafunzione di densità congiunta, a seconda che sia discreta o continua. •In caso di indipendenza si deve avere: Caso discreto Caso continuo
C e n n i s u lle v .a . d o p p ie ( ) ( ) ( )yPxPyxP=, ( ) ( ) ( )
yfxfyxf=,
•Il valore atteso di una combinazione lineare di pv.a. èdato da mentre la varianza è dove èla covarianza tra Xie Xj.
M e d ia e v a ri a n z a d i c o m b in a z io n i lin e a ri d i v .a .
ppXaXaXaX+++=K2211( ) ( ) ( ) ( )
ppXEaXEaXEaXE+++=K2211( ) ( ) ( ) ∑ ∑ ∑
=+==+=p i
p ijjiji
p iiiXXCovaaXVaXV 111,2