Variabili casuali a più dimensioni
Capita talvolta di osservare su una stessa unità statistica due o più caratteristiche.
per esempio (xi,yj)
Per rappresentare il numero delle volte in cui le diverse modalità si presentano si impiegano le tabelle a più entrate (tabella a doppia entrata nel caso di 2 caratteristiche )
Tabella a doppia entrata
Consideriamo un fenomeno casuale che si presenti con due caratteristiche X ed Y rispettivamente, ciascuno dei quali presenta valori discreti con n e m occorrenze
Possiamo dunque costruire una tabella dove per ogni caratteristica xi ed yj rilevata congiuntamente viene riportata la frequenza (assoluta) congiunta, cioè il numero di volte Nij con cui si sono presentate contemporaneamente le due caratteristiche.
Tabella a doppia entrata
y1 y2 yj ym
x1 N11 N12 N1j N1m
x2 N21 N22 N2j N2m
xi Ni1 Ni2 Nij Nim
xn Nn1 Nn2 Nnj Nnm
∑∑
= ==
ni m j
N
ijN
1 1
[
i j]
ij
ij
P X x Y y
N
f = N = = , =
y1 y2 yj ym
x1 f11 f12 f1j f1m
x2 f21 f22 f2j f2m
xi fi1 fi2 fij fim
xn ff1 ff2 ffj ffm
frequenza congiunta relativa
Variabile casuale a più dimensioni continua
Analogamente a quanto visto per una variabile casuale a più dimensioni discreta si può pensare ad una variabile casuale a più dimensioni continua.
Siano X e Y le due caratteristiche.
La funzione densità di probabilità e la funzione di probabilità cumulativa assumeranno dunque le forme di:
f
xy( ) x , y
( ) x y f ( ) u v dv du P [ X x Y y ]
F
xy, = ∫ ∫
−x∞ −y∞ xy, = ≤ , ≤
Distribuzioni marginali
A questo punto ha senso chiedersi come si distribuisce la caratteristica X indipendentemente dai valori assunti dalla caratteristica Y e viceversa.
Nel caso discreto si ha:
[
i]
m j
ij
i
f P X x
p = ∑ = =
=1
[
j]
n i
ij
j
f P Y y
q = ∑ = =
=1
Mentre nel caso continuo:
( ) ( )
+∫
∞( )
∞
−
=
= f x f x y dy
x
p
x, ( ) ( )
+∫
∞( )
∞
−
=
= f y f x y dx
y
q
y,
Media
Le distribuzioni marginali si presentano come delle variabili casuali ad una dimensione e dunque è possibile calcolare la media di X e di Y semplicemente con:
[ ] ∑
=
⋅
=
ni
i
i
p
x x
E
1
e nel caso continuo:
[ ] X = ∫
−+∞∞x ⋅ f ( ) x dx
E
x[ ] ∑
=
⋅
=
mj
j
j
q
y y
E
1
[ ] Y = ∫
−+∞∞y ⋅ f ( ) y dy
E
yviene chiamata media della variabile casuale doppia
( µ
x, µ
y) = ( E [ ] [ ] X , E Y )
Varianza e covarianza
Analogamente a quanto visto per la media è possibile calcolare la varianza delle distribuzioni marginali di X e di Y con:
( )
∑
=⋅
−
=
ni
i x
i
x
x p
1
2
µ
2σ
e nel caso continuo:
( ) ( )
∫
−+∞∞− ⋅
= x
xf
xx dx
x
2
µ
2σ
( )
∑
=⋅
−
=
mj
j y
j
y
y q
1
2
µ
2σ
( ) ( )
∫
−+∞∞− ⋅
= y
yf
yy dy
y
2
µ
2σ
Varianza e covarianza
Per la variabile casuale nel suo complesso è possibile calcolare la quantità
e nel caso continuo:
( ) ( ) ( )
∫ ∫
−+∞∞∞ +
∞
−
− ⋅ − ⋅
= x
xy
yf
xyx y dy dx
xy
µ µ ,
σ
( ) ( )
∑∑
= =⋅
−
⋅
−
=
ni m j
ij y j x i
xy
x y f
1 1
µ µ
σ
La quantità
2 2
y xy
xy x
C
xyσ σ
σ
= σ
viene chiamata(matrice di) covarianza
Distribuzioni condizionate
Analogamente a quanto visto per la definizione di probabilità condizionata, ha senso chiedersi come si distribuisce la caratteristica X fissato un ben determinato valore della caratteristica Y e viceversa.
Quindi si ha:
( ) f ( ) y y x x f
f
y y
x
) ,
= (
( ) f ( ) x y x y f
f
x x
y
) ,
= (
Regressione
La distribuzione di X condizionata ad Y è una variabile casuale con argomento x che dipende da un
“parametro” y.
Di questa variabile casuale posso calcolare la media che è data da:
[ ]
+∫
∞( )
∞
−
⋅
=
= x y x f x dx
y x
E ( )
x y[ ]
+∫
∞( )
∞
−
⋅
=
= y x y f y dy
x y
E ( )
yxE viceversa
Variabile casuale funzione di variabile casuale
Analogamente a quanto visto per le variabili casuali ad una dimensione è interessante considerare una variabile casuale Y (ad m dimensioni) funzione di una variabile casuale X (ad n dimensioni), cioè:
( )
( )
( )
=
=
=
n m
n n
m
g X X X
X X
X g
X X
X g X
g Y
Y Y Y
,.., ,
..
,.., ,
,.., ,
) .. (
2 1
2 1 2
2 1 1
2 1
Variabile casuale funzione di variabile casuale
In alcuni casi semplici è possibile calcolare la distribuzione di Y nota quella di X, tuttavia, sotto alcune condizioni particolari è possibile pervenire ad una stima di media e (matrice di ) covarianza di Y.
• Siano le relazioni Y=g(X) “morbide”, cioè si possano pensare come sviluppo in serie troncate al termine del primo ordine;
• Siano tutte le Xiben concentrate attorno alla media.
Media
Allora è possibile calcolare la media di Y nel seguente modo:
( )
( )
( )
=
≅
=
n n n
m m X X X
X X
X
X X
X
X
Y Y Y
Y
g g g
g
µ µ
µ
µ µ
µ
µ µ
µ
µ µ
µ µ µ
,.., ,
..
,.., ,
,.., ,
) .. (
2 1
2 1
2 1
2 1
2 1
Covarianza
E la matrice di covarianza può essere calcolare nel seguente modo:
T XX
YY
J C J
C ≅ ⋅ ⋅
“Legge di propagazione della Covarianza”
Jacobiano
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
=
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂ ∂
∂
∂
∂
∂
∂
=
n n m
n m
n m
n n n
n
n n n
n
x x x x g x
x x x g x
x x x g
x x x x g x
x x x g x
x x x g
x x x x g x
x x x g x
x x x g
J
,.., .. ,
,.., , ,..,
,
..
..
..
,.., .. ,
,.., , ,..,
,
,.., .. ,
,.., , ,..,
,
2 1 2
2 1 1
2 1
2 1 2 2
2 1 2 1
2 1 2
2 1 1 2
2 1 1 1
2 1 1
( )
i n j
j
i x
x x x J g
∂
= ∂
= 1, 2,..,