Variabili casuali a più dimensioni

(1)

Variabili casuali a più dimensioni

Capita talvolta di osservare su una stessa unità statistica due o più caratteristiche.

per esempio (xi,yj)

Per rappresentare il numero delle volte in cui le diverse modalità si presentano si impiegano le tabelle a più entrate (tabella a doppia entrata nel caso di 2 caratteristiche )

Tabella a doppia entrata

Consideriamo un fenomeno casuale che si presenti con due caratteristiche X ed Y rispettivamente, ciascuno dei quali presenta valori discreti con n e m occorrenze

Possiamo dunque costruire una tabella dove per ogni caratteristica xi ed yj rilevata congiuntamente viene riportata la frequenza (assoluta) congiunta, cioè il numero di volte Nij con cui si sono presentate contemporaneamente le due caratteristiche.

(2)

Tabella a doppia entrata

y1 y2 yj ym

x1 N11 N12 N1j N1m

x2 N21 N22 N2j N2m

xi Ni1 Ni2 Nij Nim

xn Nn1 Nn2 Nnj Nnm

∑∑

= =

=

ⁿ

i m j

N

ij

N

1 1

[

i j

]

ij

P X x Y y

N

f = N = = , =

y1 y2 yj ym

x1 f11 f12 f1j f1m

x2 f21 f22 f2j f2m

xi fi1 fi2 fij fim

xn ff1 ff2 ffj ffm

frequenza congiunta relativa

Variabile casuale a più dimensioni continua

Analogamente a quanto visto per una variabile casuale a più dimensioni discreta si può pensare ad una variabile casuale a più dimensioni continua.

Siano X e Y le due caratteristiche.

La funzione densità di probabilità e la funzione di probabilità cumulativa assumeranno dunque le forme di:

f

_xy

( ) x , y

( ) x y f ( ) u v dv du P [ X x Y y ]

F

_xy

, = ∫ ∫

−^x∞ −^y∞ _xy

, = ≤ , ≤

(3)

Distribuzioni marginali

A questo punto ha senso chiedersi come si distribuisce la caratteristica X indipendentemente dai valori assunti dalla caratteristica Y e viceversa.

Nel caso discreto si ha:

[

_i

]

m j

ij

i

f P X x

p = ∑ = =

=1

[

j

]

n i

ij

j

f P Y y

q = ∑ = =

=1

Mentre nel caso continuo:

( ) ( )

⁺

∫

^∞

( )

∞

−

=

= f x f x y dy

x

p

_x

, ( ) ( )

⁺

∫

^∞

( )

∞

−

=

= f y f x y dx

y

q

_y

,

Media

Le distribuzioni marginali si presentano come delle variabili casuali ad una dimensione e dunque è possibile calcolare la media di X e di Y semplicemente con:

[ ] ∑

=

⋅

=

ⁿ

i

p

x x

E

1

e nel caso continuo:

[ ] X = ∫

−⁺∞^∞

x ⋅ f ( ) x dx

E

_x

[ ] ∑

=

⋅

=

^m

j

q

y y

E

1

[ ] Y = ∫

−⁺∞^∞

y ⋅ f ( ) y dy

E

_y

viene chiamata media della variabile casuale doppia

( µ

_x

, µ

_y

) = ( E [ ] [ ] X , E Y )

(4)

Varianza e covarianza

Analogamente a quanto visto per la media è possibile calcolare la varianza delle distribuzioni marginali di X e di Y con:

( )

∑

=

⋅

−

=

ⁿ

i

i x

i

x

x p

1

2

µ

2

σ

( ) ( )

∫

−⁺∞^∞

− ⋅

= x

_x

f

_x

x dx

x

2

µ

2

σ

( )

∑

=

⋅

−

=

^m

j

j y

j

y

y q

1

2

µ

2

σ

( ) ( )

∫

−⁺∞^∞

− ⋅

= y

_y

f

_y

y dy

y

2

µ

2

σ

Varianza e covarianza

Per la variabile casuale nel suo complesso è possibile calcolare la quantità

( ) ( ) ( )

∫ ∫

−⁺∞^∞

∞ +

∞

−

− ⋅ − ⋅

= x

_x

y

_y

f

_xy

x y dy dx

xy

µ µ ,

σ

( ) ( )

∑∑

= =

⋅

−

⋅

−

=

ⁿ

i m j

ij y j x i

xy

x y f

1 1

µ µ

σ

La quantità

2 2

y xy

xy x

C

xy

σ σ

σ

= σ

viene chiamata

(matrice di) covarianza

(5)

Distribuzioni condizionate

Analogamente a quanto visto per la definizione di probabilità condizionata, ha senso chiedersi come si distribuisce la caratteristica X fissato un ben determinato valore della caratteristica Y e viceversa.

Quindi si ha:

( ) f ( ) y y x x f

f

y y

x

) ,

= (

( ) f ( ) x y x y f

f

x x

y

) ,

= (

Regressione

La distribuzione di X condizionata ad Y è una variabile casuale con argomento x che dipende da un

“parametro” y.

Di questa variabile casuale posso calcolare la media che è data da:

[ ]

⁺

∫

^∞

( )

∞

−

⋅

=

= x y x f x dx

y x

E ( )

_x _y

[ ]

⁺

∫

^∞

( )

∞

−

⋅

=

= y x y f y dy

x y

E ( )

_y_x

E viceversa

(6)

Variabile casuale funzione di variabile casuale

Analogamente a quanto visto per le variabili casuali ad una dimensione è interessante considerare una variabile casuale Y (ad m dimensioni) funzione di una variabile casuale X (ad n dimensioni), cioè:

( )

( ) ^ ^

 





 





=

 





 





=

n m

n n

m

g X X X

X X

X g

X X

X g X

g Y

Y Y Y

,.., ,

..

,.., ,

) .. (

2 1

2 1 2

2 1 1

2 1

Variabile casuale funzione di variabile casuale

In alcuni casi semplici è possibile calcolare la distribuzione di Y nota quella di X, tuttavia, sotto alcune condizioni particolari è possibile pervenire ad una stima di media e (matrice di ) covarianza di Y.

• Siano le relazioni Y=g(X) “morbide”, cioè si possano pensare come sviluppo in serie troncate al termine del primo ordine;

• Siano tutte le Xiben concentrate attorno alla media.

(7)

Media

Allora è possibile calcolare la media di Y nel seguente modo:

( )

( ) ^ ^

 





 





=

≅

 





 





=

n n n

m m X X X

X X

X

X X

X

Y Y Y

Y

g g g

g

µ µ

µ

µ µ

µ

µ µ

µ

µ µ

µ µ µ

,.., ,

..

,.., ,

) .. (

2 1

Covarianza

E la matrice di covarianza può essere calcolare nel seguente modo:

T XX

YY

J C J

C ≅ ⋅ ⋅

“Legge di propagazione della Covarianza”

(8)

Jacobiano

( ) ( ) ( )

=













∂

∂ ∂

∂

=

n n m

n m

n n n

n

n n n

n

x x x x g x

x x x g x

x x x g

x x x x g x

x x x g x

x x x g

x x x x g x

x x x g x

x x x g

J

,.., .. ,

,.., , ,..,

,

..

,.., .. ,

,.., , ,..,

,

,.., .. ,

,.., , ,..,

,

2 1 2

2 1 1

2 1

2 1 2 2

2 1 2 1

2 1 2

2 1 1 2

2 1 1 1

2 1 1

( )

i n j

j

i x

x x x J g

∂

= ∂

= ₁, ₂,..,