• Non ci sono risultati.

10. VARIABILI CASUALI MULTIPLE 10.1.1 Introduzione

N/A
N/A
Protected

Academic year: 2021

Condividi "10. VARIABILI CASUALI MULTIPLE 10.1.1 Introduzione"

Copied!
15
0
0

Testo completo

(1)

10. VARIABILI CASUALI MULTIPLE

10.1.1 Introduzione

La definizione di v.c. può essere facilmente estesa al caso in cui a ciascun evento elementare che costituisce  è associata una coppia di numeri reali, così come schematizzato nella successiva figura.

Figura 10.1.1

Definizione di variabile casuale doppia

Considerato lo spazio di probabilità (, A, P) costituito dallo spazio fondamentale , dalla classe degli eventi A e dalla misura di probabilità P, una v.c. doppia X,Y è una funzione definita su  che associa a ciascuno degli N eventi elementari i (i= 1, 2, …, N) una coppia di valori reali [X(i), Y(i)] = (xj,yl) che rappresenta una determinazione della v.c. X,Y.

Il ricorso a una v.c. doppia è del tutto naturale quando sulle n unità statistiche vengono rilevate contemporaneamente due variabili (come, per esempio: reddito e consumi, peso e altezza, numero dei componenti delle famiglie e numero di mezzi di trasporto posseduti), ma risulta utile anche quando si

(2)

considera un esperimento che consiste nel lancio di due monete o di due dadi oppure nell’estrazione di due palline da un’urna. In questo caso, infatti, la v.c. X può semplicemente rappresentare il risultato ottenuto nella prima prova, mentre la Y può rappresentare il risultato ottenuto nella seconda.

L’uso di una v.c. doppia può risultare utile in situazioni diverse come, per esempio, considerato un esperimento che consiste nel lancio di tre monete, si può utilizzare una v.c. X per contare “il numero di teste ottenute” e una v.c. Y per contare il “numero di variazioni nella sequenza”, ossia il numero di volte in cui si passa dalla faccia “testa” alla faccia “croce” o viceversa.

La tabella successiva riporta nella prima colonna i 23=8 possibili eventi connessi con questa particolare prova (in cui la lettera “T” indica “testa” e la lettera “C” indica “croce”) mentre nella seconda e terza colonna sono riportati i corrispondenti valori delle due v.c.

Tabella 10.1.1 Esempio di v.c. doppia

 x y

1 = TTT 3 0

2 = TTC 2 1

3 = TCT 2 2

4 = CTT 2 1

5 = CCT 1 1

6 = CTC 1 2

7 = TCC 1 1

8 = CCC 0 0

In questo caso, quindi, al primo evento 1 è associata la coppia di valori (3, 0) della v.c. X,Y, al secondo evento 2 la coppia (2, 1), …, all’ultimo evento la coppia (0, 0).

Ovviamente il discorso può essere generalizzato dal caso bivariato al caso multivariato, per comprendere le situazioni in cui il numero di v.c. prese in esame è maggiore di due, come quando si analizzano le risposte fornite da un certo numero di intervistati a un questionario oppure quando si replica più volte un esperimento che consiste nel lancio di un dado o di una moneta o nell’estrazione di più palline da un’urna.

Come nei casi esaminati per le variabili statistiche, anche le v.c. multiple considerate in occasione di un esperimento casuale possono essere dello stesso tipo (tutte discrete o tutte continue) oppure di tipo diverso, in relazione alla situazione in esame. Nelle prossime pagine è considerato il caso bivariato (sia per v.c. discrete, sia per v.c. continue) che verrà poi generalizzato al caso multivariato.

(3)

10.2 Variabili casuali doppie discrete

Date due v.c. discrete X e Y e indicati con x e y i loro campi di variazione, il campo di variazione della v.c. doppia X,Y è pari al prodotto x × y, mentre la probabilità che in una prova si osservi la coppia di determinazioni (xj, yl) di X,Y corrisponde a

P(X=xj, Y=yl) = p(xj, yl) (xj, yl) x × y 10.2.1

L’espressione 10.2.1, che costituisce la funzione di probabilità congiunta della v.c. doppia X,Y, consente di ottenere la probabilità associata a qualsiasi sottoinsieme B  x × y semplicemente come somma delle probabilità associate alle singole coppie di valori che costituiscono B

 

   

  

B y x

l j

l j

y x p B

Y X P

,

,

, 10.2.2

Per esempio, se si considera l’esempio riportato nella tabella 10.1.1, la distribuzione di probabilità della v.c. X,Y si ottiene facilmente dalle probabilità associate gli eventi i, tutti equiprobabili, se la moneta è equilibrata.

Utilizzando una tabella a doppia entrata, in cui la prima colonna riporta i valori della v.c. X e la prima riga riporta i valori della v.c. Y, la distribuzione di probabilità congiunta di X,Y assume la forma riportata nella tabella successiva.

Tabella 10.2.1

Distribuzione di probabilità della v.c. X,Y definita nella tabella 10.1.1 X\Y 0 1 2

0 1/8 0 0 1/8 1 0 2/8 1/8 3/8 2 0 2/8 1/8 3/8 3 1/8 0 0 1/8 2/8 4/8 2/8 1.0

Questa distribuzione di probabilità congiunta si ottiene mediante lo stesso procedimento utilizzato per determinare la distribuzione di frequenza congiunta di due variabili statistiche.

In generale, una distribuzione di probabilità bivariata di una v.c. X,Y in cui la X assume k valori diversi e Y assume h valori diversi, può essere rappresentata mediante una tabella analoga alla 10.2.2 all’interno

(4)

della quale il simbolo p(xj, yl) posto all'incrocio fra la riga xj e la colonna yl (per j = 1, 2, …, k e l = 1, 2,

…, h) indica la probabilità associata alla coppia (xj, yl) della v.c. doppia X,Y, per cui risulta

 

 

x

j l y

x y

l j

y x

p

, 1.

Tabella 10.2.2

Esempio di distribuzione di probabilità bivariata

X\Y y1 y2ylyh

x1 p(x1, y1) p(x1, y2) … p(x1, yl) … p(x1, yh) p(x1) x2 p(x2, y1) p(x2, y2) … p(x2, yl) … p(x2, yh) p(x2) xj p(xj, y1) p(xj, y2) … p(xj, yl) … p(xj, yh) p(xj) xk p(xk, y1) p(xk, y2) … p(xk, yl) … p(xk, yh) p(xk) p(y1) p(y2) … p(yl) … p(yh) 1

Talvolta, specie se il numero di associazioni dei valori di X e Y che presentano una probabilità pari a zero è elevato, la distribuzione di probabilità congiunta viene espressa indicando le sole probabilità che risultano maggiori di zero per cui, per esempio, la distribuzione indicata nella tabella 10.2.1 può essere espressa anche mediante la notazione seguente

p(0, 0) = 1/8 p(1, 1) = 2/8 p(1, 2) = 1/8 p(2, 1) = 2/8 p(2, 2) = 1/8 p(3, 0) = 1/8.

Analogamente a quanto visto per il caso univariato e come si vede chiaramente dalle tabelle 10.2.1 e 10.2.2, dalla distribuzione di probabilità congiunta è possibile determinare le due distribuzioni di probabilità marginali di X e di Y che corrispondono rispettivamente a

   

j x

y

l j

j

p x y x

x X P

y l

 

per ,

   

l y

x

l j

l

p x y y

y Y P

x j

 

per

, .

In analogia a quanto descritto a proposito di due variabili statistiche, anche le due variabili casuali X e Y risultano indipendenti quando la funzione di probabilità congiunta corrisponde al prodotto delle distribuzioni di probabilità marginali, ossia quando

(5)

P(X = xj, Y = yl) = P(X = xj) × P(Y = yl) per

x

j

 

x,

y

l

 

y.

Nel caso della tabella 10.2.1, quindi, le variabili X e Y non risultano indipendenti fra loro.

(6)

10.3 Variabili casuali doppie continue

Se le v.c. X e Y sono di tipo continuo e definite rispettivamente su x = (a, b) e su y = (c, d), il campo di variazione della v.c. doppia X,Y è sempre dato da x × y che in questo caso corrisponde al prodotto (a, b) × (c, d).

In analogia a quanto visto a proposito del caso univariato, la probabilità viene assegnata a intervalli del tipo (, x], (, y] mediante la f.r. congiunta F(x,y). Anche in questo caso questa funzione risulta definita per qualsiasi coppia di valori (x, y) di X,Y e assume valori compresi nell’intervallo [0, 1].

Dalla f.r. si ottiene la probabilità che la X,Y sia compresa in qualsiasi intervallo infinitesimo del tipo (x, x+x], (y, y+y] e, facendo tendere a zero sia x sia y, si ottiene la f.d. congiunta

   

y x

y y Y y x x X x y P x

f  

 

,

, (x,y) x × y 10.3.1

che associa ad ogni coppia di valori delle due v.c. la densità di probabilità corrispondente.

Dalla f.d. congiunta 10.3.1 è possibile ottenere la f.d. marginale fx(x) della X integrando la funzione nel campo di variazione di Y

 

d

 

c

x

x f x y dy

f

, , a < x < b

e la f.d. marginale di Y mediante l’integrale

 

b

 

a

y

y f x y dx

f

, , c < y < d.

Considerata per esempio la v.c. doppia X,Y con f.d. congiunta

f(x,y) = 3x2y + x 0 < x < 1, 0 < y < 1

la f.d. marginale della X corrisponde a

(7)

  x x y x dy x ydy x d y x y x   y x x

f

x

  

 

 

 

   

1 10 2

0 2 2 1

0

1

0 2

1

0 2

2 3 3 2

3 3

mentre la f.d. marginale della Y corrisponde a

 

2

1 2

3 3 3

3

1

0 1 2

0 1 3

0

1

0 2 1

0

2

 

 

 

 

 

 

 

  x y x dx yx dxx d x y x x y

y

f

y .

Analogamente a quanto visto per due v.c. discrete, se le due v.c. continue X e Y sono indipendenti, la loro f.d. congiunta corrisponde al prodotto delle due f.d. marginali

f(x,y) = fx(x) × fy(y) a < x <b, c < y < d.

Considerata per esempio la v.c. doppia X,Y con f.d. congiunta

  

2

2 4, 1 1

4

,

y

3

y

2

x   x    yx

f

,

la f.d. marginale della X corrisponde a

       

  

2

per 2 4

2 1 3 1 3 2 1 4 3

2 3 4 2 3

4 2 3 4

3 1

1 1 3

1 2 1

1 2

 

 

  

 

 

 

 

 

x x

x

x y dy y x

dy x y x

f

x

mentre la f.d. marginale della Y è

     

   

per 1 1

2 4 3 8 2 4 8

2 3 4 2 2 4 2 16 4 3

2 2 4

1 3 4 2

2 3 4

3

2 2

2

4 2 4

2 2 2

4

2 4

2 2 4

2 2

 

 

   

 

 



 

 

 

 

 

 

 

  

   

y y

y y

x x y dx

dx x y dx x y y

f

y

(8)

In questo caso il prodotto delle due f.d. marginali corrisponde alla f.d. congiunta, per cui le due v.c. X e Y sono indipendenti fra loro.

Esempio 10.3.1

Data una v.c. doppia X,Y con f.d.

f(x,y) = 2(1-x) per 0 < x < 1, 0 < y < 1

si ottengano le due f.d. marginali e si verifichi se le due v.c. sono indipendenti fra loro

Risulta

 

2

 

1 2

 

1 1 2

 

1

 

10 2

 

1 per 0 1

1

0 1

0

x dy x

dy x y x x

x fx

     

1 per 0 1

2 1 1 2 2

2 1

2 1

2

1 0 1 0 1

0 1

0 1

0



 

 













 

xdx

dx

xdx x x y

y fy

per cui X e Y sono indipendenti.

Esempio 10.3.2

Data una v.c. doppia X,Y con f.d.

f(x,y) = x+y per 0 < x < 1, 0 < y < 1 si verifichi se X e Y sono indipendenti

Le due f.d. marginali sono

   

per 0 1

2 1 1 2

1

0 1 2

0 1

0 1

0 1

0

 







x ydy x

dy

ydy xy y x x

x fx

   

per 0 1

2 1

1 2 10

1

0 1 2

0 1

0 1

0

 







x ydx

xdx y

dx x yx y y

y fy

Le due v.c. non sono indipendenti fra loro

(9)

10.4 Valori caratteristici

Data la distribuzione di probabilità congiunta della v.c. doppia X,Y, i valori degli indici di posizione, di variabilità e di forma delle due variabili X e Y singolarmente considerate possono essere determinati sulla base delle distribuzioni di probabilità marginali e assumono forme diverse a seconda che le variabili siano di tipo discreto oppure continuo, analogamente a quanto visto nel capitolo precedente, relativo alle v.c.

semplici.

Inoltre, se le due v.c. non sono indipendenti fra loro, è possibile verificare se fra X e Y esiste un legame di tipo lineare, diretto o inverso, mediante il calcolo della covarianza

xy = E[(Xx)(Yy)].

Anche in questo caso la covarianza corrisponde alla differenza fra il valore atteso del prodotto delle due v.c. meno il prodotto dei loro valori attesi

xy = E(XY) E(X)E(Y)

dove

     

x

j l y

x y

l j l j

y p x y x

XY

E

,

se le due v.c. sono entrambe discrete, mentre se sono invece continue corrisponde a

  

b

 

a d

c

dxdy y x f xy XY

E

, .

Per esempio, considerata la v.c. doppia riportata nella tabella successiva,

Tabella 10.4.1

Distribuzione di probabilità bivariata

X\Y 0 1 2

1 0.000 0.250 0.125 0.375 2 0.000 0.375 0.125 0.500 3 0.125 0.000 0.000 0.125 0.125 0.625 0.250 1.000

(10)

si ottengono i seguenti risultati

E(X) = x = 1×0.375 + 2×0.5 + 3×0.125 = 1.75 E(Y) = y = 0×0.125 + 1×0.625 + 2×0.25 = 1.125 E(XY) = 1×1×0.25 + 1×2×0.125 + 2×1×0.375 = 1.75

xy = E(XY) E(X)E(Y) = 1.75 – 1.75×1.125 = -0.21875

da cui risulta che fra le due variabili esiste un legame lineare di tipo inverso.

Nota

Va osservato che se i valori assegnati alle v.c. sono frutto di una scelta arbitraria, come accade quando si attribuiscono dei valori numerici ai giudizi espressi dagli individui in relazione a un certo prodotto o a un servizio, non ha alcun senso calcolare la covarianza fra variabili, in quanto l’attribuzione di valori diversi ai vari giudizi espressi porterebbe a risultati differenti.

Esempio 10.4.1

Calcolare la covarianza per la seguente distribuzione bivariata

X\Y 0 1

1 0.1 0.3 0.4 2 0.1 0.1 0.2 3 0.3 0.1 0.4 0.5 0.5 1.0 Risulta

E(X) = 2, E(Y) = 0.5, E(XY) = 0.8,

xy = -0.2

(11)

10.5 Variabili casuali multiple

I concetti esposti nei paragrafi precedenti possono essere estesi ai casi in cui a ciascun evento elementare che costituisce  è associato un vettore di numeri reali a k dimensioni, con k > 2, come quando sulle n unità statistiche vengono rilevate contemporaneamente k variabili o come quando l’esperimento casuale consiste in k repliche (estrazione di k palline da un’urna, lancio di k monete o di k dadi), per cui la v.c. X1

rappresenta il risultato ottenuto nella prima replica, X2 rappresenta il risultato ottenuto nella seconda replica, …, Xk rappresenta il risultato ottenuto nella k-esima replica.

Considerato lo spazio di probabilità (, A, P) costituito dallo spazio fondamentale , dalla classe degli eventi A e dalla misura di probabilità P, un vettore casuale (X1, X2, …, Xk) è una funzione definita su  che associa a ciascuno degli N eventi elementari i (i= 1, 2, …, N) k valori reali [X1(i), X2(i), …, Xk(i)] che rappresenta una determinazione della v.c. k-variata X1, X2, …, Xk.

Quale che sia la natura delle variabili casuali considerate, il campo di variazione della v.c. multipla corrisponde sempre al prodotto dei singoli campi di variazione delle k v.c Xj (j = 1, 2, …, k).

Se le v.c. sono tutte discrete, la loro funzione di probabilità congiunta, ossia la probabilità che in una prova si osservi il vettore di determinazioni (x1, x2 , …, xk) corrisponde a

P(X1=x1, X2=x2, …, Xk=xk) = p(x1, x2 , …, xk) (x1, x2 , …, xk) 1×2×…×k

e, come nel caso bivariato, questa funzione di probabilità congiunta consente di ottenere la probabilità associata a qualsiasi sottoinsieme B  1×2×…×k pari alla somma delle probabilità associate ai vettori di valori che costituiscono B.

Se le k variabili casuali risultano tutte indipendenti fra loro la funzione di probabilità congiunta corrisponde anche in questo caso al prodotto delle singole distribuzioni di probabilità marginali

P(X1=x1,X2=x2,…, Xk=xk)=P(X1=x1)×P(X2=x2)×… ×P(Xk=xk) (x1, x2 , …, xk) 1×2×…×k.

Se invece le k v.c. sono continue, la loro funzione di densità di probabilità congiunta

x x x

k

  x x x

k

k

f

1, 2,..., 1, 2,...,

 

1

 

2

...

 

(12)

associa ad ogni vettore di valori delle k v.c. la densità di probabilità corrispondente.

Se le v.c. sono tutte indipendenti fra loro, questa funzione corrisponde al prodotto delle funzioni di probabilità marginali delle k variabili

f(x1, x2,… , xk) = f1(x1) × f2(x2) × … × fk(xk) (x1, x2 , …, xk) 1×2×…×k

Anche nel caso multivariato è possibile determinare il valore atteso e la varianza di ogni singola v.c. sulla base della sua f.d. marginale, così come è possibile calcolare la covarianza per ogni coppia di variabili.

10.6 Combinazioni lineari di variabili casuali

In alcune situazioni reali si può essere interessati a determinare le caratteristiche non di singole variabili casuali, ma di una loro combinazione lineare.

Si consideri, per esempio, il caso di un investitore che ha destinato un quarto delle sue risorse a un fondo azionario e i restanti tre quarti a un fondo obbligazionario. Indicata con X1 la v.c. “rendimento del fondo azionario” avente valore atteso E(X1) = 3 e deviazione standard 1 = 3 con X2 la v.c. “rendimento del fondo obbligazionario” avente valore atteso E(X2) = 1.5 e deviazione standard 2 = 1 si avrà interesse a determinare il valore atteso e la deviazione standard della combinazione lineare

Z = 0.25 X1 + 0.75 X2. 10.6.1

In generale, date due v.c. X1 e X2 di valore atteso rispettivamente pari a

x

1 e

x

2 e di varianza rispettivamente pari a

12 e

22, si indichi con 12 la loro covarianza e con P(x1, x2) la loro funzione di probabilità congiunta. Ogni combinazione lineare delle due variabili

Z = a + b1X1 + b2X2 10.6.2

è ancora una v.c. il cui valore atteso corrisponde a

(13)

       

     

 

1 2 2

 

2 1 1 2 2 1

1

2 1 2

2 2 1 1

1 2 1

2 1 2 2 1 1 2

2 1 1

2 2 1

1

2

2 1 1

1

1 2 2

1

1 2 2

1

1 2 2

, ,

,

,

x b x b a x P X b x P X b a

x x P X b

x x P X b

x x P a

x x P X b X b a X

b X b a E z Z E

x x

x x

x x

x x

x x

 

 

 

 

mentre la sua varianza è invece pari a

       

   

   

      

 

       

  

1 1 2 2

 

1 2

12 12 22 22 1 2 12

2 1

2 1 2

2 2 2

2 2 1 2

1 1 2

1

2 1 2 2 1 1 2 1 2 2 2 2 2 2 1 1 2 1

2 1 2 2 2 2 1 1 1

2 1 2 2 2 1 1 2

2 1 1 2

2

2 ,

2

, ,

, 2

,

,

1

1 2 2

2

2 1 1

1

1 2 2

1

1 2 2

1

1 2 2

1

1 2 2

b b b

b x x P x X x X b

b

x x P x

X b

x x P x

X b

x x P x X x X b b x

X b x X b

x x P x X b x X b

x x P x b x b a X b X b a z

Z E Z

V

x x

x x

x x

x x

x x

x x

z

 

 

 

 

 

 

Nel caso in cui le due v.c. X1 e X2 fossero indipendenti fra loro, la varianza della 10.6.2 risulterebbe pari a

22 22 12 12

2

 

zbb

in quanto la covarianza fra X1 e X2 risulterebbe pari a zero.

Sulla base dei risultati appena ottenuti, la v.c. definita nella 10.6.1 ha un valore atteso pari a

E(Z) =

z

= 0.25×3 + 0.75×1.5 = 1.875

mentre, se si ipotizza che la covarianza fra i due tipi di fondo sia pari a 1.5, la sua varianza è data da

2z

= (0.25)2×32 + (0.75)2×12 + 2×0.25×0.75×1.5 = 1.6875

In generale, date k v.c. X1, X2, …, Xk, ogni loro combinazione lineare del tipo

Z = a + b1X1 + b2X2 + … + bkXk 10.6.3

(14)

è ancora una v.c. il cui valore atteso risulta pari a

  

k

j j j

x b a z Z E

1

10.6.4

mentre la sua varianza è data da

   

 

 

  

1

1 1

2 2 1

1 2 2

2 2k

j l j j l jl k

j j j

k

j l j j l jl k

j j j

z

b b b b b b

Z

V     

Anche in questo caso, se le variabili sono tutte indipendenti fra di loro, la varianza della combinazione 10.6.3 risulta semplicemente pari a

  

k

j j j

z

b

Z V

1 2 2

2

10.6.5

in quanto ogni covarianza è nulla.

Come caso particolare della 10.6.3 si consideri la variabile

T = X1 + X2 + … + Xk 10.6.6

corrispondente alla somma di k v.c. Xj (j = 1, 2, …, k) di valore atteso

x

j e varianza

2j e tutte indipendenti fra loro. Dalle 10.6.4 e 10.6.5 risulta immediatamente che il valore atteso e la varianza di T sono date rispettivamente da

  

k

j

x

j

T E

1

10.6.7

  

k

j

T

j

V

1

2 10.6.8

Se si considera invece la variabile

(15)

X X X

k

Xk

1

 

...

2

1 10.6.9

corrispondente alla media di k v.c. Xj (j = 1, 2, …, k) di valore atteso

x

j e varianza

2j e tutte indipendenti fra loro, il valore atteso e la varianza di

X

sono

  

k

j

x

j

X k E

1

1 10.6.10

  

k

j

k

j

X V

1 2 2

1

10.6.11

Esempio 10.6.1

Si vuole calcolare il valore atteso e la deviazione standard della v.c. Z “costo unitario di un prodotto” sapendo che:

- la realizzazione di un’unità di prodotto ha un costo fisso C pari a 130 euro e che, in media, richiede 3 ore di lavoro e 10 grammi di materia prima;

- la v.c. L “costo di un'ora di lavoro” ha un valore atteso pari a 40 euro con una deviazione standard di 2 euro;

- la v.c. M “costo delle materie prime” ha un valore atteso di 30 euro per grammo con una deviazione standard di 3 euro.

In questo caso la combinazione lineare assume la forma Z = 3L + 10M + C

e il suo valore atteso corrisponde a

E(Z) = 3E(L) + 10E(M) + C = 3×40 + 10×30 + 130 = 550 mentre la sua varianza è

V(Z) = 32V(L) + 102V(M) = 9×22 + 100×32 = 936 per cui la deviazione standard di Z è z = √936

Riferimenti

Documenti correlati

Trasformazioni di variabili casuali

[r]

Come sappiamo, in una data prova non si può conoscere quale valore assumerà la nostra variabile casuale; ma se conosciamo tutti i possibili valori che la nostra variabile

Osservazione 3.5 Nel caso in cui E `e un insieme finito o numerabile, segue dalla Proposi- zione 3.4 che la coppia (E, µ X ) `e uno spazio di probabilit`a discreto. Va tuttavia

Quanto visto nel caso discreto nella Proposizione 3.60 riguardo alla funzione di ripartizione del massimo e del minimo di variabili casuali indipendenti continua a valere per

Per tale punto si tracci la tangente alla circonferenza di centro (0, 0) e raggio 1, e sia L la lunghezza del segmento i cui estremi sono i punti d’intersezione di tale tangente con

una successione di variabili casuali scalari i.i.d... Sia (X n ) n≥1 una successione di variabili

 la taglia del campione `e molto grande (≥ 1000) ma la distribuzione della variabile in esame non ` e normale.  la varianza della variabile in esame `e