1
D is tr ib u z io n i d o p p ie
Quando vengono considerate congiuntamente due colonne di una matrice di dati si ha unadistribuzione doppia disaggregata(o unitaria). Si tratta dell’elencazione delle modalitàdi due caratteri (X e Y) osservate per ogni unità statistica del collettivo considerato: ()()()nnyxyxyx,,,,,,2211K MarcheFGrandiA. UmbriaFPiniB.PiemonteMGialliL.
UmbriaFRossi V.
CalabriaFBianchi C.
MarcheMVerdi M.
Regione(yi)Sesso(xi)Nome (i) 2
•L’informazione contenuta in una distribuzione doppia disaggregata èsolitamente sintetizzata tramite una distribuzione doppia di frequenzache viene rappresentata tramite una tabella a doppia entrata in cui per ogni coppia di modalitàdei due caratteri ()KjHiyxji,,1,,,1,,KK== vieneindicatala corrispondentefrequenzacongiunta(nij). nHK…nHj…nH2nH1xH
…………………
niK…nij…ni2ni1xi
…………………
n2K…n2j…n22n21x2
n1K…n1j…n12n11x1
yK…yj…y2y1X/Y Quandoilcarattereèquantitativocon moltemodalità (tipicamentecontinuo) possonoessereutilizzatele classial postodellemodalità. 3
Esempi Si consideri la seguente distribuzione doppia disaggregata per due caratteri qualitativi (Sesso, Regione) La corrispondente distribuzione doppia di frequenza è MarcheFGrandiA. UmbriaFPiniB.
PiemonteMGialliL.
UmbriaFRossi V.
CalabriaFBianchi C.
MarcheMVerdi M.
Regione(yi)Sesso(xi)Nome (i) 0211F
1010M
PiemonteUmbriaMarcheCalabriaSesso
Regione 4
•Esempio di distribuzione in cui il carattere quantitativo èin classi 42193Laurea
38399Diploma
12014288Lic. Media
30-10010-300-10Titolodi studio
Redditoannuo(x 1.000€)
5
D is tr ib u z io n i m a rg in a li
•Sommando le frequenze congiunte per colonnasi ottengono le frequenze marginalidi Xche corrispondono al numero di soggetti che presentano una certa modalitàdi questo carattere a prescindere dalla modalitàdi Y: •Analogamente, lefrequenze marginalidi Y si ottengono sommando le frequenze congiunte per riga: •La somma di tutte frequenze congiunte (o di tutte le frequenze marginali) corrisponde allanumerositàdel collettivo∑
==K jijinn 1
o
∑
==H iijjnn 1
o
∑ ∑ ∑ ∑
=======H ii
K jj
K j
H iijnnnn 1111
oo 6
nH°nHK…nHj…nH2nH1xH n°K
…
niK
…
n2K
n1K
yK n…n°j…n°2n°1Totale
…………………
ni°…nij…ni2ni1xi
…………………
n2°…n2j…n22n21x2
n1°…n1j…n12n11x1
Totale…yj…y2y1X/Y 7
•Associando a ogni modalitàdel carattere X la corrispondente frequenza marginale, si ottiene ladistribuzione marginaledi X. E’la stessa distribuzione che avremmo ottenuto osservando il carattere singolarmente. •In modo analogo si ottiene ladistribuzione marginaledi Y. •Entrambe le distribuzioni possono essere lette direttamente dalla tabella a doppia entrata, quando sono presenti i totali (margini) di riga e di colonna.
nH°xH nTotale
……
ni°xi
……
n2°x2
n1°x1
Frequenze(ni°)Modalità(xi) 8
Esempi •Alla prima distribuzione doppia considerata nell’esempio precedente si hanno le seguenti distribuzioni marginali di X e Y
0211F 1221Totale
1010M
PiemonteUmbriaMarcheCalabriaSesso
Regione 642Totale 6Totale
4F
2M
Frequenze(ni°)Sesso(xi) 6Totale
1Piemonte
2Umbria
2Marche
1Calabria
Frequenze(n°j)Regione(yi)
9
•Per la seconda distribuzione doppia considerata nell’esempio precedente, si hanno le seguenti distribuzioni marginali di X e Y 86Diploma 500Totale
64Laurea
350Lic. media
Frequenze (ni°)Titolodi studio (xi) 500Totale
20030-100
20010-30
1000-10
Frequenze(n°j)Reddito(yi)
42193Laurea 200200100Totale
38399Diploma
12014288Lic. Media
30-10010-300-10Titolodi studio
Redditoannuo(x 1.000€) 86 64 500
350
Totale 10
D is tr ib u z io n i c o n d iz io n a te
•Ladistribuzione condizionata di Y dato X = xièla distribuzione di Ylimitatamente ai soggetti che presentato la modalitàxidi X. Si ottiene associando a ogni modalitàyjdi Yla frequenza congiunta di (xi,yj). •Ogni riga della tabella a doppia entrata corrisponde a una distribuzione condizionata di Y per una certa modalitàX. •In modo analogo possono essere ottenute ledistribuzioni condizionate di X dato Y = yj. Ognuna di queste distribuzioni corrisponde a una diversa colonna della tabella a doppia entrata.niKyK ni°Totale
……
nijyj
……
ni2y2
ni1y1
Frequenze(nij)Modalità(yj) 11
D is tr . c o n d iz io n a te re la ti v e e p e rc e n tu a li
•Per la distribuzione condizionata di Ydato X = xi, le frequenze relative e percentuali possono essere calcolate come •Associando alla distribuzione condizionata di Ydato X = xile corrispondenti frequenze relative (o percentuali) si ottiene la distribuzione condizionata relativa (o percentuale) di Ydato X = xi. Questa distribuzione permette di capire come Xinfluenza Y.ij i
ij ij i
ij ijf n
n pe n
n f|||100100=== °° ni°
niK
…nij
…
ni2
ni1
Frequenze(nij) 1fK|i
…fj|i
…
f2|i
f1|i
Freq. relative (fj|i) pK|iyK 100Totale
……
pj|iyj
……
p2|iy2
p1|iy1
Freq. percentuali(pi|i)Modalità(yj) 12
Esempio •Distribuzioni condizionate del reddito al titolo di studio. 350
120
142
88
Frequenze(nij) 1
0,3429
0,4057
0,2514
Relative (fj|i) 100Totale
342,930-100
405,710-30
251,40-10
Percentuali(pj|j)Reddito(yi)
Lic en za me dia
86
38
39
9
Frequenze(nij) 1
0,4419
0,4535
0,1047
Relative (fj|i) 100Totale
441,930-100
453,510-30
104,70-10
Percentuali(pj|j)Reddito(yi)
Dip lo ma
64
42
19
3
Frequenze(nij) 1
0,6562
0,2969
0,0469
Relative (fj|i) 100Totale
656,230-100
296,910-30
46,90-10
Percentuali(pj|j)Reddito(yi)
La ure a