• Non ci sono risultati.

Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014

N/A
N/A
Protected

Academic year: 2022

Condividi "Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014"

Copied!
25
0
0

Testo completo

(1)

comunicazione e delle relazioni

internazionali - a.a. 2013-2014

(2)

Distribuzioni doppie

Indipendenza : il carattere X è indipendente da Y se, per qualsiasi modalità di Y, la

distribuzione relativa condizionata di X non cambia

Se non cè

indipendenza tra due caratteri

Dipendenza (Approccio asimmetrico)

Interdipendenza (Approccio simmetrico)

XàY oppure YàX

X Y

(3)

Lo studio della interdipendenza tra caratteri quantitativi: la correlazione

Reddito

p.c. Consumi p.c.

AG 9864,3 8676,5 AL 20555,0 14150,9 AN 22310,9 14667,4 AO 24583,4 16475,0 AP 18179,3 13014,7 AQ 16165,1 11258,8 AR 19780,3 12601,6 AT 18540,8 12395,0 AV 13169,7 9451,2 BA 14770,7 10794,0 BG 20606,6 12963,1 BI 23963,6 13169,7 BL 20606,6 14305,9 BN 12653,2 9657,7 BO 29489,7 20658,3 BR 11775,2 13531,2 BS 21639,5 8986,4 BZ 24170,2 16371,7

: : :

Nel caso di una variabile doppia quantitativa la rappresentazione grafica più naturale è quella del piano cartesiano, dove ogni punto sul piano

corrisponde ad una coppia ordinata di valori (x

i

,y

i

)

rilevata sull’i-esima unità statistica, per i=1,2….,n

(4)

35000 30000 25000 20000 15000

10000 5000

0 25000

20000

15000

10000

5000

0

La correlazione

Reddito

p.c. Consumi p.c.

AG 9864,3 8676,5 AL 20555,0 14150,9 AN 22310,9 14667,4 AO 24583,4 16475,0 AP 18179,3 13014,7 AQ 16165,1 11258,8 AR 19780,3 12601,6 AT 18540,8 12395,0 AV 13169,7 9451,2 BA 14770,7 10794,0 BG 20606,6 12963,1 BI 23963,6 13169,7 BL 20606,6 14305,9 BN 12653,2 9657,7 BO 29489,7 20658,3 BR 11775,2 13531,2 BS 21639,5 8986,4 BZ 24170,2 16371,7

: : :

Il diagramma di dispersione

Consumi p.c.

(in €)

Reddito p.c.

(in €)

m

X

=18309,1

m

Y

=12406,5

(5)

35000 30000 25000 20000 15000

10000 5000

0 25000

20000

15000

10000

5000

0

La correlazione

Reddito

p.c. Consumi p.c.

AG 9864,3 8676,5 AL 20555,0 14150,9 AN 22310,9 14667,4 AO 24583,4 16475,0 AP 18179,3 13014,7 AQ 16165,1 11258,8 AR 19780,3 12601,6 AT 18540,8 12395,0 AV 13169,7 9451,2 BA 14770,7 10794,0 BG 20606,6 12963,1 BI 23963,6 13169,7 BL 20606,6 14305,9 BN 12653,2 9657,7 BO 29489,7 20658,3 BR 11775,2 13531,2 BS 21639,5 8986,4 BZ 24170,2 16371,7

: : :

Il diagramma di dispersione

Consumi p.c.

(in €)

Reddito p.c.

(in €)

m

X

=18309,1

m

Y

=12406,5

I II

III IV

(6)

La correlazione

Reddito

p.c. Consumi p.c.

AG 9864,3 8676,5 AL 20555,0 14150,9 AN 22310,9 14667,4 AO 24583,4 16475,0 AP 18179,3 13014,7 AQ 16165,1 11258,8 AR 19780,3 12601,6 AT 18540,8 12395,0 AV 13169,7 9451,2 BA 14770,7 10794,0 BG 20606,6 12963,1 BI 23963,6 13169,7 BL 20606,6 14305,9 BN 12653,2 9657,7 BO 29489,7 20658,3 BR 11775,2 13531,2 BS 21639,5 8986,4 BZ 24170,2 16371,7

: : :

Gli scostamenti dalle medie

-10000 -8000 -6000 -4000 -2000 0 2000 4000 6000 8000 10000

-10000 -5000 0 5000 10000 15000

reddito

consumi

(7)

35000 30000 25000 20000 15000

10000 5000

0 25000

20000

15000

10000

5000

0

( )

codev XY

La codevianza e la covarianza

Consumi p.c.

(in €)

Reddito p.c.

(in €)

(

i X

) (

i Y

)

i

x µ y µ

= ∑ − ⋅ −

( )

XY

cov XY = σ

(

i X

) (

i Y

)

i

x y

n

µ µ

=

− ⋅ −

I II

III IV

>0

Prevalenza di punti nei quadranti I e III

Relazione diretta

>0

Prevalenza di punti nei quadranti I e III

Relazione diretta

<0

Prevalenza di punti nei quadranti II e IV

Relazione inversa

<0

Prevalenza di punti nei quadranti II e IV

Relazione inversa

=0

Nessuna prevalenza

Mancanza di relazione lineare

=0

Nessuna prevalenza

Mancanza di relazione lineare

σ σ σ

⎡ ⎤ = ⋅

x y,

x y

Max

Il segno

Lintensità

(8)

m

X

=18309,1 m

Y

=12406,5

s

X

=4828,80 s

Y

=2631,75

Reddito

p.c. Consumi

p.c. X-µX Y-µY (X-µX)(Y-µY) AG 9864,3 8676,5 -8444,8 -3730,0 31499328,5 AL 20555,0 14150,9 2245,8 1744,4 3917676,4 AN 22310,9 14667,4 4001,8 2260,9 9047576,4 AO 24583,4 16475,0 6274,2 4068,5 25526472,4 AP 18179,3 13014,7 -129,9 608,2 -78988,0 AQ 16165,1 11258,8 -2144,0 -1147,7 2460807,0 AR 19780,3 12601,6 1471,2 195,1 286950,8 AT 18540,8 12395,0 231,7 -11,5 -2670,5 AV 13169,7 9451,2 -5139,5 -2955,3 15188957,8 BA 14770,7 10794,0 -3538,5 -1612,5 5705967,9 BG 20606,6 12963,1 2297,5 556,6 1278713,3 BI 23963,6 13169,7 5654,5 763,2 4315204,9 BL 20606,6 14305,9 2297,5 1899,4 4363747,5 BN 12653,2 9657,7 -5656,0 -2748,8 15546863,7 BO 29489,7 20658,3 11180,5 8251,8 92259384,2 BR 11775,2 13531,2 -6533,9 1124,7 -7348526,6 BS 21639,5 8986,4 3330,4 -3420,1 -11390429,8 BZ 24170,2 16371,7 5861,0 3965,2 23240053,2

: : :

La codevianza e la covarianza

(9)

(

i X

) (

i Y

)

XY i

x y

n

µ µ

σ =

11.068.848, 4

=

m

X

=18309,1 m

Y

=12406,5

s

X

=4828,80 s

Y

=2631,75

Reddito

p.c. Consumi

p.c. X-µX Y-µY (X-µX)(Y-µY) AG 9864,3 8676,5 -8444,8 -3730,0 31499328,5 AL 20555,0 14150,9 2245,8 1744,4 3917676,4 AN 22310,9 14667,4 4001,8 2260,9 9047576,4 AO 24583,4 16475,0 6274,2 4068,5 25526472,4 AP 18179,3 13014,7 -129,9 608,2 -78988,0 AQ 16165,1 11258,8 -2144,0 -1147,7 2460807,0 AR 19780,3 12601,6 1471,2 195,1 286950,8 AT 18540,8 12395,0 231,7 -11,5 -2670,5 AV 13169,7 9451,2 -5139,5 -2955,3 15188957,8 BA 14770,7 10794,0 -3538,5 -1612,5 5705967,9 BG 20606,6 12963,1 2297,5 556,6 1278713,3 BI 23963,6 13169,7 5654,5 763,2 4315204,9 BL 20606,6 14305,9 2297,5 1899,4 4363747,5 BN 12653,2 9657,7 -5656,0 -2748,8 15546863,7 BO 29489,7 20658,3 11180,5 8251,8 92259384,2 BR 11775,2 13531,2 -6533,9 1124,7 -7348526,6 BS 21639,5 8986,4 3330,4 -3420,1 -11390429,8 BZ 24170,2 16371,7 5861,0 3965,2 23240053,2

: : :

La codevianza e la covarianza

(10)

La correlazione

(

i X

) (

i Y

)

XY i

x y

n

µ µ

σ =

11.068.848, 4

=

m

X

=18309,1 m

Y

=12406,5

s

X

=4828,80 s

Y

=2631,75

XY

X Y

σ σ σ

− ≤ 1 ≤ + 1

XY

X Y

σ σ σ = r XY Coefficiente di correlazione

Reddito

p.c. Consumi

p.c. X-µX Y-µY (X-µX)(Y-µY) AG 9864,3 8676,5 -8444,8 -3730,0 31499328,5 AL 20555,0 14150,9 2245,8 1744,4 3917676,4 AN 22310,9 14667,4 4001,8 2260,9 9047576,4 AO 24583,4 16475,0 6274,2 4068,5 25526472,4 AP 18179,3 13014,7 -129,9 608,2 -78988,0 AQ 16165,1 11258,8 -2144,0 -1147,7 2460807,0 AR 19780,3 12601,6 1471,2 195,1 286950,8 AT 18540,8 12395,0 231,7 -11,5 -2670,5 AV 13169,7 9451,2 -5139,5 -2955,3 15188957,8 BA 14770,7 10794,0 -3538,5 -1612,5 5705967,9 BG 20606,6 12963,1 2297,5 556,6 1278713,3 BI 23963,6 13169,7 5654,5 763,2 4315204,9 BL 20606,6 14305,9 2297,5 1899,4 4363747,5 BN 12653,2 9657,7 -5656,0 -2748,8 15546863,7 BO 29489,7 20658,3 11180,5 8251,8 92259384,2 BR 11775,2 13531,2 -6533,9 1124,7 -7348526,6 BS 21639,5 8986,4 3330,4 -3420,1 -11390429,8 BZ 24170,2 16371,7 5861,0 3965,2 23240053,2

: : :

(11)

La correlazione

(

i X

) (

i Y

)

XY i

x y

n

µ µ

σ =

11.068.848, 4

=

m

X

=18309,1 m

Y

=12406,5

s

X

=4828,80 s

Y

=2631,75

11.068.848, 4

4.828,80 2.631,75

= ×

= 0,87

XY XY

X Y

r σ

= σ σ

Reddito

p.c. Consumi

p.c. X-µX Y-µY (X-µX)(Y-µY) AG 9864,3 8676,5 -8444,8 -3730,0 31499328,5 AL 20555,0 14150,9 2245,8 1744,4 3917676,4 AN 22310,9 14667,4 4001,8 2260,9 9047576,4 AO 24583,4 16475,0 6274,2 4068,5 25526472,4 AP 18179,3 13014,7 -129,9 608,2 -78988,0 AQ 16165,1 11258,8 -2144,0 -1147,7 2460807,0 AR 19780,3 12601,6 1471,2 195,1 286950,8 AT 18540,8 12395,0 231,7 -11,5 -2670,5 AV 13169,7 9451,2 -5139,5 -2955,3 15188957,8 BA 14770,7 10794,0 -3538,5 -1612,5 5705967,9 BG 20606,6 12963,1 2297,5 556,6 1278713,3 BI 23963,6 13169,7 5654,5 763,2 4315204,9 BL 20606,6 14305,9 2297,5 1899,4 4363747,5 BN 12653,2 9657,7 -5656,0 -2748,8 15546863,7 BO 29489,7 20658,3 11180,5 8251,8 92259384,2 BR 11775,2 13531,2 -6533,9 1124,7 -7348526,6 BS 21639,5 8986,4 3330,4 -3420,1 -11390429,8 BZ 24170,2 16371,7 5861,0 3965,2 23240053,2

: : :

(12)

Linterpretazione di r

X

Y

r=1

X

Y

r=-1

X

Y

r=0

X

Y

r=0

Indipendenza ⇒ r=0

Indipendenza r=0 ⇒

Assenza di

correlazione lineare

r=0

(13)

Proprietà del coefficiente di

correlazione r

(14)

Province italiane Gruppo

1 (38) 2 (8) 3 (21) 4 (36)

Reddito p.c. (in €) 35000 30000 25000 20000 15000 10000 5000 0

Consumi p.c. (in)

25000

20000

15000

10000

5000

0

Reddito p.c. (in €) 35000 30000 25000 20000 15000 10000 5000 0

Mortalità infantile (per 1000 nati vivi)

14

12

10

8

6

4

2 0

Prezzo casa al mq (in €) 3000 2000

1000 0

Morti (per 1000 ab.)

16

14

12

10

8

6

La correlazione

(15)

ESERCIZIO 1

(16)

ESERCIZIO 1

(17)

ESERCIZIO 1

(18)

ESERCIZIO 1

(19)

ESERCIZIO 1

(20)

ESERCIZIO 1

(21)

ESERCIZIO 2

(22)

ESERCIZIO 2

(23)

ESERCIZIO 2

(24)

Dove e come studiare

Esercizio n. 2

File “esercizi statistiche bivariate.pdf”

T3: Test di autovalutazione

(domande 1, 2, 3, 5, 7, 8, 11, 15, 19, 20, 21)

•  S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill. Paragrafo 6.9

•  D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.

Paragrafo 7.5

(25)

ü  Analisi della interdipendenza tra due caratteri quantitativi ü  Codevianza

ü  Covarianza

ü  Coefficiente di correlazione

Riepilogo

Riferimenti

Documenti correlati

Il controllo antecedente consiste nel verificare l’adeguatezza dei programmi di gestione rispetto agli obiettivi della pianificazione strategica.. Il controllo concomitante

Le Direzioni Funzionali sono specializzate nelle singole aree di competenza (Finanza, Produzione , Personale, … ) Le Unità Operative hanno compiti esecutivi nell’ambito di

La produzione dell ’ ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi.

L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a

La casualità interviene nella selezione delle unità e si ottiene attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere

Un sistema informativo aziendale deve raccogliere, processare, immagazzinare e distribuire informazione al fine di facilitare i processi di pianificazione, decisione

Il 5% dei pneumatici prodotti dal turno di giorno erano difettosi, mentre la percentuale di prodotti difettosi era pari al 10% di quelli prodotti dal turno di sera e al 20% di

Nello studio delle relazioni tra due (o più) variabili, oltre a misurare l’entità (o forza) del legame esistente, spesso si è anche interessati ad accertare come varia una di esse