• Non ci sono risultati.

Interpretare l’associazione

N/A
N/A
Protected

Academic year: 2021

Condividi "Interpretare l’associazione"

Copied!
37
0
0

Testo completo

(1)

STATISTICA

Regressione-1

(2)

Associazione

Voto per Macron e tasso di disoccupazione Appartenenza etnica e preferenze politiche

Esposizione ad una data sostanza e insorgenza di malattie

Metodo colturale e qualità della produzione Dimensione del cervello e QI

Livello sociale della famiglia e riuscita scolastica dei figli

Genere e percorso di studi

ENTRAMBE LE VARIABILI QUALITATIVE:

TABELLE DI CONTINGENZA

(3)

Interpretare l’associazione

L’associazione da sola non implica una diretta

relazione di causa- effetto.

L’associazione può essere causata da una terza variabile non osservata.

(4)

Interpretare l’associazione

L’associazione da sola non implica una diretta relazione

di causa-effetto.

L’associazione può essere causata da una terza variabile non osservata.

Tumore No tumore Uso pillola

Non uso pillola

(5)
(6)

A questo proposito, gli studi su chi lavora di frequente facendo turni di notte hanno evidenziato

che lo sfasamento dei ritmi circadiani può portare a una maggiore frequenza di malattie

anche gravi, come diabete di tipo 2 e disturbi

cardiocircolatori. Se poi si tratti soltanto di correlazioni

oppure di fattori causali è ancora da stabilire

(7)

Correlazione

Voto per Macron e tasso di disoccupazione Appartenenza etnica e preferenze politiche

Esposizione ad una data sostanza e insorgenza di malattie

Metodo colturale e produzione Dimensione del cervello e QI

Livello sociale della famiglia e riuscita scolastica dei figli

Genere e percorso di studi

ENTRAMBE LE VARIABILI QUANTITATIVE:

ANALISI DI REGRESSIONE

(8)

Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23]

Il voto francese

Elezioni francesi 2017

Stipendio medio orario Voto per Le Pen 2013

(9)

Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23]

Stipendio medio orario Voto per Le Pen 2013

Il voto francese

Elezioni francesi 2017

• I due fenomeni sono correlati?

• Se aumenta lo stipendio, che ne è del voto per Marine Le Pen?

(10)

Obiettivo generale

x Y

(11)

Obiettivo generale

x Y

previsione di y da x è possibile

≈ ( )

(12)

Obiettivo generale

x Y

previsione di y da x non è

possibile

(13)

Obiettivo generale

x Y

Un modello per la

previsione di una variabile in funzione di un’altra variabile, :

≈ ( )

x Y

(14)

Obiettivo specifico

Il modello della regressione lineare

semplice:

(15)

Obiettivo specifico

= +

Il modello della regressione lineare

semplice:

= +

≈ ⟺ ~ ( , )

= + +

Supponiamo l’esistenza di una associazione, nella

popolazione di riferimento, tra la variabile e la variabile ,

che si possa approssimare con una relazione lineare a meno di un errore casuale. Dal campione vogliamo stimare l’equazione della retta e la varianza dell’errore.

(16)

= +

≈ ⟺ ~ ( , )

= + +

Obiettivo specifico

= +

Il modello della regressione lineare

semplice:

altezza

peso

IL PESO DIPENDE

DALL’ALTEZZA, MA ANCHE DA ALTRI FATTORI INDIVIDUALI,

CHE CI SCOSTANO DALLA RETTA

Supponiamo l’esistenza di una associazione, nella

popolazione di riferimento, tra la variabile e la variabile , che si possa approssimare con una relazione lineare a meno di un errore casuale. Dal campione vogliamo stimare l’equazione della retta e la varianza dell’errore.

(17)

Regressione lineare

1.GRAFICO di dispersione

A. Valutazione preliminare se una retta possa essere una buona

approssimazione

(18)

Regressione lineare

2. Indici opportuni

1.GRAFICO di dispersione

A. Valutazione preliminare se una retta possa essere una buona

approssimazione

(19)

La covarianza

65 70 75

120140160180

altezza

peso

, ,

grafico di

dispersione attorno

al

baricentro (centroide)

(20)

La covarianza

− − >

, ,

65 70 75

120140160180

altezza

peso

(21)

La covarianza

,

,

65 70 75

120140160180

altezza

peso

− − <

(22)

La covarianza

sono tanti

sono pochi

65 70 75

120140160180

altezza

peso

− − >

− ̅ − < 0

− ̅ − > 0

(23)

La covarianza

-180-160-140-120 − − <

(24)

La covarianza

= , = ∑ − −

65 70 75

120140160180-180-160-140-120

= , = − ×

, > quando tende a crescere fa lo stesso

, < quando tende a crescere tende a decrescere

(25)

La covarianza

= , = ∑ − ̅ −

, =

65 70 75

100120140160180200

= ×

= , = − ×

(26)

(Contro)Esempio

X -2 -1 0 1 2

Y 4 1 0 1 4

XY -8 -1 0 1 8

-2 -1 0 1 2

01234

x1

y1

̅ = 0

= 2 1

5 = 0!

= 5

=

× =

(27)

(Contro)Esempio

X -2 -1 0 1 2

Y 4 1 0 1 4

XY -8 -1 0 1 8

̅ = 0

= 2 1

5 = 0!

= 5

× =

-2 -1 0 1 2

01234

x1

y1

=

assenza di correlazione

lineare…

ma chiara correlazione

quadratica!

(28)

La correlazione lineare

= , = ∑ − −

( , ) > 0 , < 0

, = 0

= , = 1

− ̅ ×

− ≤ ≤

=

− ≤ ≤

coeff. di correlazione

lineare

> 0

< 0

= 0

(29)

La correlazione lineare

A spanne…

Valore di | | Interpretazione

fine Meno fine

0.90 - 1.00 Molto alta

forte (talvolta 0.5->0.6)

0.70 - 0.90 Alta

0.50 - 0.70 Moderata

0.30 - 0.50 Bassa moderata

0.00 - 0.30 Poca o non

correlazione > 0.10 debole

Hinkle, Wiersma, & Jurs (2003). Applied Statistics for the Behavioral Sciences (5th ed.).

(30)

1300000 1400000 1500000 1600000

8000008500009000009500001000000

2000-2016

PIL Italia

Spesa per consumi individuali Italia

Esempio 1

= 0.9897893 Istat (2017)

Conti e aggregati economici

nazionali annuali

Spese per consumi finali delle famiglie http://dati.istat.it/

(31)

L’indice non basta

20 40 60 80 100

1 2 3 4

5 =0.87

20 40 60 80 100

1 2 3 4 5

(32)

Regressione lineare

B. Stima dei parametri della retta

A. Valutazione preliminare se una retta possa essere una buona

approssimazione

(33)

66 68 70 72

140150160170180

= =

∑ ( − ̅)( − )

∑ ( − ̅)

La retta di regressione

= − ̅

Di tutte le rette = + quella che passa più vicino a tutti i punti, nel senso dei minimi quadrati, è quella con coeff. e

che rendono minima la quantità:

Y

X ( ̅, )

( , )

( , )

( − ) = [ − ( + )]

(34)

85 90 95 100 105 110

960000980000100000010200001040000

2010-2016

Clima di fiducia

Spesa per consumi individuali Italia

1300000 1400000 1500000 1600000

8000008500009000009500001000000

2000-2016

PIL Italia

Spesa per consumi individuali Italia

La retta di regressione

= −52723.36

= 0.642176

= 896307.76

= 1086.972

(35)

1300000 1400000 1500000 1600000

8000008500009000009500001000000

2000-2016

PIL Italia

Spesa per consumi individuali Italia

La retta di regressione

= 1450000

= −52723.36 + 0.642176

× 1450000

= 878432.9

= −52723.36

= 0.642176

= 896307.76

= 1086.972

(36)

85 90 95 100 105 110

960000980000100000010200001040000

2010-2016

Clima di fiducia

Spesa per consumi individuali Italia

La retta di regressione

= 105 ⇒

= 896307.760

+ 1086.972 × 105

= 1010440

= −52723.36

= 0.642176

= 896307.76

= 1086.972

(37)

1300000 1400000 1500000 1600000

8000008500009000009500001000000

2000-2016

PIL Italia

Spesa per consumi individuali Italia

La retta di regressione

Riferimenti

Documenti correlati

Our approach included four steps: (1) by applying the binary dyadic dominance relationship method (I&amp;SI) on either aggressions or supplant sociomatrices we verified

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella

E’ stata approvata la Delibera Regionale attuativa della Garanzia Giovani..

Il meccanismo dell’elezione presidenziale voluto da de Gaulle e dai suoi costituzionalisti aveva notoriamente l’obiettivo di costituire un potere esecutivo che, pur

Secondo l’ Autorità Euro- pea per la Sicurezza Alimentare (EFSA)[2] i forti consumatori di riso in Europa, come per esempio determinati gruppi etnici e i bambini di età inferiore

S CHEDA PER IL COLLEGAMENTO CON LE STRUTTURE TERRITORIALI O RESIDENZIALI O ALTRI FORNITORI D ' ASSISTENZA PER IL TRATTAMENTO DELLE L ESIONI DA D ECUBITO (LDD).. Cognome

Con particolare riguardo all’ultima specificazione del modello, si segnalano gli effetti prodotti in termini di punti percentuali sul tasso di disoccupazione relativi

Il Decreto ministeriale 19 aprile 2000 ha fissato nella misura del 9,50%, a decorrere dal 22 marzo 2000, il tasso di interesse dovuto dai datori di lavoro per le rateazioni e