• Non ci sono risultati.

1520253035Voto per Macron (%)

N/A
N/A
Protected

Academic year: 2021

Condividi "1520253035Voto per Macron (%)"

Copied!
75
0
0

Testo completo

(1)

STATISTICA

Regressione-4

ovvero… Macron!

(2)

Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23]

Stipendio medio orario 2013 Voto per Le Pen

Eravamo partiti da qui…

(3)

Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23]

Eravamo partiti da qui…

• I due fenomeni sono collegati?

• Se aumenta lo stipendio, che ne è del voto per Le Pen?

Stipendio medio orario 2013 Voto per Le Pen

(4)
(5)
(6)

“Macron ha avuto tanti più voti tanto più era

basso il tasso di disoccupazione”

(7)

“La correlazione tra il tasso di

disoccupazione

ed il voto per Macron, per Dipartimento”

(i Dip. sono circa 100)

(8)

“La correlazione tra il tasso di

disoccupazione

ed il voto per Macron, per Dipartimento”

= . ⇔

= .

(9)
(10)

“Nei Dipartimenti dove la

disoccupazione è sopra il 12% Marine Le Pen va intorno al 30% dei voti.”

(11)

6 8 10 12 14 16

1520253035

Disoccupazione (%)

Voto per Macron (%)

http://www.la-croix.com/France/Politique/Election-presidentielle-2017-carte-resultats-2017-04-23-1200841661

= 0.598

“Prevede” il voto in funzione del tasso di

disoccupazione

“Prevede” la

disoccupazione in funzione del voto…

(12)

6 8 10 12 14 16

1520253035

Disoccupazione (%)

Voto per Macron (%)

http://www.la-croix.com/France/Politique/Election-presidentielle-2017-carte-resultats-2017-04-23-1200841661

= 0.36

“Prevede” la

disoccupazione in funzione del voto…

“Prevede” il voto in funzione del tasso di

disoccupazione

(13)

I datiR

• Il voto, per dipartimenti:

http://www.la-croix.com/France/Politique/Election-

presidentielle-2017-carte-resultats-2017-04-23-1200841661

• Tasso di disoccupazione, 4o trimestre 2016:

https://www.insee.fr/fr/statistiques/2012804#tableau- TCRD_025_tab1_departements

(14)

Analisi completa

6 8 10 12 14 16

1520253035

Tasso di disoccupazione (%)

Voto per Macron(%)

̅ = 9.65

= 23.05

= 3.17

= 11.78

= 3.73

= .

(15)

Analisi completa

6 8 10 12 14 16

1520253035

Tasso di disoccupazione (%)

̅ = 9.65

= 23.05

= 3.17

= 11.78

= 3.73

= .

= ( . ) = .

= 3.73

3.17 = .

= 23.05 + 1.18 × 9.65

= .

Voto per Macron(%)

(16)

Analisi completa

0 20 40 60 80

-50510

= .

= .

= .

(17)

6 8 10 12 14 16

1520253035

Analisi completa

Tasso di disoccupazione (%)

Voto per Macron(%)

(18)

Analisi completa

6 8 10 12 14 16

1520253035

Tasso di disoccupazione (%)

= 3.17

= 0.37

= .

= 34.44

= .

=

1.18

96 × 3.177.72

= 7.41

Voto per Macron(%)

> ( ) ≈ !!

∶ =

(19)

Analisi completa

6 8 10 12 14

20253035Voto per Macron(%)

Tasso di disoccupazione (%)

IC(95%) per le previsioni

(20)

Analisi completa

6 8 10 12 14

20253035Voto per Macron(%)

Tasso di disoccupazione (%)

IC(95%) per le previsioni

= 0.37 ‼‼

(21)

Macron e lo stipendio!

Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23]

Stipendio Voto per Macron

(22)
(23)

“E’ un po’ meno forte qui la correlazione”

“Quel puntino in alto è Parigi”

= . ⇔ = 0.45

(24)

“E’ un po’ meno forte qui la correlazione”

“Quel puntino in alto è Parigi”

= . ⇔ = 0.45

(25)

“E’ un po’ meno forte qui la correlazione”

“Quel puntino in alto è Parigi”

= . ⇔ = 0.45

(26)

Stipendio medio orario

2013

Macron e lo stipendio

121416182022

(27)

12 14 16 18 20 22

152025303540

Stipendio medio/h 2013

Voto per Macron (%)

= .

Macron e lo stipendio

(28)

12 14 16 18 20 22

152025303540

Stipendio medio/h 2013

Voto per Macron (%)

= .

Macron e lo stipendio

influenti

?

outlier?

(29)

12 14 16 18 20 22

152025303540

Stipendio medio/h 2013

Voto per Macron (%)

= .

Macron e lo stipendio

(30)

12 14 16 18 20 22

152025303540

Stipendio medio/h 2013

Voto per Macron (%)

= .

Facciamo un salto in R

Non è un diagramma di

dispersione che suggerisca di interpolare con una retta!

(31)

Esercizio 3

Variabile Coeff. Dev. std. Statistica t

p-value Intercetta 3.8199 9.0891 0.420 0.677

2.0642 0.3029 6.816 0

(32)

Esercizio 3

Variabile Coeff. Dev. std. Statistica t

p-value

Intercetta 3.8199 9.0891 0.420 0.677

2.0642 0.3029 6.816 0

= 3.8199 + 2.0642 +

(33)

Esercizio 3

valori della statistica per i due test d’ipotesi

∶ = 0 e ∶ = :

∑ ( )

= .

1 + ̅

∑ ( )

= 0.42

Variabile Coeff. Dev. std. Statistica t

p-value

Intercetta 3.8199 9.0891 0.420 0.677

2.0642 0.3029 6.816 0

= 3.8199 + 2.0642 +

(34)

Esercizio 3

valori del denominatore nella statistica per i due test

= 0

e ∶ = 0 :

∑ ( )

1 + ̅

∑ ( )

Variabile Coeff. Dev. std. Statistica t

p-value

Intercetta 3.8199 9.0891 0.420 0.677

2.0642 0.3029 6.816 0

9.0891

0.3029

(35)

Esercizio 3

valori del denominatore nella statistica per i due test

= 0

e ∶ = 0 :

∑ ( )

1 + ̅

∑ ( )

. =

Variabile Coeff. Dev. std. Statistica t

p-value Intercetta 3.8199 9.0891 0.420 0.677

2.0642 0.3029 6.816 0

(36)

Esercizio 3

valori della statistica per i due test d’ipotesi

∶ = 0 e ∶ = :

∑ ( )

= .

1 + ̅

∑ ( )

= 0.42

Variabile Coeff. Dev. std. Statistica t

p-value

Intercetta 3.8199 9.0891 0.420 0.677

2.0642 0.3029 6.816 0

= 3.8199 + 2.0642 +

(37)

Variabile Coeff. Dev. std. Statistica t

p-value

Intercetta 3.8199 9.0891 0.420 0.677

2.0642 0.3029 6.816 0

Esercizio 3

p-value per i due test d’ipotesi

∶ = 0 e ∶ = 0

1. Intercetta: non rifiutiamo ∶ = 0

2. : rifiutiamo ∶ = 0 a qualunque livello di

significatività, la regressione è significativa

(38)

Esercizio 2, ripreso da lezione del 31/05

due campioni indipendenti : = ∶ >

~ ( , ) QI uomini

~ , QI donne

Durante uno studio sul quoziente intellettivo un gruppo di 20 uomini scelti a caso ed uno di 20 donne scelte a caso sono stati sottoposti ad un test per la misura del QI ottenendo i seguenti punteggi medi: ̅ = 115 e ̅ = 111.9, con le rispettive varianze: = 624.31 e = 561.04.

b) C’è abbastanza evidenza nei dati per poter affermare che gli uomini hanno un QI medio superiore a quello delle donne?

̅ = 115 > ̅ = 111.9 ⇒ test

(39)

Esercizio 2

̅ ̅

1 + 1 = 115 111.9 592.675 × 2

20

= 0.40

Durante uno studio sul quoziente intellettivo un gruppo di 20 uomini scelti a caso ed uno di 20 donne scelte a caso sono stati sottoposti ad un test per la misura del QI ottenendo i seguenti punteggi medi: ̅ = 115 e ̅ = 111.9, con le rispettive varianze: = 624.31 e = 561.04.

b) C’è abbastanza evidenza nei dati per poter affermare che gli uomini hanno un QI medio superiore a quello delle donne?

: = ∶ > = 592.675

Calcoliamo il p-valore

(40)

Esercizio 2

̅ ̅

1 + 1 = 115 111.9 592.675 × 2

20

= 0.40

Durante uno studio sul quoziente intellettivo un gruppo di 20 uomini scelti a caso ed uno di 20 donne scelte a caso sono stati sottoposti ad un test per la misura del QI ottenendo i seguenti punteggi medi: ̅ = 115 e ̅ = 111.9, con le rispettive varianze: = 624.31 e = 561.04.

b) C’è abbastanza evidenza nei dati per poter affermare che gli uomini hanno un QI medio superiore a quello delle donne?

: = ∶ > = 592.675

⇒ valore: > 0.40 Indichiamo la

Statistica test con : si ha ~ (38)

(41)

( > 0.40)

.

Con riferimento a t(40):

(42)

> 0.68 = 1 0.75

.

Con riferimento a t(40):

.

> . > ( > . )

> . > .

p-valore > 0.25

Quindi non si può rifiutare l’ipotesi

nulla che QI uomini

= QI donne, in media

(43)

Esercizio 2

̅ ̅

1 + 1 = 115 111.9 592.675 × 2

20

= 0.40

Durante uno studio sul quoziente intellettivo un gruppo di 20 uomini scelti a caso ed uno di 20 donne scelte a caso sono stati sottoposti ad un test per la misura del QI ottenendo i seguenti punteggi medi: ̅ = 115 e ̅ = 111.9, con le rispettive varianze: = 624.31 e = 561.04.

b) C’è abbastanza evidenza nei dati per poter affermare che gli uomini hanno un QI medio superiore a quello delle donne?

: = ∶ > = 592.675

Indichiamo la Statistica test con : si ha ~ 38 . Essendo 38>30 posso approssimare la distribuzione di con una

normale standard: > 0.40 = 1 < 40 = 0.34458

(44)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47 63

Altra scuola 61 51

a) Scelto a caso uno degli studenti del campione, calcolare la probabilità che sia un maschio sapendo che proviene da un liceo.

b) Sottoporre a verifica l’ipotesi nulla che il genere e la scuola di provenienza siano indipendenti al livello del 2.5% di significatività c) Calcolare il -valore del test al punto b)

(45)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47 63 110

Altra scuola 61 51 112

108 114 222

a) Scelto a caso uno degli studenti del campione, calcolare la probabilità che sia un maschio sapendo che proviene da un liceo.

b) Sottoporre a verifica l’ipotesi nulla che il genere e la scuola di

provenienza siano indipendenti al livello del 2.5% di significatività.

c) Calcolare il -valore del test al punto b)

(46)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47 63 110

Altra scuola 61 51 112

108 114 222

a) Scelto a caso uno degli studenti del campione, calcolare la probabilità che sia un maschio sapendo che proviene da un liceo.

b) Sottoporre a verifica l’ipotesi nulla che il genere e la scuola di

provenienza siano indipendenti al livello del 2.5% di significatività.

c) Calcolare il -valore del test al punto b)

47

110 = 0.43

(47)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47 63 110

Altra scuola 61 51 112

108 114 222

a) Scelto a caso uno degli studenti del campione, calcolare la probabilità che sia un maschio sapendo che proviene da un liceo.

b) Sottoporre a verifica l’ipotesi nulla che il genere e la scuola di

provenienza siano indipendenti al livello del 2.5% di significatività.

(48)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47 63 110

Altra scuola 61 51 112

108 114 222

a) Scelto a caso uno degli studenti del campione, calcolare la probabilità che sia un maschio sapendo che proviene da un liceo.

b) Sottoporre a verifica l’ipotesi nulla che il genere e la scuola di

provenienza siano indipendenti al livello del 2.5% di significatività.

∶ = ∶ >

(49)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47; 53.5 63; 56.5 110

Altra scuola 61; 54.5 51; 57.5 112

108 114 222

110 × 108

222 = 53.5, 110 × 114

222 = 56.5, 112 × 108

222 = 54.5, 112 × 114

222 = 57.5

(50)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47; 53.5 63; 56.5 110

Altra scuola 61; 54.5 51; 57.5 112

108 114 222

=

( . )

.

+

( . )

.

+

( . )

.

+

( . )

.

= . + . + . + . = .

(51)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47; 53.5 63; 56.5 110

Altra scuola 61; 54.5 51; 57.5 112

108 114 222

=

( . )

.

+

( . )

.

+

( . )

.

+

( . )

.

= . + . + . + . = .

( ) . = .

(52)

Esercizio 8

Gli studenti di un corso di laurea vengono classificati sulla base di due caratteristiche: il sesso e il tipo di scuola superiore di provenienza. I dati sono riportati nella seguente tabella:

Maschi Femmine

Liceo 47; 53.5 63; 56.5 110

Altra scuola 61; 54.5 51; 57.5 112

108 114 222

=

( . )

.

+

( . )

.

+

( . )

.

+

( . )

.

= . + . + . + . = .

( ) . = .

NON POSSIAMO

RIFIUTARE L’IPOTESI DI INDIPENDENZA AL

LIVELLO DEL 2.5%

(53)

Esercizio 8

3.04 3.84

> 3.04 > > 3.84186 = 1 0.95 = 0.05

(54)

Esercizio 8

3.04 3.84

> 3.04 > > 3.84186 = 1 0.95 = 0.05

NON POSSIAMO

RIFIUTARE L’IPOTESI DI INDIPENDENZA NEANCHE

AL LIVELLO DEL 5%

(55)

Esercizio 8

3.04 3.84

> . > > 3.84186 = 1 0.95 = .

& > . < > 2.70554 = 1 0.90 = .

2.70

Il p-valore sta tra 0.05 e 0.010.

(56)

Domanda 1

Sia , … , un campione casuale con ~ ( , ) e varianza non nota. Allora, la statistica test per la verifica d’ipotesi

∶ = 0 ∶ ≠ 0 è:

a) b) ⁄

c) ⁄ d) ⁄ ⁄

(57)

Domanda 1

Sia , … , un campione casuale con ~ ( , ) e varianza non nota. Allora, la statistica test per la verifica d’ipotesi

∶ = 0 ∶ ≠ 0 è:

a) b) ⁄

c) ⁄ d) ⁄ ⁄

(58)

Domanda 2

In un test per la verifica d’ipotesi con livello di significatività 5%

si rifiuta l’ipotesi nulla. Allora:

a) Il p-valore è > 0.05 b) Il p-valore è < 0.05

c) = 0 d) ≠ 0

(59)

Domanda 2

In un test per la verifica d’ipotesi con livello di significatività 5%

si rifiuta l’ipotesi nulla. Allora:

a) Il p-valore è > 0.05 b) Il p-valore è < 0.05

c) = 0 d) ≠ 0

(60)

Domanda 3

Sia , … , un campione casuale di dimensione > 30 con distribuzione non nota. Si rifiuta l’ipotesi nulla ∶ = 0 a favore di ∶ > 0 al livello

a) se la statistica test è

> b) se la statistica test è

>

c) se la statistica test è

> ( 1) d) se la statistica test è

> ( 1)

(61)

Domanda 3

Sia , … , un campione casuale di dimensione > 30 con distribuzione non nota. Si rifiuta l’ipotesi nulla ∶ = 0 a favore di ∶ > 0 al livello

a) se la statistica test è

> b) se la statistica test è

>

c) se la statistica test è

> ( 1) d) se la statistica test è

> ( 1)

(62)

Domanda 4

Per valutare la bontà di adattamento di un modello lineare ai dati si utilizza

a) l’indice di

dispersione b) l’indice

c) l’indice d) la pendenza

(63)

Domanda 4

Per valutare la bontà di adattamento di un modello lineare ai dati si utilizza

a) l’indice di

dispersione b) l’indice

c) l’indice d) la pendenza

(64)

Domanda 5

Se due variabili qualitative osservate congiuntamente risultano essere indipendenti, allora

a) l’indice di

correlazione vale 1 b) l’indice = 0

c) l’indice = 0

d) la pendenza della retta di regressione vale 0

(65)

Domanda 5

Se due variabili qualitative osservate congiuntamente risultano essere indipendenti, allora

a) l’indice di

correlazione vale 1 b) l’indice = 0

c) l’indice = 0

d) la pendenza della retta di regressione vale 0

(66)

Domanda 6

L’errore di prima specie è

a) La probabilità di rifiutare l’ipotesi nulla quando questa è vera

b) La probabilità di rifiutare l’ipotesi nulla quando questa è falsa c) La probabilità di non

rifiutare l’ipotesi nulla quando questa è vera

d) La probabilità di rifiutare l’alternativa quando questa è vera

(67)

Domanda 6

L’errore di prima specie è

a) La probabilità di rifiutare l’ipotesi nulla quando questa è vera

b) La probabilità di rifiutare l’ipotesi nulla quando questa è falsa c) La probabilità di non

rifiutare l’ipotesi nulla quando questa è vera

d) La probabilità di rifiutare l’alternativa quando questa è vera

(68)

Domanda 7

Se il -valore di una verifica d’ipotesi vale 0.015, allora quali di queste affermazioni sono vere?

a) Si rifiuta l’ipotesi nulla al livello del 5%

b) Si rifiuta l’ipotesi nulla al livello dell’1%

c) Non si può rifiutare l’ipotesi nulla al livello del 5%

d) Non si può rifiutare l’ipotesi nulla al livello dell’1%

(69)

Domanda 7

a) Si rifiuta l’ipotesi nulla al livello del 5%

b) Si rifiuta l’ipotesi nulla al livello dell’1%

c) Non si può rifiutare l’ipotesi nulla al livello del 5%

d) Non si può rifiutare l’ipotesi nulla al livello dell’1%

Se il -valore di una verifica d’ipotesi vale 0.015, allora quali di queste affermazioni sono vere?

(70)

Domanda 8

Il coefficiente di correlazione lineare :

a) Indica il grado di associazione tra due variabili qualitative

b) Indica il grado di

dipendenza lineare tra due variabili quantitative

c) Indica la connessione tra due variabili

d) Coincide con la covarianza

(71)

Domanda 8

Il coefficiente di correlazione lineare :

a) Indica il grado di associazione tra due variabili qualitative

b) Indica il grado di

dipendenza lineare tra due variabili quantitative

c) Indica la connessione tra due variabili

d) Coincide con la covarianza

(72)

Domanda 9

Sia ~ (5, ), allora < 5 vale :

a) Non si può calcolare b) 0

c) 1 d) 0.5

(73)

Domanda 9

Sia ~ (5, ), allora < 5 vale :

a) Non si può calcolare b) 0

c) 1 d) 0.5

(74)

Domanda 10

Siano e due eventi indipendenti con la stessa probabilità, pari a 0.5. Allora

a) ∩ = 0 b) ∪ = 1

c) ∩ = 0.25 d) | = 1

(75)

Domanda 10

Siano e due eventi indipendenti con la stessa probabilità, pari a 0.5. Allora

a) ∩ = 0 b) ∪ = 1

c) ∩ = 0.25 d) | = 1

Riferimenti

Documenti correlati

Le pelofile tolleranti (7,18%) sono rappresentate quasi esclusivamente da Corbula (Varicorbula) gibba con 6,28%; Eglisia spirata e Nassarius conoidalis hanno

• I valori elevati che sono stati osservati in termini di numero di particelle indicano la necessità di affiancare tali misure a quelle della frazione di massa PM10

Le acque delle sorgenti alte (Acquaro e Pelosi) vengono convogliate mediante collettori e, dopo essere state indirizzate in una prima camera di raccolta, vengono successivamente

• Ulteriori prove di fotossidazione dell’ EDDS sono state eseguite con differenti campioni commerciali di Ti02,con un carico pari 50mg/l e a pH=2.0,i diagramma mostrano che

Calcolare media e varianza delle due variabili prima con i dati della tabella di partenza e poi con quella della tabella con quattro classi... Relazioni fra

Due variabili X e Y sono rilevate sulla stessa popolazione di n=24

La tabella percentuale seguente riporta i dati relativi a Corso di Laurea e zona di residenza di 160 studenti.. Costruire la tabella dei

Si e’ tenuto nella giornata di ieri presso la sede dell’Università degli Studi di Verona un entusiasmante e proficuo incontro tra il Presidente Nazionale e gli studenti del secondo e