• Non ci sono risultati.

Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014

N/A
N/A
Protected

Academic year: 2022

Condividi "Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014"

Copied!
46
0
0

Testo completo

(1)

internazionali - a.a. 2013-2014

(2)

Il campionamento e linferenza

Campione

Popolazione

Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la

popolazione da cui essi sono stati prescelti

(3)

Il campionamento

Pop

C

Estrazione casuale

Inferenz a

Si definisce campionamento un procedimento attraverso il quale da un insieme di unità costituenti loggetto dello studio, si estrae un numero ridotto di casi scelti con criteri tali da consentire la generalizzazione allintera

popolazione dei risultati ottenuti.

(4)

Il campionamento e linferenza

 Il campione deve essere rappresentativo della popolazione

Ä campionamento casuale

 Il calcolo delle probabilità esamina i risultati che si ottengono sotto l ’ influenza del caso

Campione

Popolazione

Calcolo delle probabilità

(5)

Il campionamento probabilistico

Le unità sono scelte in modo casuale (ma non “ a casaccio ” !).

La casualità interviene nella selezione delle unità e si ottiene attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere selezionata.

Quando la probabilità di estrazione, oltre ad essere nota, è posta uguale per tutte le unità, si parla di campionamento casuale semplice.

In particolare, la casualità interviene nella selezione delle unità e si ottiene:

attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere selezionata;

a.

utilizzando in modo appropriato le tecniche per la selezione.

b.

(6)

Campionamento casuale con reintroduzione

Ogni elemento che viene estratto viene reintrodotto nella popolazione in modo tale che ad ogni estrazione

successiva non venga alterata la composizione della popolazione ed ogni elemento estratto ha sempre la stessa probabilità di venire scelto.

ü Probabilità di estrazione di ciascun elemento:

ü Universo campionario

(o bernoulliano)

1

N , 1

N ,..., 1 N

N n

(7)

Si consideri la popolazione costituita da N=4 quattro

ipermercati A, B, C, D. Le vendite effettuate da ciascuno di essi nel periodo 01/01/04-31/12/04 sono riportate nella

seguente tabella:

Ipermercato A B C D

Vendite (in miliardi di lire) 4 1 3 2

Un esempio

(8)

Campioni di ampiezza 2 estratti con ripetizione

•  Universo dei campioni (n=2) estratti con ripetizione: 4

2

Numero del campione

Primo Elemento

Secondo Elemento

1 4 4

2 4 1

3 4 3

4 4 2

5 1 4

6 1 1

7 1 3

8 1 2

9 3 4

10 3 1

11 3 3

12 3 2

13 2 4

14 2 1

15 2 3

16 2 2

Esempio X 1 X 2

(9)

Campionamento casuale senza reintroduzione

Ogni elemento, una volta estratto, non viene reimmesso nella popolazione per cui, dopo ogni estrazione, la

probabilità che gli elementi restanti entrino a far parte del campione viene modificata.

ü Probabilità di estrazione di ciascun elemento

ü Universo campionario

(o esaustivo)

N ⋅ N −1 ( ) ... N ( − n +1 ) = ( N N ! − n ) !

1 ,..., 1

1 , 1

1

+

N n

N

N

(10)

•  Universo dei campioni (n=2)

estratti senza ripetizione:

Numero del campione

Primo Elemento

Secondo Elemento

1 4 1

2 4 3

3 4 2

4 1 4

5 1 3

6 1 2

7 3 4

8 3 1

9 3 2

10 2 4

11 2 1

12 2 3

4!

4 − 2

( ) ! = 12

⎝⎜

⎠⎟

Campioni di ampiezza 2 estratti senza ripetizione

Esempio

X 1 X 2

(11)

Il campionamento

Un campione casuale di n elementi estratto da una v.c. X è rappresentato dalle n v.c X

1

, X

2

, …, X

n

dove X

i

è la i-esima

estrazione della v.c. X

( ) ( ) ( )

x N x

x

n

1

X P ...

X P X

P

i

=

1

=

i

=

2

= =

i

= =

Popolazione: Altezza X degli studenti presenti in aula durante la lezione di Statistica X

1

: Altezza del primo studente da estrarre

X

2

: Altezza del secondo studente da estrarre

X

i

: Altezza dell ’ i-esimo studente da estrarre

X

n

: Altezza dell ’ n-esimo studente da estrarre

(12)

Il campionamento

Ogni v.c. X

1

, X

2

, …, X

n

ha la stessa funzione di densità di probabilità f(x

i

) che sarà uguale alla f(x) della popolazione originaria

Dopo aver effettuato l ’ esperimento, la determinazione numerica è rappresentata da n numeri reali x

1

, x

2

, …, x

n

che rappresentano il campione osservato

Ogni x

i

è la realizzazione di una v.c X

i

detta v.c. della i-esima estrazione Popolazione X~N( m , s )

v.c. X

1

~N( m , s ) ………….

v.c. X

i

~N( m , s ) …………

v.c. X

n

~N( m , s )

(13)

Processo inferenziale

Ø Inferenza: utilizza statistiche del campione per

effettuare la stima dei corrispondenti veri valori della popolazione

Ø In pratica, viene selezionato a caso dalla popolazione un campione unico di ampiezza predeterminata

Ø Bisognerebbe prendere in esame ogni campione che avrebbe potuto manifestarsi

Distribuzioni campionarie

(14)

Si consideri la popolazione costituita da N=4 quattro

ipermercati A, B, C, D. Le vendite effettuate da ciascuno di essi nel periodo 01/01/04-31/12/04 sono riportate nella

seguente tabella:

Ipermercato A B C D

Vendite (in miliardi di lire) 4 1 3 2

( 4 1 3 2 ) 2 5

4

1 + + + = ,

= µ

12 ,

= 1

σ

Un esempio

(15)

Estrazione casuale di un campione di 2 supermercati

Ipermercato B C

Vendite (in miliardi di lire) 1 3 ( ) 1 3 2

2

1 + = µ =

4

3 2

1

Estrazione casuale di un campione di 2 supermercati

( ) 4 1 2 , 5

2

1 + = µ =

Ipermercato A B

Vendite (in miliardi di lire) 4 1

Un esempio

(16)

Campioni di ampiezza 2 estratti con ripetizione

•  Universo dei campioni (n=2) estratti con ripetizione: 4

2

Numero del campione

Primo Elemento

Secondo Elemento

Media Campionaria

1 4 4 4,0

2 4 1 2,5

3 4 3 3,5

4 4 2 3,0

5 1 4 2,5

6 1 1 1,0

7 1 3 2,0

8 1 2 1,5

9 3 4 3,5

10 3 1 2,0

11 3 3 3,0

12 3 2 2,5

13 2 4 3,0

14 2 1 1,5

15 2 3 2,5

16 2 2 2,0

( ) 2,5

E X = = µ

( ) 0,79 1,12 2

sqm X = =

Esempio X

(17)

Campioni di ampiezza 2 estratti con ripetizione

Media Campionaria

4,0 2,5 3,5 3,0 2,5 1,0 2,0 1,5 3,5 2,0 3,0 2,5 3,0 1,5 2,5 2,0

0 0,5 1 1,5 2 2,5 3 3,5 4 4,5

1 1,5 2 2,5 3 3,5 4

Esempio

(18)

•  Universo dei campioni (n=2)

estratti senza ripetizione:

Numero del campione

Primo Elemento

Secondo Elemento

Media Campionaria

1 4 1 2,5

2 4 3 3,5

3 4 2 3,0

4 1 4 2,5

5 1 3 2,0

6 1 2 1,5

7 3 4 3,5

8 3 1 2,0

9 3 2 2,5

10 2 4 3,0

11 2 1 1,5

12 2 3 2,5

4!

4 − 2

( ) ! = 12

⎝⎜

⎠⎟

Campioni di ampiezza 2 estratti senza ripetizione

( ) 2,5

E X = = µ

( ) 0,64 1,12 2 2 3

sqm X = =

Esempio

(19)

V.C. Media Campionaria

n v.c X

1

∼N(µ,σ) …. X

n

∼N(µ,σ) 1° campione

x

1

…. x

n

x

2° campione

x′

1

…. x′

n

x′

3° campione

x′′

1

…. x′′

n

x′′

…….. tutti i possibili campioni dell’universo campionario

•  Popolazione X~N( m ,s )

•  Campioni casuali di n elementi:

X

v.c.

(20)

Popolazione Parametri Valori fissi, spesso non noti

Campione Statistiche Stimatori o

Variabili casuali, le cui determinazioni

dipendono dalle particolari osservazioni scelte

Parametri e statistiche

(21)

Ø Parametri: valori caratteristici della popolazione Ø Statistiche o v.c. campionarie o stimatori o

statistiche test: funzioni delle osservazioni campionarie Ø Statistica calcolata o stima: numero ottenuto

applicando la statistica al campione osservato

Ø Distribuzione campionaria: valori che la statistica

assume al variare del campione nell ’ universo campionario

Parametri e statistiche

(22)

Distribuzioni campionarie

Le conclusioni inferenziali, basate sull ’ unico campione osservato, devono essere giudicate sulla base della distribuzione di probabilità dei possibili campioni che potevano essere generati e dei quali quello osservato

costituisce una realizzazione particolare.

(23)

Campionamento con reintroduzione

Campionamento senza reintroduzione

Popolazione non finita

( ) X

E = µ

( ) X

Var n

= σ

Popolazione finita E ( ) X = µ

( ) X

Var n

= σ

( ) X

E = µ

( ) X N n 1

Var n N

σ −

= −

Riepilogo sulla v.c. media campionaria

(24)

V.C. Media Campionaria

•  V.C. media campionaria: medie aritmetiche calcolate su tutti i campioni appartenenti allo spazio campionario

•  Le medie variano al variare del campione estratto e, poiché i campioni sono estratti casualmente, i valori che può assumere la media campionaria sono realizzazioni di una v.c

•  La distribuzione della v.c media campionaria dipende dalla distribuzione della popolazione X

•  Quando la dimensione del campione è sufficientemente

grande, la distribuzione della media campionaria può essere approssimata alla distribuzione normale qualunque sia la

distribuzione della popolazione (Teorema del Limite

Centrale).

(25)

Teorema del limite centrale

Se X

1

, X

2

, …, X

n

sono n v.c. indipendenti con media m e varianza s

2

, la v.c X=X

1

+X

2

+…+X

n

, somma delle n v.c., può

essere approssimata con una v.c normale con media nm e varianza s

2

,se n è sufficientemente grande

Applicazioni del teorema del limite centrale

 Approssimazione normale della distribuzione della media campionaria

X N ;

σ n

⎛ µ ⎞

∼ ⎜ ⎝ ⎟ ⎠

Quando la dimensione del campione è sufficientemente grande, la distribuzione campionaria della media aritmetica può essere

approssimata dalla distribuzione normale qualunque sia la distribuzione della popolazione.

X- ( )

Z= N 0;1

n

σ µ

(26)

La distribuzione normale e la distribuzione della media campionaria

1.  Per la maggior parte delle popolazioni,

indipendentemente dalla forma della loro distribuzione, la distribuzione della media campionaria è

approssimativamente normale, purché si considerino campioni di almeno 30 osservazioni.

2.  Se la distribuzione della popolazione è abbastanza

simmetrica, la distribuzione della media campionaria è approssimativamente una normale, purché si considerino campioni di almeno 15 osservazioni.

3.  Se la popolazione ha una distribuzione normale, la media campionaria è distribuita secondo la legge normale,

indipendentemente dall ’ ampiezza del campione.

(27)

>30? n X~N?

s noto?

NO NO

NO SI SI

SI

?

1

X-

t

n

s n µ

X N ;

σ n

⎛ µ ⎞

∼ ⎜ ⎝ ⎟ ⎠

Riepilogo sulla v.c. media campionaria

(28)

V.C. t e Z

0

(29)

-

V.C. t

(30)

Esercizio sulla v.c. Media Campionaria

Nell'azienda Package i sacchetti di carta utilizzati per contenere generi alimentari sono prodotti in modo che il carico di resistenza del sacchetto si distribuisca normalmente con una media

aritmetica di 352 grammi per centimetro quadrato e s.q.m. di 70 grammi per centimetro quadrato.

a) Calcolare la probabilità che i sacchetti prodotti abbiano carico di resistenza tra 352 e 386 grammi per centimetro quadrato.

b) Selezionando un campione casuale di 16 sacchetti dalla

produzione dell'azienda, calcolare la probabilità che il carico di

resistenza medio calcolato sul campione sia compreso tra 352 e

386 grammi per centimetro quadrato.

(31)

Esercizio sulla v.c. Media Campionaria

•  X: carico di resistenza del sacchetto X~ N(352; 70)

• 

•  P(352<X<386) ??

70

− 352

= X Z

( ) ( )

18793 .

0

49 . 0 70 0

352 386

70 352 386 352

352

=

=

<

<

⎟ =

⎜ ⎞

⎛ − < < −

=

<

< X P Z P Z

P

⎟ ⎠

⎜ ⎞

16

; 70 352

~ X N

a)

b)

( ) ( )

47381 .

0

94 . 1 0

70 16

352 386

70 16

352 386 352

352

=

=

<

<

⎟ =

⎟ ⎟

⎜ ⎜

⎛ − < < −

=

<

< X P Z P Z

P

(32)
(33)

V.c. Proporzione Campionaria

( )

( )

X B ∼ n π ; n π 1 − π

( 1 )

X B ;

n n

π π

⎛ π − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠

•  : numero di successi in n prove

•  : proporzione di successi in n prove

p à proporzione di successi nella popolazione

p à proporzione di successi in un campione di ampiezza n

N=2

Esperimento: estrazione casuale di due palline

X: numero di palline rosse in 2 estrazioni

(34)

V.c. Proporzione Campionaria

N=2

Esperimento: estrazione casuale con ripetizione di due palline

X: numero di palline rosse in 2 estrazioni p Prob.

1 2

1 2 0 1

1 4

1 4

1 4 1 4

1 2 π =

( ) 1 2

E P = = π

( ) 1 ( 1 )

Var P 8

n π − π

= =

(35)

V.c. Proporzione Campionaria

( )

( )

X B ∼ n π ; n π 1 − π

( 1 )

X B ;

n n

π π

⎛ π − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠

•  : numero di successi in n prove

•  : proporzione di successi in n prove

p à proporzione di successi nella popolazione

p à proporzione di successi in un campione di ampiezza n P: v.c proporzione campionaria

( 1 )

P ;

n N

n

π π

→∞ π

⎛ − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠ Z= P - ( ) ( ) 0;1

1 N

n π

π − π

(36)

Teorema del limite centrale

Se X

1

, X

2

, …, X

n

sono n v.c. indipendenti con media m e varianza s

2

, la v.c X=X

1

+X

2

+…+X

n

, somma delle n v.c., può essere approssimata con una v.c normale

con media n m e varianza s

2

Applicazioni del teorema del limite centrale

‚ Approssimazione normale della distribuzione binomiale (Teorema di De Moivre-Laplace)

Quando la dimensione del campione è sufficientemente grande, la distribuzione di un v.c binomiale può essere approssimata dalla

distribuzione normale con parametri np e npq

( )

X N ∼ np npq , Z X np Z ( ) 0,1

npq

= − ∼

(37)

Teorema del limite centrale

Se X

1

, X

2

, …, X

n

sono n v.c. indipendenti con media m e varianza s

2

, la v.c X=X

1

+X

2

+…+X

n

, somma delle n v.c., può essere approssimata con una v.c normale

con media n m e varianza s

2

Applicazioni del teorema del limite centrale

ƒ Approssimazione normale della distribuzione binomiale relativa (Teorema di De Moivre-Laplace)

Quando la dimensione del campione è sufficientemente grande, la distribuzione di un v.c binomiale relativa può essere approssimata

dalla distribuzione normale

X N , n

p pq n

⎛ ⎞

∼ ⎜ ⎝ ⎟ ⎠

( ) X n p ( ) 0,1

Z Z

pq n

= − ∼

(38)

V.c. Proporzione Campionaria

•  Campionamento con ripetizione

( 1 )

P ;

n N

n

π π

→∞ π

⎛ − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⎟ ⎠

•  Campionamento senza ripetizione

( 1 )

; 1

n

P N N n

n N

π π

→∞ π

⎛ − − ⎞

⎜ ⎟

∼ ⎜ ⎝ ⋅ − ⎟ ⎠

(39)

Esercizio 1

(40)
(41)

Esercizio 2

(42)
(43)
(44)
(45)

Dove e come studiare

File “esercizi variabili casuali e distribuzioni campionarie.pdf”

•  S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill. Cap. 10 (escluso paragrafi 10.3.2, 10.3.3).

•  D. Piccolo (2004) – Statistica per le decisioni – Il Mulino. Cap. 11

(escluso paragrafi 11.4, 11.5), Cap. 12 (escluso paragrafi 12.7, 12.8).

(46)

Le distribuzioni campionarie

ü  Popolazione e campione

ü  Il campionamento nell’inferenza ü  Il campionamento casuale semplice

ü  Il campionamento casuale con reintroduzione ü  Il campionamento casuale senza reintroduzione ü  Le distribuzioni campionarie

ü  La variabile casuale media campionaria

ü  La variabile casuale proporzione campionaria ü  La v.c T di Student

ü  Il teorema del Limite Centrale

ü  Applicazioni del Teorema del Limite Centrale

ü  Approssimazione normale della distribuzione binomiale

ü  Approssimazione normale della distribuzione binomiale relativa

Riepilogo

Riferimenti

Documenti correlati

Giuseppe Liotta (Università degli Studi di Palermo) La responsabilità per danni nello sport.

Il corso di laurea magistrale in Scienze delle amministrazioni e delle organizzazioni complesse si propone di fare acquisire agli studenti, poi laureati nella classe,

La produzione dell ’ ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi.

L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a

Un sistema informativo aziendale deve raccogliere, processare, immagazzinare e distribuire informazione al fine di facilitare i processi di pianificazione, decisione

Il 5% dei pneumatici prodotti dal turno di giorno erano difettosi, mentre la percentuale di prodotti difettosi era pari al 10% di quelli prodotti dal turno di sera e al 20% di

Nello studio delle relazioni tra due (o più) variabili, oltre a misurare l’entità (o forza) del legame esistente, spesso si è anche interessati ad accertare come varia una di esse

ü  Analisi della interdipendenza tra due caratteri quantitativi ü  Codevianza.