• Non ci sono risultati.

ocialeStatistica SoCorso di SocialeStatistica SoCorso di SocialeStatistica SoCorso di S

N/A
N/A
Protected

Academic year: 2022

Condividi "ocialeStatistica SoCorso di SocialeStatistica SoCorso di SocialeStatistica SoCorso di S"

Copied!
24
0
0

Testo completo

(1)

Facoltà di Scienze Politiche Facoltà di Scienze Politiche

Università di Macerata Università di Macerata

Corso di

Statistica Sociale Statistica Sociale Statistica Sociale Statistica Sociale

Il campionamento Il campionamento

d t C i ti D i docente: Cristina Davino

a.a.: 2013-2014

ociale

Le indagini statistiche

Statistica So

Le indagini statistiche

Oggetto di ogni indagine statistica è la conoscenza di una

Corso di S

Oggetto di ogni indagine statistica è la conoscenza di una popolazione.

L’insieme l’aggregato di unità elementari in cui il fenomeno L insieme, l aggregato di unità elementari in cui il fenomeno allo studio si manifesta.

ò

Una popolazione può essere:

Un insieme di soggetti i clienti di un’azienda Un insieme di unità amministrative

Un insieme di stabilimenti

i Comuni Le imprese manifatturiere Una superficie

Un insieme di eventi

p f

Il territorio di una regione

I fatti criminosi in un certo periodo Un insieme di eventi I fatti criminosi in un certo periodo

Prof.ssa C. Davino

ociale

Le indagini statistiche

Statistica So

Le indagini statistiche

Ai fini di una corretta comprensione del fenomeno analizzato

Corso di S

Ai fini di una corretta comprensione del fenomeno analizzato, un universo statistico deve essere definito:

nei contenuti nello spazio nel tempo

Es.:.: Popolazione residente in Italia alla mezzanotte tra il 27 e il 28 ottobre 2001.

Data una popolazione di N unità statistiche, un campione è un insieme di n unità selezionate tra le N della popolazione un insieme di n unità selezionate tra le N della popolazione allo scopo di rappresentarla rispetto ai caratteri, o variabili, oggetto di studio.

Prof.ssa C. Davino

ociale

Le indagini campionarie

Statistica So

Le indagini campionarie

Quindi Quindi

Corso di S

Quindi Quindi……

Una parte delle unità della popolazione di riferimento

(a) p p p

viene selezionata per far parte del campione, seguendo un insieme interdipendente di regole che vengono

d i di di i

(a)

denominate disegno di campionamento;

L ità l i t i tt d i

(b) Le unità selezionate si sottopongono ad osservazione per:

(b)

Ottenere informazioni su certe caratteristiche (statistichestatistiche)

d ll l

b1)

della popolazione;

Analizzare le relazioni, semplici e complesse, che aiutino ad interpretare atteggiamenti o comportamenti dell’insieme b1)

interpretare atteggiamenti o comportamenti dell’insieme oggetto di studio.

(2)

ociale

Le indagini campionarie

Statistica So

Le indagini campionarie

Una cosa semplice?

Corso di S

p

Reclutamento intervistatori

Addestramento

intervistatori Codifica

Preparazione questionario

Indagine pilota

Revisione piano operativo

Revisione questionario

Raccolta dati

Revisione qualitativa e quantitativa

Elaborazione dati

Validazione risultati

Piano operativo preliminare

Reclutamento intervistatori

Piano campionamento

definitivo

Costruzione liste

Selezione del

campione Relazione

finale

Piano campionamento

preliminare

Verifica

Schema preliminare di relazione

Piano di analisi

Specificazione tabelle

ociale

Il dilemma

Statistica So

Il dilemma

Rilevazione Rilevazione

Corso di S

Rilevazione parziale Rilevazione

totale

Nella rilevazione totale si ha la conoscenza esatta del fenomeno

Nella rilevazione parziale si perviene ad una stima del fenomeno analizzato.

esatta del fenomeno

analizzato. del fenomeno analizzato.

D’altra parte, bisogna anche considerare:

I tempi della rilevazione;

I costi della rilevazione;

i h di d li d ll l

La ricchezza di dettagli della rilevazione;

Gli errori associati alla rilevazione;

Prof.ssa C. Davino

ociale

Le caratteristiche delle indagini statistiche

Statistica So

Le caratteristiche delle indagini statistiche

Corso di S

La ricchezza di dettagli ricchezza di dettagli della rilevazione g g

Le indagini campionarie si distinguono dalle indagini esaustive per la possibilità di andare in profondità nella ricerca dell’informazione.

Rapidità

Rapidità

nel raccogliere e trattare i dati;

nel pubblicare i risultati delle analisi.

nel pubblicare i risultati delle analisi.

Analisi di eventi stagionalieventi stagionali o periodiciperiodici che richiedano interventi immediati.

(Attività produttive, Occupazione, Malattie diffusive, Migrazioni, …).

Prof.ssa C. Davino

ociale

Le caratteristiche delle indagini statistiche

Statistica So

Le caratteristiche delle indagini statistiche

Corso di S

La precisione

precisione, l’accuratezzaaccuratezza e l’attendibilitàattendibilità

d ll l

della rilevazione.

E’ dunque assoluta nelle indagini esaustive e decresce in funzione della numerosità del campione.

La precisione di una stima è direttamente proporzionale alla dimensione del campione.

della numerosità del campione.

L’accuratezza è invece legata al passaggio dei dati su un supporto adeguato per l’elaborazione automatica. Gli errori di rilevazione e di trattamento dei dati

i hi i ll i d i i di t di i i

sono un rischio maggiore nelle indagini di vaste dimensioni.

Non è raro che l’inaccuratezza superi l’imprecisione dovuta al campionamento.

Il concetto che riassume in sé sia la precisione che l’accuratezza è Il concetto che riassume in sé sia la precisione che l accuratezza è rappresentato dall’attendibilità di un’indagine.

(3)

ociale

Riassumendo

Statistica So

Riassumendo

Le informazioni relative alla popolazione, cioè alle variabili che la caratterizzano possono derivare da una:

Corso di S

che la caratterizzano, possono derivare da una:

Rilevazione censuaria o totale (a)

Si ha la conoscenza esatta del fenomeno analizzato.

Si preferisce:

pe analisi a li ello di mic o a ee

… per analisi a livello di micro-aree;

… quando le unità da analizzare sono rare;

… quando si vuole portare l’analisi ad un elevato livello di dettaglio.

Rilevazione campionaria (b)

Si perviene ad una stimastima del fenomeno.

Si preferisce:

… quando è impossibile effettuare una rilevazione totale;

… quando la rilevazione del carattere comporta la distruzione delle unità osservate;

… quando si vogliono ridurre i costi e/o i tempi di un’indagine.

ociale

Il campionamento

Statistica So

Il campionamento

Corso di S

Si definisce campionamento un

di t tt il l

Pop In procedimento attraverso il quale

da un insieme di unità costituenti l’oggetto dello studio

Estrazione casuale

n fere n

costituenti l’oggetto dello studio, si estrae un numero ridotto di casi scelti con criteri tali da

C

casuale

n za

scelti con criteri tali da consentire la generalizzazione

all’intera popolazione dei C

all intera popolazione dei risultati ottenuti.

Prof.ssa C. Davino

ociale

Il campionamento e l’inferenza

Statistica So

 Il campione deve essere rappresentativo della popolazione

Il campionamento e l inferenza

Corso di S

 a p o d app a o d a popo a o

 campionamento casuale

 Il calcolo delle probabilità esamina i risultati che si ottengono sotto l’influenza del caso

Campione

Popolazione

Calcolo delle probabilità

Prof.ssa C. Davino

ociale

Parametri e statistiche

Statistica So

Parametri e statistiche

Corso di S

Popolazione opo a o e Parametri a a et

Valori fissi, spesso non noti

Statistiche

Campione o

Stimatori

Variabili casuali, le cui determinazioni dipendono dalle particolari dipendono dalle particolari osservazioni scelte

(4)

ociale

Il campionamento

Statistica So

Il campionamento

Un campione casuale di n elementi estratto da una v.c. X è

Corso di S

p

rappresentato dalle n v.c X1, X2, …, Xn dove Xiè la i-esima estrazione della v.c. X

Popolazione: Altezza X degli studenti presenti in aula durante la lezione di Statistica X1: Altezza del primo studente da estrarre X2: Altezza del secondo studente da estrarre

Xi: Altezza dell’i-esimo studente da estrarre

 X   P X  P  X  1

P

Xn: Altezza dell’n-esimo studente da estrarre

     

x N x

x

P X ... P X

n

X

P

i

1

i

2

 

i

 

ociale

Il campionamento

Statistica So

Il campionamento

Ogni v.c. X1, X2, …, Xnha la stessa funzione di densità di probabilità f(xi)

Corso di S

1 2 n i

che sarà uguale alla f(x) della popolazione originaria Popolazione XN(,)

v c X N( ) v.c. X1N(,)

………….

v.c. XiN(,)

D ff tt t l’ i t l d t i i i è

v.c. …………XnN(,)

Dopo aver effettuato l’esperimento, la determinazione numerica è rappresentata da n numeri reali x1, x2, …, xnche rappresentano il campione osservato

Ogni xiè la realizzazione di una v.c Xi detta v.c. della i-esima estrazione

Prof.ssa C. Davino

ociale

Le distribuzioni campionarie

Statistica So

Le distribuzioni campionarie

 Inferenza: utilizza statistiche del campione per effettuare la stima dei corrispondenti veri valori della popolazione

Corso di S

dei corrispondenti veri valori della popolazione

 In pratica, viene selezionato a caso dalla popolazione un campione unico di ampiezza predeterminata

 Bi bb d i i i h bb t t

 Bisognerebbe prendere in esame ogni campione che avrebbe potuto manifestarsi

Distribuzioni campionarie

P t i

l i tt i ti i d ll l i

Parametri: valori caratteristici della popolazione Statistiche: funzioni delle osservazioni campionarie

Statistica calcolata: numero ottenuto applicando la statistica al Statistica calcolata: numero ottenuto applicando la statistica al

campione osservato

Distribuzione campionaria: valori che la statistica assume al

a ia e del campione nell’ ni e so variare del campione nell’universo campionario

Prof.ssa C. Davino

ociale

Le distribuzioni campionarie

Statistica So

Le distribuzioni campionarie

Corso di S

V l i h l t ti ti l i

Valori che la statistica assume al variare

del campione nell’universo campionario

del campione nell universo campionario

(5)

ociale

V C Media Campionaria

Statistica So

• Popolazione XN()

V.C. Media Campionaria

Corso di S

( ) ( )

• Campioni casuali di n elementi:

n v.c X1N(,) …. XnN(,)

1° campione

x

1 ….

x

n

x

2° campione

x

1 ….

x

n

x

3° i

  

3° campione

x

1 ….

x

n

x

…….. tutti i possibili campioni dell’universo campionario

X

v c X

v.c.

ociale

V C Media Campionaria

Statistica So

• V.C. media campionaria: medie aritmetiche calcolate su tutti

V.C. Media Campionaria

Corso di S

p

i campioni appartenenti allo spazio campionario

• Le medie variano al variare del campione estratto e, poiché i p , p campioni sono estratti casualmente, i valori che può

assumere la media campionaria sono realizzazioni di una v.c

• La distribuzione della v.c media campionaria dipende dalla distribuzione della popolazione X

• Quando la dimensione del campione è sufficientemente grande, la distribuzione della media campionaria può essere approssimata alla distribuzione normale qualunque sia la distribuzione della popolazione (Teorema del Limite Centrale).

Prof.ssa C. Davino

ociale

Esempio sulla V C Media Campionaria

Statistica So

Si consideri la popolazione costituita da N=4 quattro

Esempio sulla V.C. Media Campionaria

Corso di S

p p q

ipermercati A, B, C, D. Le vendite effettuate da ciascuno di essi nel periodo 1/1/03-31/12/03 sono riportate nella seguente tabella:

Ipermercato A B C D

Ipermercato A B C D

Vendite (in miliardi di euro) 4 1 3 2

1. Si calcolino la media  e lo scarto quadratico medio  della popolazione;

 4 1 3 2  2 5 4

1     ,

2 5 1 25 1 12

4 30

1

2 2

, , ,

N xi

     

4

N

4

Prof.ssa C. Davino

ociale

Esempio sulla V C Media Campionaria

Statistica So

2. Effettuando un campionamento con ripetizione si calcolino

Esempio sulla V.C. Media Campionaria

Corso di S

p p

il valore atteso e lo scarto quadratico medio della v.c. media

campionaria

Numero

d l i

Primo El t

Secondo El t

Media C i i

Universo dei campioni n=2 estratti con ripetizione (42) e

del campione Elemento Elemento Campionaria

1 4 4 4,0

2 4 1 2,5

3 4 3 3,5

estratti con ripetizione (4 ) e relative medie campionarie

,

4 4 2 3,0

5 1 4 2,5

6 1 1 1,0

  40

7 1 8 1 3 2 2,0 1,5

9 3 4 3,5

10 3 1 2,0

  2 5

16 40 , X

E

10 3 1 2,0

11 3 3 3,0

12 3 2 2,5

13 2 4 3,0

  2

12 , 79 1 ,

0 

Xsqm

14 2 1 1,5

15 2 3 2,5

16 2 2 2,0

2

(6)

ociale

Esempio sulla V C Media Campionaria

Statistica So

2. Effettuando un campionamento senza ripetizione si

Esempio sulla V.C. Media Campionaria

Corso di S

p p

calcolino il valore atteso e lo scarto quadratico medio della v.c. media campionaria

Numero Primo Secondo Media

Universo dei campioni n=2 estratti senza ripetizione

del campione Elemento Elemento Campionaria 1 4 1 2,5 2 4 3 3,5

estratti senza ripetizione ( ) e relative medie campionarie

3 3,5 3 4 2 3,0 4 1 4 2,5

5 1 3 2 0

4 212

4

 !

!

5 1 3 2,0 6 1 2 1,5 7 3 4 3,5

  2 5

12 30 , X

E  

8 3 1 2,0 9 3 2 2,5 10 2 4 3,0

12

  X 0 64 1 , 12 2

Var

11 2 1 1,5

12 2 3 2,5

  X 0 , 64 2 3 Var

ociale

Esempio sulla V C Media Campionaria

Statistica So

Esempio sulla V.C. Media Campionaria

Corso di S

Campionamento con Campionamento senza Campionamento con

reintroduzione

Campionamento senza reintroduzione

Popolazione non finita E

 

X

 

X

Var n

 

P l i fi it E

 

X E

 

X

Popolazione finita

 

 

X

Var

n

 

 

X

E

 

X

1 N n

Var n N

Prof.ssa C. Davino

ociale

Distribuzione della V C Media Campionaria

Statistica So

Distribuzione della V.C. Media Campionaria

Corso di S

n >

30?

X  N?

NO NO

?

SI SI

noto?

NO

X tn 1 ; s

n

 

  

noto?

SI

X N

n

X N ;

n

 

 

    

Prof.ssa C. Davino

ociale

V C Proporzione Campionaria

Statistica So

 

 

X  B n  ; n  1  

• : numero di successi in n prove

V.C. Proporzione Campionaria

Corso di S

 

 

X  B n  ; n  1 

1

X B   

 

: numero di successi in n prove

 

B ;

n     n  

 

• : proporzione di successi in n prove

  proporzione di successi nella popolazione

p  proporzione di successi in un campione di ampiezza n p  proporzione di successi in un campione di ampiezza n P: v.c proporzione campionaria

1

P ;

n

N

n

 



  

 

  

  Z= P -     0;1

1

N

  

n

n

   

n

(7)

ociale

L’Inferenza

Statistica So

 Inferenza: utilizza statistiche del campione per

L Inferenza

Corso di S

 Inferenza: utilizza statistiche del campione per effettuare la stima dei corrispondenti veri valori della popolazione

popolazione

 In pratica, viene selezionato a caso dalla popolazione un campione unico di ampiezza predeterminata

un campione unico di ampiezza predeterminata

 Bisognerebbe prendere in esame ogni campione che

bb t t if t i

avrebbe potuto manifestarsi

Distribuzioni campionarie

ociale

Distribuzioni Campionarie

Statistica So

Distribuzioni Campionarie

Corso di S

Le conclusioni inferenziali, basate sull’unico campione osservato, devono essere giudicate sulla base della distribuzione di probabilità dei possibili campioni che distribuzione di probabilità dei possibili campioni che potevano essere generati e dei quali quello osservato

tit i li i ti l

costituisce una realizzazione particolare.

Prof.ssa C. Davino

ociale

Parametri e Statistiche

Statistica So

Parametri e Statistiche

Corso di S

Popolazione opo a o e Parametri a a et

Valori fissi, spesso non noti

Statistiche

Campione o

Stimatori

Variabili casuali, le cui determinazioni dipendono dalle particolari dipendono dalle particolari osservazioni scelte

Prof.ssa C. Davino

ociale

Stima per Intervalli

Statistica So

Si i t ll h h ti l

Stima per Intervalli

Corso di S

Si cerca un intervallo che ha una particolare confidenza o probabilità di includere il

t d ll l i

parametro della popolazione

  1

P t  1    t 2    1  P t    t  

Livello di confidenza

Livello di confidenza

(8)

ociale

Stima per Intervalli

Statistica So

La media campionaria

Stima per Intervalli

Corso di S

La media campionaria

 Popolazione X N

 ; 2

P t

1

  

t2

   1 

Stimatore di  media campionaria

Z X

 Stimatore di   media campionaria

1 2

 

2 2

1

P t

  

t

   

P

z

 

Z z

n

2 2

2 2

1

P X z X z

n n

   

      

 

 

 

Dopo aver estratto il campione

x

1

, x

2

,  x

n

:

 

2 2

1

P x z x z

n n

   

       

 

 

ociale

Stima per Intervalli

Statistica So

La media campionaria

Stima per Intervalli

Corso di S

La media campionaria

Quando il parametro  della popolazione è incognito il miglior Quando il parametro  della popolazione è incognito, il miglior modo per stimarlo è utilizzare la media campionaria.

Quando la numerosità campionaria 

2 Quando la numerosità campionaria

n è sufficientemente elevata si ha:

 

 

  

 ; 

X N n E’ quindi possibile dire che, con probabilità 1-, l’intervallo:

x z2

n

 

contiene il parametro incognito .

Prof.ssa C. Davino

ociale

Stima per Intervalli

Statistica So

Stima per Intervalli

Corso di S

n >

30?

X  N?

NO NO

 1

x n

SI SI

noto?

NO

 

2

x t noto? n

SI

2 n

 

2

x z n

Prof.ssa C. Davino

ociale

Esercizio sulla Stima per Intervalli

Statistica So

Esercizio sulla Stima per Intervalli

Corso di S

Il Sindaco di un Comune vuole indagare sui tempi di accesso al mercato del lavoro dei laureati residenti nel Comune. Da un’indagine campionaria risulta un tempo medio di 5 mesi ed uno scarto quadratico medio di 0,6 mesi.

Si determini un intervallo di confidenza al 95% per il tempo

medio di accessi al mercato del lavoro supponendo che il pp

tempo di acceso al lavoro sia distribuito normalmente e

distinguendo il caso in cui il campione sia costituito da 20 o

distinguendo il caso in cui il campione sia costituito da 20 o

da 100 laureati.

(9)

ociale

V C Proporzione Campionaria

Statistica So

 

 

X  B n  ; n  1  

• : numero di successi in n prove

V.C. Proporzione Campionaria

Corso di S

 

 

X  B n  ; n  1 

1

X B   

 

: numero di successi in n prove

 

B ;

n    n

 

 

• : proporzione di successi in n prove

  proporzione di successi nella popolazione

p  proporzione di successi in un campione di ampiezza n p  proporzione di successi in un campione di ampiezza n P: v.c proporzione campionaria

1

P ;

n

N

n

 



  

 

     Z= P -     0;1

1  N

  

n

  n    

n

ociale

Stima per Intervalli

Statistica So

La proporzione campionaria

Stima per Intervalli

Corso di S

La proporzione campionaria

1

X B ;  

   

 

  

 Popolazione:

;

n     n   

P t  

1

   t

2

    1 

 Stimatore di   proporzione campionaria

p

1

P N ;  

   

 

  

Z= P -

   

0;1

1

N

 

;

n

  n   

1

n

 

Prof.ssa C. Davino

ociale

Stima per Intervalli

Statistica So

La proporzione campionaria P  

Stima per Intervalli

Corso di S

La proporzione campionaria

 

1 Z P

n

 

 

1 2

 

2 2

1

P t    t     Pz

  Z z

n

   

2 2

1 1

1

P P z P z

n n

   

 

   

       

 

 

 

 Dopo aver estratto il campione

x1,x2,xn

e sostituendo al parametro ignoto della popolazione il suo stimatore p:

1   1

p p p p 1

P

   

        

2 2

p p p p 1

P p z p z

n n

       

 

 

Prof.ssa C. Davino

ociale

Stima per Intervalli

Statistica So

La proporzione campionaria

Stima per Intervalli

Corso di S

La proporzione campionaria

Quando il parametro  della popolazione è incognito il miglior Quando il parametro  della popolazione è incognito, il miglior modo per stimarlo è utilizzare la proporzione campionaria.

Quando la numerosità campionaria

1

Quando la numerosità campionaria

n è sufficientemente elevata si ha:

1

P ;

n N

n

 



  

 

  

E’ quindi possibile dire che, con probabilità 1-, l’intervallo:

     

2 2

1 1

p p p p 1

P p z p z

n n

   

       

 

 

contiene il parametro incognito .

 

(10)

ociale

Esercizio sulla Stima per Intervalli

Statistica So

Esercizio sulla Stima per Intervalli

Corso di S

Il Sindaco di un Comune vorrebbe stimare la proporzione di cittadini soddisfatti del lavoro della sua Giunta. Dalla lista degli elettori viene selezionato un campione casuale di 200 cittadini, 78 dei quali dichiarano di essere soddisfatti del lavoro della Giunta. Si definisca una stima per intervalli per la proporzione di cittadini soddisfatti nella popolazione ad un p p p p livello di confidenza del 95%.

ociale

Il campionamento

Statistica So

Il campionamento

Corso di S

Si definisce campionamento un

di t tt il l

Pop In procedimento attraverso il quale

da un insieme di unità costituenti l’oggetto dello studio

Estrazione casuale

n fere n

costituenti l’oggetto dello studio, si estrae un numero ridotto di casi scelti con criteri tali da

C

casuale

n za

scelti con criteri tali da consentire la generalizzazione

all’intera popolazione dei C

all intera popolazione dei risultati ottenuti.

Prof.ssa C. Davino

ociale

Le diverse tecniche di campionamento

Statistica So

Le diverse tecniche di campionamento

Campionamento probabilistico

Corso di S

Campionamento probabilistico

Camp. casuale semplice

Camp. casuale stratificato

C d t di

Camp. a due stadi

Camp. sistematico

Campionamento non probabilistico

C t

Camp. per quote

Disegno fattoriale

Camp. a scelta ragionata Ca p a sce ta ag o ata

Camp. bilanciato

Camp a valanga Camp telefonico

Camp. telefonico

Prof.ssa C. Davino

ociale

Il campionamento probabilistico

Statistica So

Il campionamento probabilistico

Le unità sono scelte in modo casuale (ma nonnon “a casaccio”!).

Corso di S

La casualità interviene nella selezioneselezione delledelle unitàunità e si ottiene attribuendo

attribuendo adad ogniogni unitàunità delladella popolazionepopolazione unauna probabilitàprobabilità notanota ee diversa

diversa dada zerozero di essere selezionata diversa

diversa dada zerozero di essere selezionata.

Quando la probabilità di estrazione, oltre ad essere nota, è posta uguale per tutte le unità si parla di campionamento casuale uguale per tutte le unità, si parla di campionamento casuale semplice.

In particolare, la casualità interviene nella selezione delle unità e si ottiene:

tt ib d d i ità d ll l i

attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere selezionata;

a.

utilizzando in modo appropriato le tecniche per la b utilizzando in modo appropriato le tecniche per la

selezione.

b.

(11)

ociale

Il disegno di campionamento

Statistica So

Il disegno di campionamento

Il disegno di campionamento è l’insieme delle decisioni

Corso di S

Il disegno di campionamento è l insieme delle decisioni prese per formare il campione.

Le fasi: ?

 d fi i i d ll t tt d l i

?

 definizione della struttura del campione

 selezione delle unità campionarie

 probabilità di inclusione delle singole unità

 determinazione della numerosità del campione

ociale

Il disegno di campionamento

Statistica So

Il disegno di campionamento

 Definizione della struttura del campione

Corso di S

Richiede la definizione della lista delle unità che compongono l’universo che si intende osservare

Ad ogni unità deve essere attribuito un identificatore

PROBLEMI : Costi spesso eccessivi

PROBLEMI : Costi spesso eccessivi SOLUZIONI : Campionamento su più livelli

Campionamento a grappoli

 Selezione delle unità campionarie

Selezione casuale con reinserimento

Selezione casuale senza reinserimento

Selezione casuale sistematicaSelezione casuale sistematica (passo:N/n)(passo:N/n)

Tavole dei numeri casuali

Prof.ssa C. Davino

ociale

Le tecniche di selezione casuale

Statistica So

Le tecniche di selezione casuale

Selezione casuale con reintroduzione (o bernoulliano)

Corso di S

Selezione casuale con reintroduzione (o bernoulliano)

Ogni elemento che viene estratto viene reintrodotto nella popolazione in modo tale che ad ogni estrazione successiva non popolazione in modo tale che ad ogni estrazione successiva non venga alterata la composizione della popolazione ed ogni elemento

estratto ha sempre la stessa probabilità di venire scelto.

• Probabilità di estrazione di ciascun elemento:

1 1 1 , , , N NN

La numerosità della popolazione è di fatto considerata infinita;

• Universo campionario:

N

n

La numerosità della popolazione è, di fatto, considerata infinita;

Una unità può essere estratta più volte;

La probabilità di estrazione rimane costante.

Prof.ssa C. Davino

ociale

Le tecniche di selezione casuale

Statistica So

Le tecniche di selezione casuale

Selezione casuale senza reintroduzione

Corso di S

Ogni elemento, una volta estratto, non viene reimmesso nella popolazione per cui dopo ogni estrazione la probabilità che gli popolazione per cui, dopo ogni estrazione, la probabilità che gli elementi restanti entrino a far parte del campione viene modificata.

• Probabilità di estrazione di ciascun elemento:

1 ,..., 1

1 , 1 1

N n

N N

• Universo campionario: N

N1

 

N  n 1

  

NN!n !

La probabilità di estrazione varia ad ogni passo dell’estrazione

 

(12)

ociale

Il disegno di campionamento

Statistica So

Il disegno di campionamento

 Selezione delle unità campionarie

Corso di S

Tavola dei numeri casuali Generazione automatica di n numeri casuali

 Selezione delle unità campionarie

1-23-45-67-89-10 11-12 13-14 15-16 17-18 19-20 21-22 23-24 25-26 27-28 29-30 31-32 33-34 35-36 37-38 39-40 177 66 88 40 86 61 96 70 78 75 29 77 21 94 12 37 66 11 53 42 274 81 53 71 16 61 59 13 33 02 25 95 92 37 03 18 46 26 37 86 305 88 20 12 10 45 80 22 38 70 94 11 22 02 08 37 74 87 49 04 405 79 76 95 69 00 48 70 60 14 53 11 06 57 06 26 60 31 06 74 579 98 70 98 97 94 55 99 44 04 75 89 69 50 64 03 96 98 17 89 655 09 79 15 11 56 65 88 08 16 96 95 33 17 60 45 81 31 50 46 779 19 16 49 99 08 80 01 56 35 41 42 72 58 20 39 33 53 85 26 828 70 12 06 71 02 34 50 30 16 83 58 39 98 84 01 27 85 17 35 954 44 53 59 34 44 49 93 61 75 19 87 34 93 85 16 18 79 65 94

n numeri casuali

954 44 53 59 34 44 49 93 61 75 19 87 34 93 85 16 18 79 65 94 1093 69 31 43 93 93 77 39 72 40 66 32 90 86 65 88 41 19 36 86 1124 94 65 41 64 64 95 13 46 97 43 12 86 02 79 50 67 90 14 19 1204 07 67 01 59 03 27 37 83 20 17 82 11 80 46 08 32 68 60 26 1367 24 63 38 76 53 29 14 02 47 70 31 20 88 24 31 14 65 23 35 1469 06 90 51 48 94 89 77 41 66 54 60 66 95 46 73 76 59 20 05 1566 56 20 91 61 48 91 73 98 80 96 94 45 09 93 21 90 40 03 01 1636 48 02 01 88 94 20 08 07 64 08 84 26 41 25 54 43 65 82 24 1762 93 85 57 12 06 07 88 22 37 03 84 80 69 93 29 22 34 67 88 1894 01 05 57 71 98 47 26 58 99 72 11 69 93 22 46 72 52 75 62 1952 94 18 97 82 49 76 84 86 83 05 27 53 27 16 40 94 34 81 86 2027 43 78 39 71 17 16 72 43 37 60 73 83 41 31 32 61 05 37 89 2146 00 19 71 63 06 75 27 01 57 59 61 86 70 33 35 54 77 81 38 2229 58 01 44 39 62 83 16 97 46 31 27 27 43 67 66 35 08 86 34 2319 31 80 79 63 47 80 56 00 71 06 17 49 70 26 75 55 43 46 84 2402 52 31 23 74 12 16 62 21 19 76 63 33 43 17 16 96 00 42 50 2402 52 31 23 74 12 16 62 21 19 76 63 33 43 17 16 96 00 42 50 2506 00 13 63 57 37 51 83 45 58 21 01 02 89 88 07 74 32 21 87

 Probabilità di selezione delle unità campionarie

• costanti

• variabili

 Probabilità di selezione delle unità campionarie

(generalmente in funzione della dimensione dell’unità)

ociale

La tavola dei numeri casuali

Statistica So

1-2 3-4 5-6 7-8 9-10 11-12 13-14 15-16 17-18 19-20 21-22 23-24 25-26 27-28 29-30 31-32 33-34 35-36 37-38 39-40

La tavola dei numeri casuali

Corso di S

1 77 66 88 40 86 61 96 70 78 75 29 77 21 94 12 37 66 11 53 42 2 74 81 53 71 16 61 59 13 33 02 25 95 92 37 03 18 46 26 37 86 3 05 88 20 12 10 45 80 22 38 70 94 11 22 02 08 37 74 87 49 04 4 05 79 76 95 69 00 48 70 60 14 53 11 06 57 06 26 60 31 06 74 5 79 98 70 98 97 94 55 99 44 04 75 89 69 50 64 03 96 98 17 89

6 55 09 79 15 11 56 65 88 08 16 96 95 33 17 60 45 81 31 50 46 7 79 19 16 49 99 08 80 01 56 35 41 42 72 58 20 39 33 53 85 26 8 28 70 12 06 71 02 34 50 30 16 83 58 39 98 84 01 27 85 17 35 9 54 44 53 59 34 44 49 93 61 75 19 87 34 93 85 16 18 79 65 94 10 93 69 31 43 93 93 77 39 72 40 66 32 90 86 65 88 41 19 36 86

11 24 94 65 41 64 64 95 13 46 97 43 12 86 02 79 50 67 90 14 19 12 04 07 67 01 59 03 27 37 83 20 17 82 11 80 46 08 32 68 60 26 13 67 24 63 38 76 53 29 14 02 47 70 31 20 88 24 31 14 65 23 35 14 69 06 90 51 48 94 89 77 41 66 54 60 66 95 46 73 76 59 20 05 15 66 56 20 91 61 48 91 73 98 80 96 94 45 09 93 21 90 40 03 01

Prof.ssa C. Davino

ociale

 La numerosità campionaria

Statistica So

 La numerosità campionaria

Popolazione N

È l’insieme finito o infinito di unità, definito nei contenuti, nello spazio e nel tempo oggetto dell’indagine statistica

Corso di S

N spazio e nel tempo, oggetto dell indagine statistica

È costituito da un certo numero di unità, estratte con qualche Campione

procedimento da una popolazione, al fine di rappresentarla quanto ai caratteri oggetto di studio

Campione n

V

Parametro della

popolazione

=

v

Stima del campione

Errore di

±

popolazione

(incognito)

campione

campionamento

“ à d è ll h d

“La numerosità ottimadi un campione è quella che consente di ottenere gli obiettivi dell’indagine al minimo costoe sarà il numero minimo in base al quale le stime raggiungeranno il livello di attendibilità atteso.”

(L. Fabbris: L’indagine campionaria - NIS)

Prof.ssa C. Davino

ociale

L’errore di campionamento

Statistica So

L errore di campionamento

E’ legato al fatto che il campione estratto è uno dei possibili

Corso di S

campioni di uguale numerosità estraibili casualmente dalla stessa popolazione

La stima ottenuta è, quindi, una delle tante possibili determinazioni di una variabile casuale, lo stimatore, caratterizzato da un proprio valore medio e una propria variabilità.

2

Stimatore

 ˆ

Valore atteso

  ˆ

Eˆ

c

  ˆ

2 c

c

E p

 

   

 

; ;

Varianza

Diminuisce all’aumentare del campione e, nel caso di p estrazione senza reintroduzione, è nullo per n=N

(13)

ociale

Determinazione della numerosità ottimale

Statistica So

Determinazione della numerosità ottimale

• Fissare la quantità di errore che si è disposti ad accettare nell’uso del campione per stimare il parametro della popolazione (errore di

Corso di S

del campione per stimare il parametro della popolazione (errore di campionamento ammesso, )

• Stimare lo scarto quadratico medio se non sono disponibili dati del q p passato

• Fissare il livello di confidenza desiderato Intervallo della stima per la media:

 

xz z2 2

Con n grande

a. 

x z 2

n

22 n

z2 e schema di

campionamento con reintroduzione:

 

 

 

2 1

x z N n n N

  

 

 

 

  

2

2

z n

Con n grande e schema di

i t

b.

 

 

 

 

 

2

1 2

1 z

N campionamento

senza reintroduzione:

ociale

Determinazione della numerosità ottimale

Statistica So

Determinazione della numerosità ottimale

Corso di S

Intervallo della stima per la media:

Metodo empirico Metodo empirico

Si determina la numerosità n00seguendo lo schema A;g ;

Se il valore di n0così calcolato risulta più piccolo del 5% di N, si utilizza il valore di n0;

0

1 0

n n

n

0;

Se n0 risulta superiore al 5% di N, si introduce un fattore di correzione che

1 N

calcola il valore corretto con la formula:

Prof.ssa C. Davino

ociale

E i

Statistica So

Il Comune di Macerata vorrebbe stimare con un'indagine campionaria il voto medio

Esempio

Corso di S

g p

di diploma degli studenti di scuola media superiore a Macerata. Da studi condotti in altre città, risulta che il voto di diploma segue una distribuzione normale con scarto

d ti di i 4 ti C l l l ità i i i i

quadratico medio pari a 4 voti. Calcolare la numerosità campionaria minima necessaria in modo che la stima non differisca dal reale voto medio della popolazione dei diplomati per più di 1 voto con un livello di confidenza del 95%.

p p p p p

Livello di fiducia=95%

=4 =1

z=1,96 z=2,33

ldf=90% z=1,64

ldf=95%

ldf=99%

=4 =1

,

61 47 , 1 61

4 96 . 1

2 2 2 2

2

2

   

z

n

2

1

2

Prof.ssa C. Davino

ociale

Determinazione della numerosità ottimale

Statistica So

Determinazione della numerosità ottimale

Intervallo della stima per la proporzione:

 

2

Corso di S

Con n grande e schema di campionamento

a.

 

 

 

2

p z 1

n

 

 

 

2 2

2

1 z

n con reintroduzione: p

Con n grande e schema di campionamento i t d i

b. senza reintroduzione:

 

  

 

 1 N n

p z

 

 

 

2 2

2

1 z n

2 1

p z

n N

  

 

2 2

2

1 1 1

n z

Metodo empirico N Metodo empirico

Nel caso di massima variabilità (=0,5), si può porre z=2.

 

2 1 22 1 1

Si ha allora:

 

2 2

2

1 n z

 

2 2

2 1 1

2 2  12

(14)

ociale

E i

Statistica So

Il Comune di una piccola cittadina vorrebbe costruire un complesso multisala in

Esempio

Corso di S

p p

un'area verde fuori dalla città. Prima di procedere con il progetto, il Consiglio Comunale vuole tastare il livello di gradimento della popolazione. Quale deve

il i i di i i i i di

essere il numero minimo di osservazioni campionarie per avere un errore di campionamento al massimo del 2% al livello di confidenza del 95%?

Livello di fiducia=95%

=0 02

z=1,96 z=2,33

ldf=90% z=1,64

ldf=95%

ldf=99%

=0,02

,

 

02 2401 0

5 , 0 5 , 0 96 . 1 1

2 2 2

2

    

z  

n

2

0 , 02

2

ociale

Determinazione della numerosità ottimale

Statistica So

Determinazione della numerosità ottimale

Stima per la proporzione:

Corso di S

5% 2% 1%

N n N n N n

100 80 100 96 100 99

300 170 300 270 300 296

500 220 500 415 500 475

1000 285 1000 715 1000 910

5000 370 5000 1660 5000 3330

5000 370 5000 1660 5000 3330

> 8000 400 (n0) 10000 2000 10000 5000

>50000 2500 (n ) 20000 6350

>50000 2500 (n0) 20000 6350

>200000 10000 (n0)

(livello di confidenza = 95%)

Prof.ssa C. Davino

ociale

Determinazione della numerosità ottimale

Statistica So

Determinazione della numerosità ottimale

• Stima dei parametri di una sola variabile

Corso di S

Stima dei parametri di una sola variabile

• Stima dei parametri di una pluralità di variabili

• Determinazione della numerosità campionaria per ciascuna variabile

• Assumere come ampiezza campionaria l’npiù

• Assumere come ampiezza campionaria lnpiù elevato

• Obiettivo dell’analisi

Prof.ssa C. Davino

ociale

L’errore nella ricerca sociale

Statistica So

L errore nella ricerca sociale

E di l i

1. Errore di copertura

2 E di i t

Corso di S

Errore di selezione

E di i

2. Errore di non-risposta 3. Errore di campionamento Errore di osservazione

Errore di trattamento dati

1. Errore di copertura

• Lista della popolazione

• Aggiornamento

• Duplicazioni

I l t

• Incompletezza

Soluzioni

• Ridefinire la popolazione

• Trascurare gli esclusi

• Integrare il campione

Riferimenti

Documenti correlati

Nominale Tabelle di contingenza Cardinale Analisi della.

Gli indicatori sociali per la valutazione della qualità della vita2.

Meno morti sulle strade italiane, in lieve calo anche incidenti e feriti.. Meno vittime anche sulle

E infine, ancora a dimostrazione dell’autenticità della proposta di Rodari di far squadra con bambini e ragazzi e di dare significato profondo alla parola, viene riportata una

È utilizzato quando si conosce a priori una o più caratteristiche della popolazione di riferimento, che viene suddivisa in strati (o sottopopolazioni) omogenei al loro interno

I candidati stranieri devono possedere certificata conoscenza della lingua italiana parlata e scritta almeno a livello B2 e, ove prescritto essere titolari del permesso

Condizione Occupazionale dei Laureati: consente agli Atenei aderenti, al Miur, all’Anvur, ai giovani e alle loro famiglie di conoscere, fino a livello di corso di laurea, gli

Tale ricerca sulla prevenzione della violenza, finanziata dalla Commissione Europea (nota come Programma “Daphne”, Modena Group On Stalking), è volta a comprendere