Campionamento stratificato
Esempio: totale delle imprese presenti sul territorio di Genova
Le unità sperimentali sono i comuni della provincia di Genova. La numerosità della popolazione è N = 67.
Scegliamo come dimensione campionaria n = 20.
Stratificazione in base agli abitanti di ogni comune
da 0 a 1000 da 1001 a 5000 da 5001 a 15000 da 15001 a 40000 Genova
Nh 18 33 12 3 1
Campionamento con ALLOCAZIONE PROPORZIONALE Il numero di unità da campionare in ogni strato è:
N nN nh = h
da 0 a 1000 da 1001 a 5000 da 5001 a 15000 da 15001 a 40000 Genova
nh 5 9 4 1 1
Si è estratto, in modo casuale senza reinserimento, da ogni strato il seguente campione e si sono ottenuti seguenti valori per xh, N xh h, sh2 e N nn− N sh h2
CAMPIONE
(comuni estratti nello stato)
numero
imprese xh nh Nh N xh h sh2 h−h 2
h
N n h h
n N s
Gorreto 10 Propata 14 Favale di Malvaro 25
Rovegno 50 1 strato
Neirone 39 27.6 5 18 496.8 283.3 13258.44 Santo Stefano d’Aveto 115
Montoggio 121 Casella 206 Campo Ligure 222
San Colombano Certen. 146
Cicagna 289 Savignone 290 Bogliasco 279 2 strato
Davagna 61 189.8 9 33 6339.67 7240.61 637174 Busalla 547
Sant’Olcese 290 Arenzano 812 3 strato
Cogoleto 528 544 4 12 6531 45534.9 1092838 4 strato Chiavari 2.736 2736 1 3 8208 0 0 5 strato Genova 46.490 46490 1 1 46490 0 0 Gli ultimi due strati hanno varianza interna 0 perché hanno una sola unità campionaria. Per evitare una sottostima della varianza si dovrebbe considerare la varianza tra gli strati, ma si è soliti non tenerne conto, perché si ritiene l’approssimazione buona. Il valore ottenuto nel nostro esempio sarà quindi sottostimato.
Abbiamo le seguenti stime:
• totale del numero delle imprese presenti sul territorio genovese (somma della colonna N xh h): 68 066
• varianza dello stimatore del totale delle imprese (la somma dell’ultima colonna): 1 743 270
• errore quadratico medio dello stimatore del totale delle imprese: 1 320
Stratificazione in base alla dislocazione territoriale
Campionamento con ALLOCAZIONE PROPORZIONALE
La tabella con la numerosità di unità da campionare in ogni strato e estraiamo casualmente altri 20 comuni, rispettando sempre le proporzioni.
Genova estremo ponente
medio ponente
zona centrale
medio levante
estremo levante costiero
estremo levante entroterra
Nh 1 7 14 10 7 8 20
nh 1 2 4 3 2 2 6
CAMPIONE
(comuni estratti nello strato)
numero
imprese xh nh Nh N xh h sh2 h− h 2
h
N n n N sh h
1 strato Genova 46490 46490 1 46490.0 0 0 Mele 139
2 strato
Cogoleto 528 333.5 7 2334.5 75660.5 1324059 Casella 206
Montoggio 121 Vobbia 29 3 strato
Ceranesi 234 147.5 14 2065.0 8549.67 299238 Fontanigorda 25
Bargagli 106 4 strato
Davagna 61 64 10 640.0 1647 38430
Uscio 128 5 strato
Camogli 446 287 7 2009.0 50562 884835
Rapallo 2604 6 strato
Portofino 103 1353.5 8 10828.0 3127501 75060024 Moconesi 286
Neirone 39 Rezzoaglio 80 Lumarzo 71 Cogorno 343 7 strato
Ne 169 164.7 20 3294.0 15655.5 730590
Con questa stratificazione abbiamo le seguenti stime:
• totale del numero delle imprese presenti sul territorio genovese: 67 661
• varianza dello stimatore del totale delle imprese 78 337 176
• errore quadratico medio dello stimatore del totale delle imprese: 8 851 Le due stime del totale con diverse variabili di stratificazione sono abbastanza simili tra loro, e di fatto molto vicine al valore vero della popolazione. L’errore è invece più alto stratificando nel secondo modo, cioè per zona. Bisogna però tener conto della sottostima presente nella stratificazione per abitanti: in questo caso, comunque, la differenza tra le due stime dello scarto è talmente elevata che non si può che arrivare alle stesse considerazioni.
Campionamento con ALLOCAZIONE OTTIMA Il numero di unità da campionare in ogni strato è
∑
== H
j
j j
h h h
N n N n
1
σ σ
Considerando come
σ
la radice della varianza, che si rileva in un censimento precedente Genova estremoponente
medio ponente
zona centrale
medio levante
estremo levante costiero
estremo levante entroterra
Nh 1 7 14 10 7 8 20
nh 1 2 3 1 2 8 3
Come in precedenza, estraiamo un campione casuale dagli strati:
CAMPIONE
(comuni estratti nello strato)
numero
imprese xh Nh N xh h
1 strato Genova 46490 46490 1 46490
Mele 139 2 strato
Campo Ligure 222 180.5 7 1263.5 Ceranesi 234
Busalla 547 3 strato
Vobbia 29 270 14 3780
4 strato Bargagli 106 106 10 1060
Sori 296 5 strato
Avegno 130 213 7 1491
Sestri Levante 1420 Chiavari 2736 Rapallo 2604 Lavagna 1149 S. Margherita L. 1089 Zoagli 147 Portofino 103 6 strato
Moneglia 272 1190 8 9520
Orero 43 Moconesi 286 7 strato
Leivi 114 147.67 20 2953.33
La stima del totale del numero delle imprese presenti sul territorio genovese è la somma della colonna
h h
N x : 66558
Come stima della varianza negli strati consideriamo sempre quella del censimento del 2002. Il valore stimato dell’errore quadratico medio è 16153.38.