• Non ci sono risultati.

Stima della sottocopertura della lista

Interviste florovivaismo andamento temporale (Lotto 4)

CESA N°RILEVATORI N°PUNTI N°AZIENDE PUNTI/AZIENDE

6.8.1 Stima della sottocopertura della lista

Il principale indice per la valutazione della copertura di una lista è rappresentato dal tasso di copertura che, nell’ipotesi di assenza di sovracopertura, è dato dal rapporto tra il numero di unità presenti nella lista e la numerosità effettiva, ma incognita, N della popolazione. Poiché la numerosità effettiva della popolazione è incognita, occorre formalizzare con un modello probabilistico la mancata enumerazione delle unità.

Miglioramento delle statistiche congiunturali delle colture floricole e orticole – RELAZIONE – Rev. 00

Il modello di Petersen

Nel presente lavoro per la valutazione del tasso di copertura, e quindi per la stima della numerosità effettiva della popolazione di riferimento, è stato utilizzato il modello di Petersen (Wolter, 1986). Nel modello di Petersen si assume che la lista ottenuta dagli archivi amministrativi e la lista ottenuta con l’indagine areale (ECA2007) siano indipendenti l’una dall’altra, che, per entrambe le liste, ciascuna azienda abbia la stessa probabilità di essere inclusa nella lista e che l’inclusione di una azienda nella lista sia indipendente dalle altre aziende. Altre assunzioni sono descritte in Wolter (1986).

In generale, accoppiando le aziende rispondenti all’indagine areale con quelle presenti nella lista amministrativa è possibile determinare quali unità registrate nella lista sono o meno presenti sul territorio. Assumendo che non esistono errori di abbinamento, ciascuna unità può essere classificata in una delle celle del seguente modello di copertura

Lista

Il numero totale di aziende nella popolazione di riferimento (N) è dato dalla somma delle quattro celle, dove N11 rappresenta il numero di aziende presenti nella lista e rilevate dall’indagine areale, N12 il numero di aziende presenti nella lista e non rilevate dall’indagine di areale, N21 il numero di aziende rilevate dall’indagine di copertura e non presenti nella lista e N22 il numero, non osservato, di aziende non rilevate dall’indagine e dalla lista. La marginale N1+ fornisce il numero totale delle aziende presenti nell’archivio e N+1 il numero totale delle aziende rilevate con l’indagine areale.

Sulla base delle ipotesi precedenti il tasso di copertura10 è stimato da )

mentre una stima della numerosità della popolazione1 è data da Poiché con l’indagine areale non si effettua un’enumerazione completa delle aziende su tutto il territorio di interesse ma solo su un campione, le quantità N11 e N+1 devono essere stimate sulla base delle osservazioni campionarie. Si ha, quindi, che la quantità (1) è stimata con:

)

sono rispettivamente le stime campionarie delle corrispondenti quantità N11 e N+1.

Analogamente la quantità (2) può essere stimata con N (N1 N1/N11)

.

10 Vedi Wolter, 1986.

Miglioramento delle statistiche congiunturali delle colture floricole e orticole – RELAZIONE – Rev. 00

Lo stimatore utilizzato

Come già descritto nei precedenti paragrafi, l’indagine ECA2007 si basa su un disegno di campionamento areale a due stadi, con stratificazione delle unità di primo stadio. Le unità di primo stadio sono delle porzioni regolari di territorio, tecnicamente definite “segmenti” e le unità di secondo stadio sono punti, allocati all’interno dei segmenti secondo una griglia regolare. Questi punti consentono di individuare con criteri spaziali l’insieme di aziende florovivaistiche da intervistare. L’unità di campionamento è, quindi, il punto sul territorio, mentre l’unità di rilevazione è l’azienda florovivaistica. Ovviamente, solo una azienda florovivaistica è associata a ciascun punto, mentre la stessa azienda può essere rappresentata da più punti.

Il tipo di stimatore utilizzato per associare l’unità di rilevazione (azienda) con l’unità campionata (punto) è metodo del segmento ponderato11 : il valore della variabile di interesse associato a ciascun punto è definita come il valore della variabile rilevata nell’azienda moltiplicata per un fattore correttivo uguale al rapporto tra l’area del punto (al quale è assegnata una dimensione operativa) diviso la superficie florovivaistica dell’azienda. Il metodo del segmento ponderato può essere utilizzato per tutte le variabili rilevate.

Se si indica con

S il numero degli strati delle unità di primo stadio nh il numero di segmenti estratti nello strato h

mhi il numero di punti estratti nel segmento i appartenente allo strato h

yhjj il valore della variabile y osservato nell’azienda rilevata nel punto j del segmento i per lo strato h

ehjj Il peso campionario associato al punto j del segmento i appartenente allo strato h, Whil Il peso utilizzato per associare la variabile y osservata per l’azienda e il punto punto j del

segmento i

lo stimatore del totale della variabile Y è dato da:

La stima della varianza è invece data da:

 

Valutazione degli errori del tasso di copertura

Lo stimatore del tasso di copertura (3) è funzione non lineare dei dati. La varianza può essere calcolata utilizzando le trasformate di Woodruff. Il metodo consiste nella linearizzazione della

11FAO (1988). Multiple Frame Agricultural Surveys. Volume II. Statistical Development Series Nº10, Rome.

Miglioramento delle statistiche congiunturali delle colture floricole e orticole – RELAZIONE – Rev. 00

funzione non lineare con una funzione lineare chiamata trasformata di Woodruff. La varianza dello stimatore non lineare è allora approssimabile con la varianza calcolata utilizzando i metodi standard per la stima della varianza applicati alla trasformata di Woodruff.

Con riferimento allo stimatore (3) la variabile linearizzata risulta essere:

2 La varianza dello stimatore (3) è quindi data da:

 

Stime ed errori campionari del tasso di copertura

Nelle tabelle che seguono sono riportate le stime delle quantità N+1 (il numero totale delle aziende rilevate con l’indagine ECA2007), N11 (il numero di aziende presenti nella lista e rilevate dall’indagine ECA2007) e del tasso di copertura ~ ( / )

1

11

N N

con il relativo errore per i domini costituiti dalla classe di superficie florovivaistica e comparto.

Tab. 55– Stime dei tassi di copertura ed errori relativi Stima N+1 Stima N11

Tab. 56 – Stime dei tassi di copertura ed errori relativi per classe di superficie florovivaistica Classe di superficie

-Tab. 57 – Stime dei tassi di copertura ed errori relativi per comparto Comparto

Stima N+1 Stima N11 Stima della copertura

Errore della stima di copertura

Vivaistico 266 149 0,56 0,08

Floricolo 1.949 1.005 0,52 0,04

Misto 17 11 0,67 0,17

Miglioramento delle statistiche congiunturali delle colture floricole e orticole – RELAZIONE – Rev. 00

Documenti correlati