• Non ci sono risultati.

Statistica economica e statistiche istituzionali — Portale Docenti - Università  degli studi di Macerata

N/A
N/A
Protected

Academic year: 2022

Condividi "Statistica economica e statistiche istituzionali — Portale Docenti - Università  degli studi di Macerata"

Copied!
23
0
0

Testo completo

(1)

IL CAMPIONE

(2)

Due tecniche principali per estrarre n unità da una popolazione U= {1,2,3,....,N}:

1. con ripetizione

2. senza ripetizione

→ In ambo i casi le unità successivamente

selezionate costituiscono un campione

(3)

In base all'ordine di estrazione un campione può essere:

 ordinato

 non ordinato

In entrambi i casi si utilizza la

notazione: c={i 1 ,i 2 ,i 3 ,....,i n }

(4)

Il campione delle osservazioni è indicato con il vettore di v.c.

(Y

1

,Y

2

,....,Y

n

). In particolare nel caso di estrazione con ripetizione gli n risultati che ne derivano costituiscono un campione casuale e le v.c. sono i.i.d.

I dati campionari sono costituiti dalle coppie (i

j

,Y

ij

) indicate da:

d=((i

1

,Y

i1

);(i

2

,Y

i2

);...

;

(i

n

,Y

in

))

(5)

È indicato con Ω ed è l'insieme di tutti i possibili campioni che si possono formare da una popolazione finita di N unità in base a una tecnica predefinita, basata sull'ordinamento e sulla ripetizione delle unità.

LO SPAZIO

CAMPIONARIO

(6)

1. Campioni ordinati con ripetizione

Lo spazio campionario è dato da N

n

e corrisponde alle disposizioni con ripetizione, cioè al numero dei raggruppamenti ordinati di n elementi tra N dati, raggruppamenti che si intendono differenti per almeno un elemento o per l'ordine degli elementi o per il numero di volte in cui compare lo stesso elemento.

ESEMPIO:

Se in una popolazione di N=5 unità si estraggono campioni di ampiezza n=2, lo spazio campionario è:

Ω=5

2

=25 punti campione

(7)

2. Campioni ordinati senza ripetizione

Lo spazio campionario è dato da (N)

n

=N(N-1)...

(N-n+1) che corrisponde alle disposizioni semplici, cioè ai raggruppamenti ordinati di n elementi scelti tra N dati, raggruppamenti che si intendono differenti per almeno un elemento o per l'ordine degli elementi.

ESEMPIO:

Se in una popolazione di N=6 unità si estraggono campioni di ampiezza n=3, lo spazio campionario è:

Ω=6(6-1)(6-2)=120

(8)

3. Campioni non ordinati con ripetizione

In questo caso il numero dei possibili campioni è pari a e corrisponde alle combinazioni con ripetizione, cioè a quei raggruppamenti non ordinati di n elementi scelti tra N dati, raggruppamenti che si intendono differenti per almeno un elemento o per il numero di volte in cui compare lo stesso elemento.

ESEMPIO:

Se in una popolazione di N=8 unità si estraggono campioni di ampiezza n=4, lo spazio campionario è:

Ω= = = =330

(9)

4. Campioni non ordinati senza ripetizione

Il numero dei possibili campioni è pari alle combinazioni semplici, cioè ai raggruppamenti non ordinati di n elementi scelti tra N dati in modo tale che ogni raggruppamento si intende differente per almeno un elemento.

ESEMPIO:

Se in una popolazione di N=5 unità si estraggono campioni di ampiezza n=2, lo spazio campionario è:

Ω= = = =10

(10)

Infine si possono considerare anche spazi campionari che contengono campioni con ampiezza variabile, indicata con il simbolo n(c).

Ad esempio Ω

*

riferito ai campioni non

ordinati senza ripetizione che derivano

da una popolazione di N=5 sarà pari alla

somma dei possibili campioni con

ampiezza 1,2,3,4.

(11)

Indici più usati per descrivere le caratteristiche del campione sono:

Media campionaria:

Varianza campionaria:

Covarianza campionaria:

Coefficiente di regressione campionario:

Coefficiente di correlazione campionario :

Analisi del campione

(12)

Piano di campionamento

Si definisce piano di campionamento l’associazione tra i campioni c∈Ω e la corrispondente misura di probabilità p(c) quando valgono le condizioni:

;

Per gli spazi campionari precedentemente descritti si hanno i seguenti piani di campionamento:

1.

2.

3.

4.

Piano di campionamento

Schema di campionamento

(13)

Probabilità di inclusione

La probabilità che l’unità i-esima della popolazione appartenga al campione estratto è detta probabilità di inclusione del primo ordine ed è indicata con π

i

.

Quindi essendo Ω

i

un sottospazio di Ω:

Nel caso di campioni con ripetizione indicando con γ

i

(c) il

numero di volte che l’unità i-esima è presente nel

campione c (0≤γ

i

≤n) si considera la frequenza attesa di

inclusione:

(14)

Si possono definire anche le probabilità di inclusione del secondo ordine.

è la probabilità che il campione comprenda le

unità i e j della popolazione e si ricava:

(15)

Stimatori

Nel campionamento da popolazioni infinite gli stimatori sono v.c.

generate dalle stime campionarie, cioè da determinate funzioni dei dati campionari.

Nel campionamento da popolazioni finite lo stimatore può dipendere dalle sole manifestazioni del carattere ϒ.

La struttura dello stimatore della media o del totale della popolazione è lineare omogenea del tipo:

In generale quando si considera un campionamento con probabilità variabili gli stimatori sono funzioni lineari con coefficienti che dipendono dalle etichette.

θ è il parametro della popolazione e lo stimatore è la funzione dei dati campionari

(16)

Proprietà stimatori

Per valutare le qualità di uno stimatore è necessario considerare la sua distribuzione di probabilità in quanto esso è considerato tanto più valido quanto più tale distribuzione è addensata attorno al valore vero del parametro.

Proprietà:

• Correttezza

• Consistenza

• Efficienza

(17)

Correttezza

Uno stimatore di θ si definisce corretto o non distorto se il suo valore atteso è uguale a θ

Se questo non vale, la sua distorsione (B) è definita da:

 lo stimatore media campionaria gode della proprietà della correttezza per un fissato piano p(c)

 per ottenere uno stimatore corretto della varianza S2 si utilizza lo stimatore varianza campionaria corretta

(18)

Consistenza

Uno stimatore di θ si definisce consistente se:

Stimatore consistente se per n→∞ la sua efficienza cresce cioè che converge in θ.

Inoltre si può definire asintoticamente corretto se vale:

Quindi la condizione sufficiente perché sia consistente

è che:

(19)

Efficienza

Per valutare l’efficienza si introduce l’errore quadratico medio (MSE) cioè la media dei quadrati delle distanze tra lo stimatore e il parametro oggetto di stima.

Quindi se lo stimatore è corretto l’MSE coincide con la varianza.

!Nella pratica si possono usare anche stimatori distorti

purché asintoticamente corretti e quindi, in questi casi,

la varianza è la misura più usata rispetto all’MSE

(20)

Intervalli di confidenza

Definiremo 1-α livello di confidenza dell’intervallo ed indica il livello di affidabilità della stima effettuata.

Alcuni campioni conterranno θ e altri non lo conterranno.

(21)

Strategie campionarie

(22)

Inferenza su popolazioni finite

Esistono forti differenze tra il campionamento di popolazioni finite e la teoria generale dell’inferenza statistica.

La contrapposizione nasce dal fatto che una popolazione finita contiene unità definite, identificate ed etichettabili. Per questo motivo si sono formate due correnti di pensiero contrapposte:

Approccio classico o a popolazione fissa

Approccio di superpopolazione o predittivo Impostazione classica

Considera la popolazione come fissa perciò i valori assunti da un carattere, costituiscono un parametro identificabile con un vettore di quantità fisse. In questo approccio risulta fondamentale il piano di campionamento, poiché da esso dipende il campione estratto e quindi lo stimatore con cui sin farà inferenza.

(23)

Impostazione di superpopolazione

Considera il campione come ottenuto da una popolazione più grande detta superpopolazione che è costituita da infinite popolazioni, che sono i campioni stessi.

In questa impostazione il parametro non è più fisso, ma è una variabile casuale ignota.

I legami esistenti tra il campione e la superpopolazione costituiscono un modello detto di superpopolazione che permette di fare inferenza sul modello stesso.

Le stime e le variabili casuali, che si generano al variare

della popolazione estratta dalla superpopolazione sono

dette predittori.

Riferimenti

Documenti correlati

Significa riconoscere che l’uomo è già essenzialmente svincolato dall’assoggettamento alla natura ed è lasciato libero nell’apertura del suo

Filosofia della religione: religione A (travestimento allegorico della verità); religione B (capovolgimenti della volontà di vivere)i. La risposta di Scheler alla

La contemplazione di quel Dio che ora si manifesta come il fondamento ultimo della ricerca dell’uomo conduce la riflessione alla sorgente stessa dell'universo creato

In apertura di corso egli aveva allineato gli argomenti ai quali è possibile ricorrere per sostenere la tesi della soggettività del reale; il mondo concreto del buon senso e del

23 Ma di un Luciano esplorato, all’altezza del 1824, in maniera nuova e sistematica, da cui Le- opardi trae una nuova idea di satira di cui è traccia la presenza della mitologia

137 Pierucci Francesca matricola 55955 superato discreto 138 Pierucci Francesca matricola 57063 superato sufficiente. 139 Pietrini Jennifer

• Principali materie / abilità professionali oggetto dello studio.. Corso di lingua giapponese,

- crescita sostenibile: promuovere un'economia più efficiente sotto il profilo delle risorse, più verde e più competitiva;.. - crescita inclusiva: promuovere un'economia con un