internazionali - a.a. 2013-2014
Il campionamento e l ’ inferenza
Campione
Popolazione
Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la
popolazione da cui essi sono stati prescelti
Il campionamento
Pop
C
Estrazione casuale
Inferenz a
Si definisce campionamento un procedimento attraverso il quale da un insieme di unità costituenti l ’ oggetto dello studio, si estrae un numero ridotto di casi scelti con criteri tali da consentire la generalizzazione all ’ intera
popolazione dei risultati ottenuti.
Il campionamento e l ’ inferenza
Il campione deve essere rappresentativo della popolazione
Ä campionamento casuale
Il calcolo delle probabilità esamina i risultati che si ottengono sotto l ’ influenza del caso
Campione
Popolazione
Calcolo delle probabilità
Il campionamento probabilistico
Le unità sono scelte in modo casuale (ma non “ a casaccio ” !).
La casualità interviene nella selezione delle unità e si ottiene attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere selezionata.
Quando la probabilità di estrazione, oltre ad essere nota, è posta uguale per tutte le unità, si parla di campionamento casuale semplice.
In particolare, la casualità interviene nella selezione delle unità e si ottiene:
attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere selezionata;
a.
utilizzando in modo appropriato le tecniche per la selezione.
b.
Campionamento casuale con reintroduzione
Ogni elemento che viene estratto viene reintrodotto nella popolazione in modo tale che ad ogni estrazione
successiva non venga alterata la composizione della popolazione ed ogni elemento estratto ha sempre la stessa probabilità di venire scelto.
ü Probabilità di estrazione di ciascun elemento:
ü Universo campionario
(o bernoulliano)
1
N , 1
N ,..., 1 N
N n
Si consideri la popolazione costituita da N=4 quattro
ipermercati A, B, C, D. Le vendite effettuate da ciascuno di essi nel periodo 01/01/04-31/12/04 sono riportate nella
seguente tabella:
Ipermercato A B C D
Vendite (in miliardi di lire) 4 1 3 2
Un esempio
Campioni di ampiezza 2 estratti con ripetizione
• Universo dei campioni (n=2) estratti con ripetizione: 4
2Numero del campione
Primo Elemento
Secondo Elemento
1 4 4
2 4 1
3 4 3
4 4 2
5 1 4
6 1 1
7 1 3
8 1 2
9 3 4
10 3 1
11 3 3
12 3 2
13 2 4
14 2 1
15 2 3
16 2 2
Esempio X 1 X 2
Campionamento casuale senza reintroduzione
Ogni elemento, una volta estratto, non viene reimmesso nella popolazione per cui, dopo ogni estrazione, la
probabilità che gli elementi restanti entrino a far parte del campione viene modificata.
ü Probabilità di estrazione di ciascun elemento
ü Universo campionario
(o esaustivo)
N ⋅ N −1 ( ) ... N ( − n +1 ) = ( N N ! − n ) !
1 ,..., 1
1 , 1
1
+
−
− N n
N
N
• Universo dei campioni (n=2)
estratti senza ripetizione:
Numero del campione
Primo Elemento
Secondo Elemento
1 4 1
2 4 3
3 4 2
4 1 4
5 1 3
6 1 2
7 3 4
8 3 1
9 3 2
10 2 4
11 2 1
12 2 3
4!
4 − 2
( ) ! = 12
⎛
⎝⎜
⎞
⎠⎟
Campioni di ampiezza 2 estratti senza ripetizione
Esempio
X 1 X 2
Il campionamento
Un campione casuale di n elementi estratto da una v.c. X è rappresentato dalle n v.c X
1, X
2, …, X
ndove X
iè la i-esima
estrazione della v.c. X
( ) ( ) ( )
x N x
x
n1
X P ...
X P X
P
i=
1=
i=
2= =
i= =
Popolazione: Altezza X degli studenti presenti in aula durante la lezione di Statistica X
1: Altezza del primo studente da estrarre
X
2: Altezza del secondo studente da estrarre
X
i: Altezza dell ’ i-esimo studente da estrarre
X
n: Altezza dell ’ n-esimo studente da estrarre
Il campionamento
Ogni v.c. X
1, X
2, …, X
nha la stessa funzione di densità di probabilità f(x
i) che sarà uguale alla f(x) della popolazione originaria
Dopo aver effettuato l ’ esperimento, la determinazione numerica è rappresentata da n numeri reali x
1, x
2, …, x
nche rappresentano il campione osservato
Ogni x
iè la realizzazione di una v.c X
idetta v.c. della i-esima estrazione Popolazione X~N( m , s )
v.c. X
1~N( m , s ) ………….
v.c. X
i~N( m , s ) …………
v.c. X
n~N( m , s )
Processo inferenziale
Ø Inferenza: utilizza statistiche del campione per
effettuare la stima dei corrispondenti veri valori della popolazione
Ø In pratica, viene selezionato a caso dalla popolazione un campione unico di ampiezza predeterminata
Ø Bisognerebbe prendere in esame ogni campione che avrebbe potuto manifestarsi
Distribuzioni campionarie
Si consideri la popolazione costituita da N=4 quattro
ipermercati A, B, C, D. Le vendite effettuate da ciascuno di essi nel periodo 01/01/04-31/12/04 sono riportate nella
seguente tabella:
Ipermercato A B C D
Vendite (in miliardi di lire) 4 1 3 2
( 4 1 3 2 ) 2 5
4
1 + + + = ,
= µ
12 ,
= 1
σ
Un esempio
Estrazione casuale di un campione di 2 supermercati
Ipermercato B C
Vendite (in miliardi di lire) 1 3 ( ) 1 3 2
2
1 + = µ =
4
3 2
1
Estrazione casuale di un campione di 2 supermercati
( ) 4 1 2 , 5
2
1 + = µ =
Ipermercato A B
Vendite (in miliardi di lire) 4 1
Un esempio
Campioni di ampiezza 2 estratti con ripetizione
• Universo dei campioni (n=2) estratti con ripetizione: 4
2Numero del campione
Primo Elemento
Secondo Elemento
Media Campionaria
1 4 4 4,0
2 4 1 2,5
3 4 3 3,5
4 4 2 3,0
5 1 4 2,5
6 1 1 1,0
7 1 3 2,0
8 1 2 1,5
9 3 4 3,5
10 3 1 2,0
11 3 3 3,0
12 3 2 2,5
13 2 4 3,0
14 2 1 1,5
15 2 3 2,5
16 2 2 2,0
( ) 2,5
E X = = µ
( ) 0,79 1,12 2
sqm X = =
Esempio X
Campioni di ampiezza 2 estratti con ripetizione
Media Campionaria
4,0 2,5 3,5 3,0 2,5 1,0 2,0 1,5 3,5 2,0 3,0 2,5 3,0 1,5 2,5 2,0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5
1 1,5 2 2,5 3 3,5 4
Esempio
• Universo dei campioni (n=2)
estratti senza ripetizione:
Numero del campione
Primo Elemento
Secondo Elemento
Media Campionaria
1 4 1 2,5
2 4 3 3,5
3 4 2 3,0
4 1 4 2,5
5 1 3 2,0
6 1 2 1,5
7 3 4 3,5
8 3 1 2,0
9 3 2 2,5
10 2 4 3,0
11 2 1 1,5
12 2 3 2,5
4!
4 − 2
( ) ! = 12
⎛
⎝⎜
⎞
⎠⎟
Campioni di ampiezza 2 estratti senza ripetizione
( ) 2,5
E X = = µ
( ) 0,64 1,12 2 2 3
sqm X = =
Esempio
V.C. Media Campionaria
n v.c X
1∼N(µ,σ) …. X
n∼N(µ,σ) 1° campione
x
1…. x
nx
2° campione
x′
1…. x′
nx′
3° campione
x′′
1…. x′′
nx′′
…….. tutti i possibili campioni dell’universo campionario
• Popolazione X~N( m ,s )
• Campioni casuali di n elementi:
X
v.c.
Popolazione Parametri Valori fissi, spesso non noti
Campione Statistiche Stimatori o
Variabili casuali, le cui determinazioni
dipendono dalle particolari osservazioni scelte
Parametri e statistiche
Ø Parametri: valori caratteristici della popolazione Ø Statistiche o v.c. campionarie o stimatori o
statistiche test: funzioni delle osservazioni campionarie Ø Statistica calcolata o stima: numero ottenuto
applicando la statistica al campione osservato
Ø Distribuzione campionaria: valori che la statistica
assume al variare del campione nell ’ universo campionario
Parametri e statistiche
Distribuzioni campionarie
Le conclusioni inferenziali, basate sull ’ unico campione osservato, devono essere giudicate sulla base della distribuzione di probabilità dei possibili campioni che potevano essere generati e dei quali quello osservato
costituisce una realizzazione particolare.
Campionamento con reintroduzione
Campionamento senza reintroduzione
Popolazione non finita
( ) X
E = µ
( ) X
Var n
= σ
Popolazione finita E ( ) X = µ
( ) X
Var n
= σ
( ) X
E = µ
( ) X N n 1
Var n N
σ −
= −
Riepilogo sulla v.c. media campionaria
V.C. Media Campionaria
• V.C. media campionaria: medie aritmetiche calcolate su tutti i campioni appartenenti allo spazio campionario
• Le medie variano al variare del campione estratto e, poiché i campioni sono estratti casualmente, i valori che può assumere la media campionaria sono realizzazioni di una v.c
• La distribuzione della v.c media campionaria dipende dalla distribuzione della popolazione X
• Quando la dimensione del campione è sufficientemente
grande, la distribuzione della media campionaria può essere approssimata alla distribuzione normale qualunque sia la
distribuzione della popolazione (Teorema del Limite
Centrale).
Teorema del limite centrale
Se X
1, X
2, …, X
nsono n v.c. indipendenti con media m e varianza s
2, la v.c X=X
1+X
2+…+X
n, somma delle n v.c., può
essere approssimata con una v.c normale con media nm e varianza s
2,se n è sufficientemente grande
Applicazioni del teorema del limite centrale
Approssimazione normale della distribuzione della media campionaria
X N ;
σ n
⎛ µ ⎞
∼ ⎜ ⎝ ⎟ ⎠
Quando la dimensione del campione è sufficientemente grande, la distribuzione campionaria della media aritmetica può essere
approssimata dalla distribuzione normale qualunque sia la distribuzione della popolazione.
X- ( )
Z= N 0;1
n
σ µ ∼
La distribuzione normale e la distribuzione della media campionaria
1. Per la maggior parte delle popolazioni,
indipendentemente dalla forma della loro distribuzione, la distribuzione della media campionaria è
approssimativamente normale, purché si considerino campioni di almeno 30 osservazioni.
2. Se la distribuzione della popolazione è abbastanza
simmetrica, la distribuzione della media campionaria è approssimativamente una normale, purché si considerino campioni di almeno 15 osservazioni.
3. Se la popolazione ha una distribuzione normale, la media campionaria è distribuita secondo la legge normale,
indipendentemente dall ’ ampiezza del campione.
>30? n X~N?
s noto?
NO NO
NO SI SI
SI
?
1