• Non ci sono risultati.

3._statistica_inferenziale.pdf

N/A
N/A
Protected

Academic year: 2021

Condividi "3._statistica_inferenziale.pdf"

Copied!
1
0
0

Testo completo

(1)

STATISTICA INFERENZIALE

Introduzione

Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico: diciamo infatti con quanta probabilità si verificano certi esiti.

Con la statistica inferenziale si utilizzano i dati di più esperimenti aleatori per dire qualcosa sul modello probabilistico che si suppone incognito. In tutti i problemi di stima dei parametri si seguono questi passi:

1. Scegliere un modello con un parametro incogniti 2. Fare 𝑛 esperimenti

3. Raccogliere i dati e calcolare una funzione di questi dati 4. Usare questa funzione per stimare il parametro incognito

Modello statistico parametrico

Diamo ora una serie di definizioni utili allo studio della statistica inferenziale. Definiamo un modello statistico in due diversi modi:

• Utilizzando la densità = un modello statistico parametrico è una famiglia di leggi di variabili aleatorie dipendenti da uno o più parametri 𝜗: lo indichimo tramite la funzione di densità {𝑓(𝑥; 𝜗): 𝜗 ∈ Θ} dove Θ è lo spazio dei parametri. In altre parole, il modello statistico indica la scelta di un tipo di variabile aleatoria.

• In generale = un modello statistico parametrico è una famiglia di leggi di variabili aleatorie dipendenti da uno o più parametri 𝜗: lo indichimo tramite la legge {ℒ𝜗: 𝜗 ∈ Θ} dove Θ è lo spazio dei parametri. In

altre parole, la legge ℒ𝜗 simboleggia la scelta di un tipo di legge (la bernoulliana, la binomiale, la

poissoniana, normale etc)

Stimatore

Definiamo inoltre il campione casuale di dimensione 𝑛 una n-upla di variabili aleatorie 𝑋1, … , 𝑋𝑛. Dato un

campione casuale 𝑋1, … , 𝑋𝑛 si dice statistica di variabile aleatorie 𝑇 funzione del campione casuale che non

sia funzione di alcun parametro incognito. Assegnata la statistica 𝑇 una volta estratto un particolare campione il numero 𝜏 = 𝑡(𝑥1, … 𝑥𝑛) si dice stima di 𝑔(𝜗). Uno stimatore si dice non distorto o corretto se

𝔼𝜗(𝑇) = 𝑔(𝜗) ovvero quando il valore atteso della statistica è uguale alla sua stima. In generale se ciò non

accade si definisce distorsione la differenza tra il valore atteso della statistica e la sua stima: 𝔼𝜗(𝑇) − 𝑔(𝜗).

Spesso lo stimatore scelto dipende esplicitamente dal numero n ovvero dalla numerosità del campione. Una successione di stimatori si dice consistente se il limite per n che tende a infinito del valore atteso del quadrato della distorsione è nullo ovvero:

lim

𝑛→∞𝔼𝜗((𝑇𝑛− 𝑔(𝜗)) 2

) = 0 Il valore atteso del quadrato della distorsione 𝔼𝜗((𝑇𝑛− 𝑔(𝜗))

2

) è detto rischio quadratico medio. Per uno stimatore consistente vale che:

𝔼𝜗((𝑇𝑛− 𝑔(𝜗)) 2

) = 𝑉𝑎𝑟(𝑇𝑛) + (𝔼𝜗(𝑇𝑛− 𝑔(𝜗))) 2

Se lo stimatore oltre a essere consistente è anche non distorto allora vale che: 𝔼𝜗((𝑇𝑛− 𝑔(𝜗))

2

) = 𝑉𝑎𝑟(𝑇𝑛)

Riferimenti

Documenti correlati

Qui sotto, per ciascuno studente, sono fornite 5 colonne con 20 numeri casuali fra 1 e 500 (numerosità della popolazione) estratti con ripetizione. Come utilizzare questi numeri.

ESEMPIO: Si estrae un campione di numerosità 100 da una popolazione con distribuzione normale con varianza  2 = 225 nota e valore atteso incognito . Vogliamo calcolare un

D’altra parte, lo stesso ufficio ha la possibilità di includere un ipermercato o negozio specializzato localizzato in zona limitrofa, ritenendolo rappresentativo delle abitudini

I precedenti risultati possono essere generalizzati al caso di un vettore di parametri.. Il limite inferiore di Rao-Cramer. ´ Dato un modello statistico Y ) , in questa sezione

: si siano effettuate n misurazioni della stessa grandezza fisica, x 1 ,x 2 …x n si assume come stima del valor vero della grandezza in esame la media aritmetica dei risultati

dal numero delle prove effettuate in analogia con la definizione classica di probabilita’ si potrebbe definire. ma

In pratica, essendo l’estrazione del campione del tutto casuale, la conoscenza di tali valori sintetici permette di determinare una misura della variabilità della

della distribuzione locale. Tutto ciò appesantisce ulteriormente i costi, prima che i prodotti giungano ai consumatori europei, principali acquirenti. E’ da queste