• Non ci sono risultati.

8. 26 marzo 2013 Introduzione alla statistica bayesiana. Esempio della stima di

N/A
N/A
Protected

Academic year: 2022

Condividi "8. 26 marzo 2013 Introduzione alla statistica bayesiana. Esempio della stima di"

Copied!
2
0
0

Testo completo

(1)

8. 26 marzo 2013

Introduzione alla statistica bayesiana. Esempio della stima di p nel modello binomiale. Vedi brevi note sull’argomento ahttp://www.science.unitn.it/∼anal1/matstat biotech/note/bayes.pdf.

9. 28 marzo 2013

Approccio frequentista alla statistica. Supponiamo che i dati siano il risultato di un modello probabilistico, di cui non conosciamo alcuni parametri. In questo approccio esiste per`o un valore vero di tali parametri;

non ha quindi senso assegnare una probabilit`a ai parametri, ma vogliamo stimare il loro valore, meglio che possiamo.

Una statistica `e una funzione dei dati; poich´e riteniamo che i dati siano il risultato di un modello probabi- listico, possiamo considerare una statistica come una variabile casuale. Possiamo quindi parlare, ad esempio, del valore atteso di una statistica, della sua varianza, in generale della sua distribuzione.

Ad esempio, possiamo considerare la media campionaria ¯x = (x1+ · · · + xn)/n come una statistica, in genere utilizzando l’ipotesi che x1, . . . xnsiano le realizzazioni di n variabili casuali X1, . . . Xncon la stessa distribuzione (e quindi lo stesso valore atteso µ = E(Xi) e la stessa varianza σ2= V(Xi)) e indipendenti.

Uno stimatore `e una statistica che usiamo per stimare un parametro ignoto del modello probabilistico che ha generato i dati. Ad esempio, la media campionaria `e uno stimatore naturale del valore atteso µ delle variabili casuali Xi. Come abbiamo gi`a visto, sotto le ipotesi standard (Xi equidistribuite e indipendenti) esso gode delle propriet`a

E(X) = µ¯ V(X) =¯ σ2 n.

Inoltre, sappiamo (per il teorema centrale del limite) che la sua distribuzione pu`o essere approssimata con una normale, se n `e abbastanza grande.

Il fatto che E( ¯X) = µ, ci dice che il valore atteso dello stimatore `e proprio uguale al valore atteso di µ (qualunque sia il valore di µ che noi non conosciamo). Uno stimatore con questa propriet`a si dice non distorto. Quindi, se noi compissimo tanti campionamenti [esperimenti...], ci aspetteremmo che le medie campionarie (trovate da ogni campionamento) si distribuirebbero intorno al valore vero µ.

Il fatto che V( ¯X) tenda a 0 al crescere di n, ci dice che, se n `e abbastanza grande, ci aspettiamo che il valore della media campionaria ¯x sar`a vicino al valore vero µ. Vedremo dopo come quantificare questa osservazione, sfruttando anche il teorema centrale.

Per potere per`o valutare in modo quantitativo l’incertezza, si introduce il concetto di intervallo di con- fidenza. Dato un parametro da stimare (per esempio µ) si vogliono trovare altre due funzioni dei dati T1

e T2 in modo che, qualunque sia il vero valore di µ, la probabilit`a che l’intervallo (T1, T2) contenga µ sia almeno del 95% (o di un altro livello che si ritenga adeguato). Vedi la parte riguardante l’argomento su http://www.science.unitn.it/∼anal1/matstat biotech/note/note int .pdf.

Stima di p nel modello binomiale

Supponiamo di avere osservato n lanci di una moneta e di volere stimare il valore di p, la probabilit`a di successo in ogni lancio. Riteniamo allora che il numero di successi S ∼ Bin(n, p), una binomiale di parametri n e p. Per rientrare nel caso precedente, possiamo anche dire che S = (X1+ · · · + Xn) dove Xi = 1 se l’i-esimo lancio `e stato un successo, Xi = 0 se insuccesso; X1, . . . Xn sono indipendenti e con la stessa distribuzione Bin(1, p); in realt`a, se accettiamo che il modello binomiale sia corretto, ci interessa conoscere solo il numero totale di successi e non il loro ordine.

Lo stimatore naturale di p `e ˆp = k/n. Dalle formule della media e varianza di una binomiale, si ottiene facilmente che

E( ˆp) = p V( ˆp) = p(1 − p)/n.

Si tratta quindi di uno stimatore non distorto e la cui varianza tende a 0 al crescere di n, due propriet`a apprezzabili.

Si discutono tre metodi:

1

(2)

1. il metodo basato sull’approssimazione normale sostituendo ˆp a p per valutare la varianza di ˆp. E’ un metodo veloce che funziona abbastanza bene purch´e n sia abbastanza grande e p non troppo vicino n´e a 0, n´e a 1;

2. il metodo basato sull’approssimazione normale, ma risolvendo la disequazione quadratica in p. E’

pi`u corretto del precedente, ma tende a sottostimare l’ampiezza dell’intervallo. Per ovviare a ci`o si usa spesso la correzione di Yates, che non viene discussa a lezione, ma viene utilizzata da R automaticamente, a meno di rifiutarla esplicitamente;

3. il metodo esatto basato sulla distribuzione binomiale. I calcoli non sono fattibili a mano ed `e quasi es- senziale avere a disposizione un computer. E’ per`o importante capire concettualmente come si ottiene l’intervallo di confidenza.

2

Riferimenti

Documenti correlati

Si rappresenti in grafico la distribuzione di probabilità (pdf) normale stimata dalla serie in sovrapposizione al diagramma delle frequenze relative di classe,

Nota: una cella contiene una stringa di caratteri Il Formato di una cella stabilisce come viene visualizzato il contenuto. A volte EXCEL assume un formato diverso da ciò

In EXCEL sono disponibili componenti aggiuntivi facoltativi (add-ins, add-on) che includono comandi e/o caratteristiche aggiuntive e. possono

E’ utile inserire commenti e istruzioni soprattutto se i fogli devono essere usati da altri.. Strumenti: Convalida dati. Consentono di controllare che i dati inseriti siano coerenti

Due ricercatori effettuano un esperimento sul moto rettilineo uniforme nelle medesime condizioni (velocità media, posizione iniziale, precisione delle misure) e ottengono i

Nota: la definizione Frequentista è una stima basata sui dati, come tale è affetta da incertezza.. di un maschio e

Trattamento e Analisi statistica dei dati sperimentali.. Modulo IV:

La popolazione si riferisce all'insieme di tutti gli elementi oggetti dello studio (le persone, le piante, i possibili risultati di una misura, etc...). Gli