• Non ci sono risultati.

demografico (per prevedere l’evoluzione di una popolazione o l’andamento del tasso di natalità

N/A
N/A
Protected

Academic year: 2021

Condividi "demografico (per prevedere l’evoluzione di una popolazione o l’andamento del tasso di natalità"

Copied!
17
0
0

Testo completo

(1)

Lezione 18

Modelli probabilistici

Si è detto che in statistica si utilizza spesso un modello matematico per cercare di descrivere e/o interpretare la relazione esistente fra due variabili. Un esempio di questo genere è stato studiato quando ci si è occupati della regressione lineare.

Anche nello studio di variabili casuali si ricorre spesso all’utilizzo di opportune funzioni matematiche, i cosiddetti modelli probabilistici, per la descrizione di un qualche fenomeno oppure la sua interpretazione.

Esempi comuni di ricorso a modelli probabilistici si hanno in campo

- economico (in ambito micro: per risolvere problemi legati alla gestione delle scorte, alla selezione portafoglio, all’ottimizzazione della produzione; in ambito macro: per prevedere l’andamento del tasso di inflazione, del PIL, del debito pubblico)

- demografico (per prevedere l’evoluzione di una popolazione o l’andamento del tasso di natalità)

- biologico (per analizzare le sequenze proteiche, di DNA o di RNA)

- medico (per valutare la probabilità della presenza di agenti patogeni, per il conteggio del numero di batteri in un alimento, per prendere decisioni diagnostiche o terapeutiche in condizioni di incertezza).

L’utilizzo di questi modelli probabilistici comporta sempre una semplificazione della realtà e un elevato grado di arbitrarietà nella selezione di ciò che si ritiene

(2)

rilevante per il fenomeno considerato, ma risponde all’esigenza di conoscere la realtà osservata, di aumentarne la comprensione e l’interpretazione e di individuare le scelte operative più adeguate.

I modelli teorici vengono utilizzati per variabili casuali sia discrete sia continue.

- Nel primo caso, il modello teorico 𝑓(𝑥) assegna a ciascun possibile valore di X una probabilità

- Nel secondo caso, il modello teorico 𝑓(𝑥) assegna a ciascun possibile valore di X una densità di probabilità

In entrambi i casi il modello teorico è caratterizzato da uno o più parametri per adattare il modello ai dati rilevati, analogamente a quanto rilevato nel caso della retta di regressione, in cui i valori dell’intercetta e del coefficiente angolare consentono di individuare la retta che meglio di ogni altra si adatta a sintetizzare la relazione esistente fra le variabili considerate.

(3)

DISTRIBUZIONE ZERO-UNO (O DI BERNOULLI) Questo modello viene utilizzato quando

- la popolazione è dicotomica, nel senso che N1 unità possiedono una certa caratteristica A e le restanti N2=N−N1 non la possiedono

- dalla popolazione si estrae in modo casuale una singola unità.

Esempi di prove dicotomiche sono la rilevazione dell’assenza o della presenza di una determinata caratteristica, la distinzione fra un risultato positivo o negativo, la rilevazione di una variabile che assume solo due modalità, come nel caso del sesso o della condizione lavorativa (occupato, non occupato).

Una volta scelta la caratteristica di interesse, il risultato ottenuto nella prova viene spesso indicato con i termini successo, se si ottiene un’unità con la caratteristica considerata, e insuccesso, in caso contrario.

Considerata, per esempio, un’urna contenente N palline, di cui N1 bianche e N2

nere (con N = N1+ N2) e un esperimento che consiste nell’estrazione di una pallina dall’urna, supponiamo che il successo corrisponda all'evento "uscita di una pallina bianca", e quindi l’insuccesso all’evento "uscita di una pallina nera".

In questo caso il rapporto

𝜋 = 𝑁1 𝑁

che corrisponde alla proporzione di palline bianche contenute nell’urna, è la probabilità che nella prova si verifichi il successo, mentre 1− 𝜋 è la probabilità dell’insuccesso.

(4)

Il risultato dell'esperimento può essere descritto utilizzando la variabile casuale X "numero di palline bianche estratte" che assume valore 0 con probabilità 1− 𝜋 e valore 1 con probabilità 𝜋. La distribuzione di probabilità della variabile casuale assume quindi la forma riportata nella tabella successiva

X P(x)

0 1− 𝜋

1 𝜋

1

La variabile casuale così definita si chiama variabile casuale Zero-Uno o di Bernoulli: si tratta di una variabile discreta che assume solo due valori, zero e uno, e la sua distribuzione di probabilità è caratterizzata dal solo parametro 𝜋 che rappresenta la probabilità che in una prova si verifichi il successo.

L’espressione formale della funzione di probabilità della variabile casuale Zero- Uno è data da

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 𝜋𝑥(1 − 𝜋)1−𝑥 𝑥 = 0, 1; 0 < 𝜋 < 1

Questa funzione fornisce la probabilità associata ai due possibili valori della variabile:

- per 𝑥 = 0 si ottiene

𝑓(0) = 𝑃(𝑋 = 0) = 𝜋0(1 − 𝜋)1 = 1 − 𝜋 - per 𝑥 = 1 si ottiene

𝑓(1) = 𝑃(𝑋 = 1) = 𝜋1(1 − 𝜋)0 = 𝜋

(5)

Il valore atteso della variabile casuale X risulta pari a 𝜋, come si vede facilmente dalla tabella che riporta la sua distribuzione di probabilità, e lo stesso risultato vale per tutti i momenti ordinari di ordine r ≠ 0.

𝐸(𝑋) = 0 × (1 − 𝜋) + 1 × 𝜋 = 𝜋 𝐸(𝑋𝑟) = 0𝑟 × (1 − 𝜋) + 1𝑟 × 𝜋 = 𝜋 Di conseguenza la varianza della X è pari a

𝑉(𝑋) = 𝐸(𝑋2) − [𝐸(𝑋)]2 = 𝜋 − 𝜋2 = 𝜋(1 − 𝜋)

ESEMPIO

Considerata un’urna contenente 10 palline di cui 8 bianche e 2 nere, si determini la distribuzione di probabilità della variabile casuale X “numero di palline bianche estratte”, se l’esperimento consiste nell’estrazione di una singola pallina. Si calcoli valore atteso e varianza della variabile così definita.

La funzione di probabilità della X può essere scritta in una delle due forme seguenti

X P(x)

0 0.2

1 0.8

1.0 𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = 0.8𝑥(1 − 0.8)1−𝑥 𝑥 = 0, 1

Il valore atteso e la varianza di X sono rispettivamente pari a 𝐸(𝑋) = 𝜋 = 0.8

𝑉(𝑋) = 𝜋(1 − 𝜋) = 0.16

(6)

DISTRIBUZIONE BINOMIALE

Questo modello viene utilizzato quando

- la popolazione è dicotomica, nel senso che N1 unità possiedono una certa caratteristica A e le restanti N2=N−N1 non la possiedono

- dalla popolazione si estraggono in modo casuale n unità con ripetizione.

Considerata la medesima urna contenente N palline, di cui N1 bianche e N2 nere, ed indicato come successo l'evento "uscita di una pallina bianca", si consideri l’esperimento che consiste nell’estrazione di n palline con ripetizione.

La probabilità del successo in una singola prova è sempre pari alla proporzione di palline bianche contenute nell’urna

𝜋 = 𝑁1 𝑁

A differenza del caso precedente, dall’urna vengono estratte 𝑛 palline con ripetizione, ossia ad ogni estrazione si reinserisce la pallina nell’urna prima di procedere a una nuova estrazione.

In un esperimento di questo tipo si è interessati a rilevare il numero di palline bianche estratte e a valutare la probabilità corrispondente.

Se si indica con 𝑦 il numero di palline bianche estratte, sarà 𝑛 − 𝑦 il numero di palline nere, con 0 ≤ 𝑦 ≤ 𝑛.

Si può calcolare facilmente la probabilità di ottenere 𝑦 palline bianche e 𝑛 − 𝑦 palline nere in un certo ordine, per esempio immaginando che le palline bianche vengano estratte tutte prima delle palline nere.

(7)

La probabilità che le prime 𝑦 palline estratte siano bianche e che le successive 𝑛 − 𝑦 palline siano nere corrisponde al prodotto delle probabilità dei risultati ottenuti in ciascuna estrazione, data la loro indipendenza, e risulta pari a

𝜋𝑦(1 − 𝜋)𝑛−𝑦

In realtà, però, non interessa conoscere l’ordine di estrazione ma solo il numero di successi ottenuti, per cui vanno considerate tutte le possibili ennuple di palline in cui compaiono esattamente 𝑦 palline bianche e 𝑛 − 𝑦 palline nere, a prescindere dall’ordine in cui le palline vengono estratte, e va quindi calcolata la somma delle probabilità associate a queste particolari ennuple.

La probabilità di estrarre 𝑦 palline bianche e 𝑛 − 𝑦 palline nere, a prescindere dall’ordine in cui le palline compaiono, è infatti pari alla somma delle probabilità associate a tutte quelle ennuple composte esattamente da 𝑦 palline bianche e 𝑛 − 𝑦 palline nere.

Ma a ciascuna di queste ennuple è associata sempre una stessa probabilità, che corrisponde a quella riportata nel riquadro giallo, per cui occorre determinare quante sono le ennuple composte da 𝑦 palline bianche e 𝑛 − 𝑦 palline nere.

La probabilità cercata è infatti uguale alla probabilità associata ad un particolare ordinamento per il numero dei possibili ordinamenti.

Il numero dei possibili ordinamenti di 𝑛 palline di cui 𝑦 sono di un certo colore e le restanti 𝑛 − 𝑦 sono di un colore diverso corrisponde alla combinazione di 𝑛 elementi di classe 𝑦, ossia a

(8)

(𝑛

𝑦) = 𝑛!

𝑦! (𝑛 − 𝑦)!

ESEMPIO

Data un’urna contenente 100 palline, di cui 20 bianche e 80 nere, si consideri l’esperimento che consiste nell’estrarre 3 palline con ripetizione.

I possibili risultati sono elencati nella prima colonna della tabella successiva, mentre la seconda colonna riporta la probabilità di ogni risultato e la terza contiene i valori della variabile casuale Y “numero di palline bianche estratte”.

Risultati probabilità Y 0.83 0 0.82× 0.2 1 0.82× 0.2 1 0.82× 0.2 1 0.8 × 0.22 2 0.8 × 0.22 2 0.8 × 0.22 2 0.23 3

Il numero di terne composte da tutte palline nere (𝑛 =3 e 𝑦 =0) è (3

0) = 3!

0! 3!= 3 × 2 × 1

1 × 3 × 2 × 1= 1 e a questa terna è associata la probabilità 0.83

Il numero di terne composte da 2 palline nere e 1 bianca (𝑛 =3 e 𝑦 =1) è (3

1) = 3!

1! 2! = 3 × 2 × 1 1 × 2 × 1= 3

e a ciascuna di queste terne è associata la probabilità 0.82× 0.2

(9)

Il numero di terne composte da 1 pallina nera e 2 bianche (𝑛 =3 e 𝑦 =2) è (3

2) = 3!

2! 1! = 3 × 2 × 1 2 × 1 × 1= 3

e a ciascuna di queste terne è associata la probabilità 0.8 × 0.22

Il numero di terne composte da 3 palline bianche (𝑛 =3 e 𝑦 =3) è (3

3) = 3!

3! 0!= 3 × 2 × 1

3 × 2 × 1 × 1= 1 e a questa terna è associata la probabilità 0.23

Sulla base di queste considerazioni, la probabilità che la variabile casuale Y assuma il valore 𝑦 è data da

𝑓(𝑦) = 𝑃(𝑌 = 𝑦) = (𝑛

𝑦) 𝜋𝑦(1 − 𝜋)𝑛−𝑦, 𝑦 = 0, 1, … , 𝑛; 0 < 𝜋 < 1; 𝑛 ≥ 1

dove 𝜋𝑦(1 − 𝜋)𝑛−𝑦 è la probabilità di estrarre una particolare ennupla formata da 𝑦 successi e 𝑛 − 𝑦 insuccessi in un determinato ordine, mentre (𝑛

𝑦) rappresenta il numero di queste ennuple formate da 𝑦 successi e 𝑛 − 𝑦 insuccessi.

La distribuzione di probabilità così ottenuta è la binomiale, che risulta caratterizzata da due parametri:

𝑛 corrisponde al numero di estrazioni effettuate

𝜋 corrisponde alla probabilità del successo in una singola prova

(10)

La variabile casuale Y, nel nostro esempio il “numero di palline bianche estratte”, può assumere tutti i valori interi compresi fra 0 e 𝑛 e, come si è detto, la probabilità 𝑃(𝑌 = 𝑦) corrisponde alla somma delle probabilità associate a tutte le ennuple che contengono 𝑦 palline bianche e 𝑛 − 𝑦 palline nere, indipendentemente dall’ordine. A ciascuna di queste ennuple è associata la stessa probabilità 𝜋𝑦(1 − 𝜋)𝑛−𝑦 e il loro numero è (𝑛

𝑦).

Per 𝑛 = 1 la distribuzione Binomiale coincide con la distribuzione Zero-Uno.

Per determinare il valore atteso e la varianza della variabile Binomiale è opportuno considerare che a ciascuna delle 𝑛 prove è associata una variabile casuale Zero-Uno che assume valore 0 se si è ottenuto un insuccesso (ossia una pallina nera) e valore 1 se si è ottenuto un successo (ossia una pallina bianca).

Considerata la 𝑖-esima prova (con 𝑖 = 1, 2, ..., 𝑛), a questa è quindi associata la variabile casuale Zero-Uno 𝑋𝑖 “numero di successi alla 𝑖-esima prova” e la variabile casuale Y corrisponde alla somma delle 𝑛 variabili 𝑋𝑖 che hanno tutte una stessa funzione di probabilità e che risultano indipendenti fra di loro, dato che l’estrazione è con ripetizione. Risulta quindi

𝑌 = ∑ 𝑋𝑖

𝑛

𝑖=1

dove ogni 𝑋𝑖 è una Zero − Uno di parametro 𝜋

Una volta stabilita la relazione fra la Y e le 𝑛 variabili casuali Zero-Uno 𝑋𝑖 si ottiene facilmente il valore atteso della Y

(11)

Considerata la variabile casuale binomiale Y che corrisponde alla somma di 𝑛 variabili casuali Zero-Uno 𝑋𝑖 indipendenti e identicamente distribuite (i.i.d.)

𝑌 = ∑ 𝑋𝑖

𝑛

𝑖=1

il suo valore atteso è

𝐸(𝑌) = 𝐸 (∑ 𝑋𝑖

𝑛

𝑖=1

) = ∑ 𝐸(𝑋𝑖)

𝑛

𝑖=1

= 𝑛𝜋

e la sua varianza

Considerata la variabile casuale binomiale Y che corrisponde alla somma di 𝑛 variabili casuali Zero-Uno 𝑋𝑖 indipendenti e identicamente distribuite (i.i.d.)

𝑌 = ∑ 𝑋𝑖

𝑛

𝑖=1

la sua varianza è

𝑉(𝑌) = 𝑉 (∑ 𝑋𝑖

𝑛

𝑖=1

) = ∑ 𝑉(𝑋𝑖)

𝑛

𝑖=1

= 𝑛𝜋(1 − 𝜋)

dato che la covarianza fra le 𝑛 variabili casuali Zero-Uno è nulla in quanto le variabili sono indipendenti. La varianza della somma delle 𝑋𝑖 corrisponde quindi alla somma delle varianze.

Per indicare in modo sintetico la distribuzione di una variabile Y che si distribuisce come una binomiale di parametri 𝑛 e 𝜋 si utilizza spesso la seguente notazione

Y~Binomiale(𝑛; 𝜋)

(12)

ESEMPI

1. In una popolazione di 10 unità la variabile Z ha la seguente distribuzione Z Frequenze assolute

0 4

1 2

2 3

3 1

10

Si estragga con ripetizione un campione di 3 elementi e si indichi con X la variabile casuale “numero di individui con un valore della variabile pari a zero”.

Si determini la distribuzione di probabilità di tale variabile casuale, il suo valore atteso e la sua varianza e si calcolino inoltre le probabilità P(X ≤ 2) e P(X > 0).

La proporzione di unità con un valore di Z pari a zero è 0.4, per cui la X ha una distribuzione binomiale di parametri 𝑛 = 3 e 𝜋 = 0.4. La sua funzione di probabilità assume quindi la forma

𝑓(𝑥) = 𝑃(𝑋 = 𝑥) = (3

𝑥) 0. 4𝑥 × 0. 63−𝑥 𝑥 = 0, 1, 2, 3

Nella tabella successiva sono riportate le probabilità associate ai diversi valori della variabile

X Probabilità

0 0.216

1 0.432

2 0.288

3 0.064

1.000 E(X) = 𝑛𝜋 = 3×0.4 = 1.2

(13)

V(X) = 𝑛𝜋(1 − 𝜋) = 3×0.4×0.6 = 0.72 P(X≤2) = 1 − P(X=3) =1−0.064 = 0.936 P(X>0) = 1 − P(X=0) = 1−0.216 = 0.784

2. Dato un esperimento che consiste nell’estrazione di 3 palline con ripetizione da un’urna con 20 palline bianche e 80 rosse, si determini la probabilità degli eventi:

a) A “nella terna estratta compare almeno 1 pallina rossa”,

b) B “nella terna estratta compaiono al massimo due palline rosse”.

Indicata con X la variabile casuale “numero di palline rosse estratte”, risulta

a)𝑃(𝐴) = 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 1 − 𝑃(𝑋 = 0) =

= 1 − (3

0) 0. 80× 0. 23 = 1 − 0.008 = 0.992

b)𝑃(𝐵) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 1 − 𝑃(𝑋 = 3) =

= 1 − (3

3) 0. 83× 0. 20 = 1 − 0.512 = 0.488

3. Data una variabile casuale X che si distribuisce come una Binomiale di valore atteso 0.4 e varianza 0.32, determinare la probabilità che X assuma un valore:

a) minore di 1; b) pari a 1; c) maggiore di 2

(14)

In questo caso i parametri della binomiale non sono noti, ma possono essere ricavati dal valore atteso e dalla varianza. Ponendo a sistema le due equazioni seguenti

{𝑛𝜋 = 0.4

𝑛𝜋(1 − 𝜋) = 0.32

sostituendo la prima uguaglianza nella seconda equazione si ottiene 0.4(1 − 𝜋) = 0.32

(1 − 𝜋) =0.32

0.4 = 0.8 per cui

𝜋 =0.2

Sostituendo questa soluzione nella prima equazione del sistema si ottiene infine

𝑛 × 0.2 = 0.4 e quindi 𝑛 = 0.4

0.2= 2

Una volta ottenuti i parametri della binomiale si calcolano facilmente le probabilità

a)𝑃(𝑋 < 1) = 𝑃(𝑋 = 0) = (2

0) 0. 20× 0. 82 = 0.64 b)𝑃(𝑋 = 1) = (2

1) 0.2 × 0.8 = 0.32 c)𝑃(𝑋 > 2) = 0

(15)

In alcuni casi l’interesse dell’indagine consiste nel rilevare non il numero, ma la proporzione 𝑃̂ di unità statistiche che presentano una determinata caratteristica. Per esempio, si può voler conoscere la proporzione di

- spettatori che hanno seguito un programma televisivo - elettori che voterebbero un certo partito politico

- articoli difettosi prodotta da un macchinario.

La variabile di interesse 𝑃̂ è data dal rapporto fra il numero di unità che presentano la caratteristica di interesse e il numero totale di unità rilevate.

Indicata sempre con Y la variabile casuale “numero di successi”, la variabile di interesse corrisponde quindi a

𝑃̂ = 𝑌

𝑛 𝑝̂ = 0,1 𝑛,2

𝑛, . . . ,1

e la sua funzione di probabilità può essere ottenuta dalla funzione di probabilità della, tenendo presente che vale l’uguaglianza

𝑛𝑃̂ = 𝑌

Pertanto risulta

𝑓(𝑝̂) = 𝑃(𝑃̂ = 𝑝̂) = ( 𝑛

𝑛𝑝̂) 𝜋𝑛𝑝̂(1 − 𝜋)𝑛(1−𝑝̂) 𝑝̂ = 0,1

𝑛,2

𝑛, . . . ,1; 0 < 𝜋 < 1; 𝑛 ≥ 1

(16)

Il valore atteso e la varianza di 𝑃̂ si ottengono immediatamente tenendo presenti le proprietà delle trasformazioni lineari, per cui risulta

𝐸(𝑃̂) = 𝐸 (𝑌 𝑛) = 1

𝑛𝐸(𝑌) = 𝑛𝜋 𝑛 = 𝜋 𝑉(𝑃̂) = 𝑉 (𝑌

𝑛) = 1

𝑛2𝑉(𝑌) =𝑛𝜋(1 − 𝜋)

𝑛2 = 𝜋(1 − 𝜋) 𝑛

In base a questi due risultati si può concludere che la proporzione 𝑃̂ di successi rilevati nel campione è uguale, in media, alla proporzione di successi nella popolazione e che la varianza della proporzione campionaria 𝑃̂ diminuisce al crescere della numerosità campionaria, per cui i possibili risultati campionari tendono a concentrarsi intorno alla vera proporzione di successi nella popolazione.

Queste considerazioni saranno riprese in seguito, ma vale la pena anticipare che sono la base fondamentale su cui si basa l’inferenza statistica, ossia la base da cui si parte per estendere i risultati ottenuti sul campione a tutta la popolazione da cui il campione è stato estratto.

ESEMPIO

Dato un esperimento che consiste nel lancio di 4 monete equilibrate, determinare la distribuzione della variabile casuale 𝑃̂ “proporzione di teste” e determinarne il valore atteso, la deviazione standard e la moda.

Indicata con Y la variabile casuale “numero di teste”, si vede facilmente che la sua distribuzione è

Y~Binomiale(4; 0.5)

(17)

per cui le distribuzioni di probabilità delle due variabili casuali Y e 𝑃̂ sono 𝑃(𝑌 = 𝑦) = (4

𝑦) 0. 5𝑦 × (1 − 0.5)4−𝑦 𝑦 = 0, 1, 2, 3, 4 𝑃(𝑃̂ = 𝑝̂) = ( 4

4𝑝̂) 0. 54𝑝̂ × (1 − 0.5)4−4𝑝̂ 𝑝̂ = 0,1 4,2

4,3 4, 1

I valori delle probabilità associate ai singoli valori delle due variabili casuali risultano

Y 𝑃̂ 𝑃(𝑌 = 𝑦) = 𝑃(𝑃̂ = 𝑝̂) 0 0.00 0.54=0.0625 1 0.25 4×0.54=0.2500 2 0.50 6×0.54=0.3750 3 0.75 4×0.54=0.2500 4 1.00 0.54=0.0625

1.0000

I valori caratteristici di 𝑃̂ sono E(𝑃̂)= 𝜋 =0.5

𝑉(𝑃̂) = 𝜋(1 − 𝜋)

𝑛 =0.5 × 0.5

4 = 0.0625 La moda è 𝑀𝑝̂ = 0.5

Per la prossima lezione occorrono le tavole che sono riportate nell’appendice delle dispense

Riferimenti

Documenti correlati

Alla fine del 2003, sulla base delle risultanze anagrafiche, l'ammontare della popolazione residente ha raggiunto la cifra di 1.577.474 abitanti registrando un aumento di 5.277

Corso di STATISTICA MATEMATICA Prova scritta del

- Tasso di fecondità totale: misura l’intensità della fecondità, calcolato come somma dei quozienti specifici di fecondità (fx), ottenuti rapportando il numero di

- Tasso di fecondità totale: misura l’intensità della fecondità, calcolato come somma dei quozienti specifici di fecondità (fx), ottenuti rapportando il numero di

L’aumento del numero medio di figli per donna si è verificato tra il 1995 e il 2010 nelle regioni del Nord e nel Centro, per via del recupero delle nascite precedentemente

Convivenza: ai sensi dell’articolo 5 del regolamento anagrafico (DPR 223 del 1989): “agli effetti anagrafici per convivenza s’intende un insieme di persone normalmente

L’impatto dei comportamenti procreativi dei cittadini stranieri è ancora più evidente se si considera il complesso dei nati con almeno un genitore straniero che, come si è detto,

Ma anche se i nati da genitori stranieri sono aumentati in rapporto ai nati italiani, non significa necessariamente che i nati stranieri siano in gli stessi dati relativi