• Non ci sono risultati.

LA TEORIA DELLE PROBABILITA’ APPUNTI ED ESERCIZI Andrea Prevete, 2016

N/A
N/A
Protected

Academic year: 2021

Condividi "LA TEORIA DELLE PROBABILITA’ APPUNTI ED ESERCIZI Andrea Prevete, 2016"

Copied!
32
0
0

Testo completo

(1)

LA TEORIA DELLE

PROBABILITA’

APPUNTI ED ESERCIZI

(2)

LA TEORIA DELLE PROBABILITA’

Nel linguaggio di tutti i giorni utilizziamo frequentemente il termine probabilità per riferirci a situazioni di incertezza, a fatti che possono verificarsi o non.

Chiameremo fatti di questo tipo eventi aleatori o casuali.

Gli eventi aleatori possono essere molto differenti fra di loro, ma tutti hanno in comune la non predicibilità.

Una prima definizione di teoria delle probabilità può, quindi,

sicuramente essere quella di scienza che consente di formulare delle

valutazioni numeriche circa la fiducia che possiamo riporre nel fatto

che un certo evento aleatorio si verifichi o non.

(3)

PROBABILITA’ EX-ANTE O CLASSICA

Ci sono delle situazioni in cui la valutazione della probabilità di un evento (e quindi il grado di fiducia che possiamo riporre nel fatto che esso accada!) ci sembra assolutamente naturale solo ragionando sulle caratteristiche dell’evento stesso.

Mi aspetto, per esempio, che lanciando un dado la possibilità di ottenere un numero pari sia la stessa rispetto a quella di ottenere un numero dispari.

Utilizzando altre parole potremmo dire che lanciando più volte il dado ci aspettiamo che i numeri pari e dispari ottenuti corrispondano entrambi al 50% dei tentativi effettuati.

Il numero 50%, o 0.5, sembra effettivamente un ottimo indicatore per valutare la probabilità dell’evento.

Quando ragioniamo così abbiamo implicitamente eseguito i seguenti passi logici:

1) Scomposto l’esperimento «lancio di un dado» individuando tutti i possibili risultati: 1, 2, 3, 4, 5 o 6.

2) Verificato che tutti i risultati sono equivalenti, nel senso che non c’è ragione perché ci si debba aspettare l’uno piuttosto che l’altro

3) Contato quanti dei risultati sono favorevoli alla nostra ipotesi. Nel caso dell’ipotesi pari le uscite 2, 4 e 6: quindi 3.

4) Calcolato la quota parte dei risultati favorevoli rispetto a quelli possibili: 3 diviso 6, uguale 0.5 o in percentuale 50%

Questo modo di procedere, o di valutare la probabilità di un evento, è spesso riferito come interpretazione

(4)

PROBABILITA’ EX-POST O FREQUENTISTA

Ma cosa potremmo dire se volessimo valutare la probabilità di centrare un cestino della carta con un foglio appallottolato, per esempio da una distanza di quattro metri?

Non ci viene certamente in aiuto la scomposizione dell’esperimento in eventi elementari. Anzi ci sembra che le cose si complichino ulteriormente: carta dentro, carta di poco fuori a sinistra, carta sul bordo e poi fuori, di molto fuori a destra, etc etc. Non si tratta certamente di eventi aventi la stessa probabilità di verificarsi, o quantomeno non c’è motivo per esserne certi a-priori.

Il criterio più efficiente di valutazione, in casi come questi, è quello di effettuare una serie di «prove» - quindi di assegnare di conseguenza un valore alla probabilità che l’evento accada.

Ci mettiamo a quattro metri di distanza ed effettuiamo un congruo numero di lanci, per esempi 50, realizzando 15 centri. E’

una percentuale di successo del 30%.

Il numero 30% o 0.3 è sicuramente un ottimo indicatore della fiducia che possiamo riporre nella nostra «bravura» di tiratori.

Sappiamo adesso che la prossima volta che ci appresteremo ad effettuare il lancio avremo una probabilità pari al 30% di centrare il bersaglio.

Questo modo di procedere, o di valutare la probabilità di un evento, è spesso riferito come interpretazione «frequentista» o

«ex-post».

Frequentista perché basato sulla frequenza con cui abbiamo avuto successo durante i tiri di prova. Ex-post perché ottenuto non osservando le caratteristiche dell’esperimento, ma solo dopo aver effettuato i lanci di prova e preso atto dei relativi risultati.

E’ intuitivo osservare che, perché tale modo di procedere abbia significato, il numero di tentativi di prova deve essere grande.

Anzi, più grande è il suddetto numero, più è probabile che la frequenza che misuriamo si avvicini alla probabilità vera di

successo.

(5)

PROBABILITA’ SOGGETTIVA

Ci sono situazioni, tuttavia, per cui nemmeno le considerazioni di cui alla slide precedente ci sono d’aiuto.

Supponiamo di voler valutare la probabilità che un certo studente superi l’esame con il massimo dei voti.

Certamente non è pensabile di poter effettuare 100, 50 ma neanche 1 seduta di prova - nelle condizioni esatte in cui sarà sostenuto l’esame vero (quindi quei professori, quella ansia, etc)

Sembra proprio un problema senza via d’uscita. Appare impossibile poter assegnare un valore di probabilità, sia valutando le cose ex-ante che ex-post.

In effetti non è proprio così. Un modo c’è, anche se meno oggettivo.

Supponiamo di interpellare un congruo numero di esperti, per esempio 10 professori abituati a lavorare in commissione d’esame. Facciamo studiare a questi esperti la storia scolastica dello studente, quindi voti passati e presenti. Poi, casomai, gli facciamo anche avere un colloquio con lo studente per valutare il suo profilo psicologico, etc

Quindi facciamo votare i 10 esperti chiedendo loro se, sulla base della loro esperienza e sulla base dei dati che hanno acquisito, lo studente prenderà o meno il massimo dei voti.

Se 7 esperti sui 10 interpellati votassero sì, potremmo ragionevolmente affermare che lo studente ha una probabilità pari a 70% (o 0.7) di conseguire l’agognato massimo dei voti?

Si … se abbiamo scelto bene gli esperti, se questi ultimi hanno preso in considerazione tutti i dati

importanti, se etc. La sfilza di «se» che precede rende bene l’idea della differenza di quest’ultima

valutazione della probabilità rispetto alle precedenti e del perché viene definita «soggettiva».

(6)

PROBABILITA’, SCOMMESSE, QUOTE

Abbiamo preso in esame tre differenti modi di dare un senso quantitativo, quindi di assegnare un numero, all’idea di probabilità intesa come grado di fiducia circa il fatto che un evento accada.

Ripensando a tutto quanto esaminato possiamo concludere che, in ogni caso,

1) una probabilità pari a 0 certifica il fatto che l’evento non ha alcuna possibilità di accadere;

2) una probabilità pari a 1 (o, in percentuale, 100%) è l’indicazione di un fatto che certamente accadrà;

3) probabilità crescenti, comunque comprese fra 0 ed 1, stanno ad indicare gradi di fiducia via via maggiori riferiti alla possibilità che un evento accada

Spesso, invece che il grado di fiducia nel fatto che un evento accada (quindi la sua probabilità!), risulta utile misurare il grado di rischio connesso allo «scommettere» sull’evento.

Se, dovendo investire un certo capitale sul mercato azionario, scelgo di puntare sulle azioni di una certa azienda, sto in realtà scommettendo – valutando rischi e potenziali benefici - sull’andamento di quella azienda in un certo periodo.

Così come, quando per raggiungere una certa meta scelgo una strada breve ma qualche volta molto trafficata, ho valutato che la brevità del percorso sia un premio che compensi il rischio di incontrare un ingorgo.

Se, scommettendo su un incontro di pugilato fra il campione del mondo Tizio ed il carneade Caio, la vittoria di Caio è offerta a quota 10, significa che l’agenzia di scommesse riconosce che difficilmente Caio vincerà. Quindi scommettere su Caio comporta un rischio alto. Se identifichiamo questo rischio con la quota offerta per la scommessa, 10, apparirà evidente che la probabilità di vittoria di Caio può essere valutata 1/10, cioè 10%.

Una probabilità del 10% significa, infatti, che su 10 ipotetici incontri ci aspettiamo che Caio ne vinca 1. Quindi - scommettendo 10

volte una certa somma, diciamo 50 €, ho un esborso totale di 500 €. Ma, 1 volta su 10 vinco e quindi ricevo in premio la somma

scommessa (50€) moltiplicata per la quota di rischio riconosciuta dall’agenzia (10) – per un totale di 500€: esattamente quanto ho

(7)

PROBABILITA’ ASSIOMATICA

Dovrebbe essere chiaro, a questo stadio del discorso, che – indipendentemente dal modo in cui formuliamo i valori di probabilità di un evento – ci sono dei punti fissi da cui non è possibile prescindere.

Uno – forse il più importante - lo abbiamo già visto. Se chiamiamo X un qualsiasi evento, deve necessariamente essere:

Cioè la probabilità di un evento è un numero compreso fra 0 ed 1!

In particolare, poi, si avrà sempre che

In altre parole la probabilità dell’evento «impossibile» vale 0; la probabilità dell’evento «certo» vale 1.

Ma cosa intendiamo esattamente per evento «impossibile» ed evento «certo»?

(8)

PROBABILITA’ ASSIOMATICA

Per comprendere questo punto torniamo al primo esempio che abbiamo sviluppato, quello del lancio di un dado.

Chiamiamo E1, E2, E3, E4, E5, E6 i possibili eventi elementari che possono

verificarsi in esito ad un lancio, con l’ovvio significato per cui – ad esempio – E4 corrisponde all’uscita della faccia 4 del dado.

L’insieme di questi eventi elementari è spesso detto spazio campionario o universo e, ad ognuno di essi corrisponde una certa probabilità: in questo caso 1/6.

Gli eventi per cui è lecito calcolare un valore di probabilità sono, però, non solo

quelli elementari ma tutti quelli corrispondenti ai possibili sottoinsiemi dello spazio campionario. Quindi:

• {} : insieme vuoto, cioè l’evento impossibile,

• {E1}, {E2}, {E3}, {E4}, {E5}, {E6} : gli eventi elementari

• {E1, E2}, {E1, E3}, …. {E1, E2, E5}, … : i vari eventi composti

• {E1, E2, E3, E4, E5, E6} : insieme universo, cioè l’ evento certo,

(9)

PROBABILITA’ ASSIOMATICA

Come si costruiscono questi sottoinsieme e, quindi, gli eventi composti?

Semplicemente applicando i connettivi logici  (non), (o), (e) agli eventi elementari o ad altri eventi composti. Esempio:

 si interpreta come l’evento «non uscirà la faccia 2»

e corrisponde quindi al sottonsieme dello spazio campionario:

{E1, E3, E4, E5, E6} , cioè «una faccia qualsiasi eccetto la 2»

E1  E2 si interpreta come l’evento «uscirà la faccia 1 e la faccia 2» e corrisponde quindi al sottoinsieme dello spazio campionario:

{} , cioè «nessuna faccia è compatibile con il fatto di dover valere contemporaneamente 1 e 2»

E1  E2 si interpreta come l’evento «uscirà la faccia 1 o la faccia 2» e corrisponde quindi al sottonsieme dello spazio campionario:

{E1, E2}

(10)

PROBABILITA’ ASSIOMATICA

In un certo senso l’ultima costruzione è la più importante. Infatti con l’operatore  possiamo «edificare mattoncino su mattoncino» l’evento composto desiderato e poi semplicemente fare una somma.

Se E1  E2 corrisponde al sottoinsieme dello spazio campionario {E1, E2} è logico – infatti - attendersi che vale il cosiddetto assioma di additività:

p(E1  E2) = p(E1)+p(E2)

La legge continua a valere per eventi più complicati. Ad esempio, se costruiamo l’evento composto X = E1  E3  E5  E6, si avrà:

p(X) = p(E1  E3  E5  E6) = p(E1)+p(E2)+p(E3)+p(E4)

Attenzione. C’è però un tranello. Consideriamo infatti i due eventi composti:

X = E1  E2  E3  E4 cioè «la faccia 4 oppure una di minor valore»

Y = E3  E4  E5  E6 cioè «la faccia 3 oppure una di valore maggiore»

(11)

EVENTI COMPATIBILI ED INCOMPATIBILI

Volendo calcolare la probabilità dell’evento Z = X  Y, l’applicazione della legge precedente darebbe:

p(Z) = p(X  Y) = p(X)+p(Y) Un rapido calcolo dà

Dove sta l’errore? L’assioma di additività, come l’abbiamo enunciato, vale sempre per gli eventi elementari.

Per gli eventi composti, continua a valere solo se questi sono INCOMPATIBILI, ossia se X  Y è l’evento nullo – ossia non può verificarsi.

Nel nostro caso, invece, X ed Y possono accadere contemporaneamente – basta che si verifichi l’uscita della faccia 3 o quella della faccia 4.

Quindi, per X ed Y composti, la forma corretta dell’assioma è:

p(X  Y) = p(X)+p(Y)-p(X  Y)

Un rapido calcolo dà, adesso, p = + - come deve essere!

(12)

EVENTI INDIPENDENTI

Concentriamoci adesso su di un argomento molto importante. Continuando a ragionare sui possibili risultati del lancio di un dado, consideriamo i seguenti due eventi composti:

X, sia l’evento per cui lanciando il dado viene fuori un numero pari;

Y, sia – invece - l’evento per cui lanciando il dado viene fuori un numero minore di 3;

C’è una legge analoga a quella dell’addizione per X  Y? Proviamo, scrivendo per esempio:

p(X  Y) = p(X)  p(Y)

Si, è proprio quello che succede. Con rapidi calcoli si ottiene:

p(X  Y) = p(X)  p(Y) =  = =

Che è esattamente quello che ci aspettiamo considerando che l’unica possibilità di una faccia pari e minore di 3 è 2. Quindi 1 possibilità su 6.

Piano con l’entusiasmo. Quella appena vista è una situazione particolare resa possibile dal fatto che i due eventi X ed Y sono INDIPENDENTI, ossia la probabilità di verificarsi di ognuno dei due non è influenzata dal fatto che si sia verificato l’altro.

In altre parole: la probabilità che esca un numero pari è = . Se anche sapessi che il lancio ha prodotto un

numero <3, la probabilità che il numero sia pari sarebbe ancora : la stessa di prima.

(13)

EVENTI INDIPENDENTI

Nel caso generale di eventi NON INDIPENDENTI il calcolo della probabilità del verificarsi di X  Y deve essere effettuato in uno dei seguenti modi:

p(X  Y) = p(X)  p(Y/X) oppure

p(X  Y) = p(Y)  p(X/Y)

Nelle due formule precedenti compaiono due nuovi termini che esprimono le cosiddette PROBABILITA’ CONDIZIONATE. In particolare,

• P(Y/X) esprime la probabilità che, essendo verificato X, sia verificato anche Y

• P(X/Y) esprime la probabilità che, essendo verificato Y, sia verificato anche X Vediamo un semplice esempio.

In un istituto scolastico la percentuale dei maschi sul totale degli studenti frequentanti è il 60%.

Nella sezione A – che raccoglie il 15% degli studenti della scuola -, però, tale percentuale scende al

40%. Dovendo procedere per sorteggio all’elezione di un rappresentante degli studenti della scuola

per una data manifestazione cittadina, che probabilità c’è che sia scelto uno studente maschio della

sezione A?

(14)

PROBABILITA’ CONDIZIONATE

La soluzione

p( «maschio»  «sezione A») = p(«maschio»)  p(«sezione A») = 60%  15% = 9%

per quanto abbiamo precedentemente detto non funziona. Infatti la probabilità di pescare uno studente maschio non è indipendente dalla sezione!

Quindi la soluzione corretta è

p( «maschio»  «sezione A») = p(«sezione A»)  p(«maschio»/«sezione A») = 15%  40% = 6%

Particolarmente utili risultano anche le formule inverse che consentono di calcolare le probabilità condizionate di un evento rispetto ad un altro, conoscendo le probabilità dei singoli eventi e quelle degli eventi congiunti:

• p(Y/X) = p(X  Y) p(X)

• p(X/Y) = p(X  Y)

p(Y)

(15)

PROBABILITA’ TOTALI

Adesso abbiamo gli strumenti per comprendere uno dei risultati più importanti della teoria delle probabilità, il cosiddetto teorema delle probabilità totali.

Per introdurlo usiamo, come al solito, un esempio.

Immaginiamo che le famiglie di una certa comunità siano state suddivise in tre fasce, a secondo del loro reddito complessivo. Quindi una famiglia qualsiasi della comunità può essere catalogata come

«povera» (il 15% del totale delle famiglie)

«dignitosa» (il 60% del totale delle famiglie)

«ricca» (il 25% del totale delle famiglie)

Un’ ulteriore indagine ha stabilito, inoltre, che solo il 20% delle famiglie della prima fascia ha una casa di proprietà, contro il 50% delle famiglie della seconda fascia ed il 92% delle famiglie della terza fascia.

Qual è la probabilità che una famiglia della comunità, scelta a caso, sia proprietaria

di una casa?

(16)

PROBABILITA’ TOTALI

Per il modo in cui è stata suddivisa la comunità - ossia ogni famiglia appartiene ad una ed una sola delle fasce di reddito (povera, dignitosa, ricca) – possiamo

affermare che vale la relazione:

p(«casa»)=p(«casa»  «povera») + p(«casa»  «dignitosa» ) + p(«casa»  «ricca») Ma, ricordando le relazioni sugli eventi composti:

p(«casa»  «povera»)=p(«povera»)  p(«casa» / «povera») = 0.15  0.2 = 0.03

p(«casa»  «dignitosa»)=p(«dignitosa»)  p(«casa» / «dignitosa») = 0.6  0.5 = 0.3 p(«casa»  «ricca»)=p(«ricca»)  p(«casa» / «dignitosa») = 0.25  0.92 = 0.23

Mettendo assieme i risultati:

p(«casa») = 0.03 + 0.3 + 0.23 = 0.56 = 56%

Quindi, scegliendo a caso una famiglia della comunità, abbiamo

il 56% di probabilità di aver selezionato una famiglia con casa di

proprietà.

(17)

PROBABILITA’ TOTALI

Il risultato ottenuto per lo specifico esempio considerato può essere generalizzato con la importantissima formula delle probabilità totali:

La formula consente di calcolare la probabilità di un evento qualsiasi X, conoscendo la probabilità del suo verificarsi a condizione che siano

verificati gli eventi disgiunti A 1 , A 2 , A 3 , ..., A N – eventi di cui si conosce la probabilità e che nel loro assieme esauriscono lo spazio delle

probabilità (cioè non può accadere niente che non sia A 1 o A 2 o A 3 … o

A ).

(18)

IL TEOREMA DI BAYES

Riconsideriamo le formule ricavate per le cosiddette probabilità condizionate:

p(Y/X) = p(X  Y) p(X) p(X/Y) = p(X  Y)

Se dalla prima ricaviamo p(X  Y) e la sostituiamo nella seconda, otteniamo: p(Y) p(X/Y) = p(Y/X) · p(X)

p(Y)

Questa è la formulazione più semplice del cosiddetto teorema di Bayes e può essere interpretata così:

Se X è un evento che può essere causa dell’evento Y, allora posso calcolare la probabilità che – una volta accaduto Y – questo sia stato causato proprio da X …..

a condizione di conoscere la probabilità p(Y/X) che accada Y ogni qualvolta accade X e le probabilità

a-priori (cioè indipendenti dagli altri eventi) per X ed Y.

(19)

IL TEOREMA DI BAYES

Come al solito, utilizziamo un esempio appropriato per familiarizzare con la teoria.

Le statistiche di un certo istituto dicono che gli episodi più frequenti e gravi di violazione delle regole scolastiche hanno come protagonisti il 10% degli studenti maschi ed il 2% delle studentesse.

Con il linguaggio della teoria delle probabilità possiamo quindi dire che p( «violazione» / «maschio») = 10%

p( «violazione» / «femmina») = 2%

Cioè, dato uno studente scelto a caso, se è maschio la probabilità che prima o poi si macchierà di una violazione delle regole è del 10%, del 2% se è una femmina.

Supponiamo ora che in una classe vi siano 5 studenti maschi e 15 femmine.

Di fronte ad un episodio di violazione delle regole sicuramente avvenuto in quella classe – per esempio una pagina strappata nel registro di classe durante il cambio dell’insegnante - è lecito indagare soprattutto sul comportamento di uno dei 5 studenti maschi?

Per quanto non fondato scientificamente è esattamente questo che avviene nella norma. Si tende,

cioè, quando si indaga sulla possibile causa di un evento accaduto, a privilegiare le informazioni che

si hanno sulle cosiddette probabilità causa->effetto. Quindi dato che i maschi sono responsabili di

violazione delle regole con probabilità molto più alta che le femmine il colpevole è un maschio!

(20)

IL TEOREMA DI BAYES

Applichiamo il teorema di Bayes:

p(«maschio» / «violazione») = p(«violazione» / «maschio») · p(«maschio») p(«violazione»)

= p(«violazione») = . · . p(«violazione») . %

p(«femmina» / «violazione») = p(«violazione» / «femmina») · p(«femmina») p(«violazione»)

= p(«violazione») = . · . p(«violazione») . %

(21)

IL TEOREMA DI BAYES

Già così è evidente come, quando si tiene conto del contesto degli avvenimenti (cioè del fatto che nella classe dove è avvenuto il misfatto ci sono molte più femmine che maschi), la probabilità che la pagina del registro sia stata strappata da un maschio è solo di poco

superiore alla probabilità che sia stata strappata da una femmina.

Se si volesse conoscere il valore esatto delle probabilità occorrerebbe calcolare

p(«violazione»), ossia la probabilità che una violazione delle regole avvenga proprio in quella classe.

Questo si può fare con il teorema della probabilità totale:

p(«violazione») = p(«maschio»)  p(«violazione» / «maschio»)+

p(«femmina»)  p(«violazione» / «femmina») = 2.5% + 1.75% = 4.25%

Sostituendo nelle relazioni precedenti:

p(«maschio» / «violazione») = . . % %

p(«femmina» / «violazione») = . %

(22)

IL TEOREMA DI BAYES

Nella sua formulazione più generale, il teorema di Bayes, considerate tutte le possibili cause dell’evento Y (cioè gli

eventi X 1 , X 2 , X 3 , .., X N a due a due incompatibili e così che X 1  X 2  X 3  ..  X N coincida con l’intero spazio campionario

può essere così espresso:

p(X k /Y) = p(Y/Xk) p(X k ) p(Y/Xi) p(Xi)

dove k è uno qualsiasi dei valori 1, 2, .. N.

(23)

EVENTI RIPETUTI

Un problema molto comune è quello della valutazione della probabilità che un certo evento si manifesti con esito positivo un numero esatto di volte in seguito ad un numero prefissato di tentativi.

Definiamo con più precisione i contorni del problema utilizzando, al solito, un esempio.

Supponiamo che un bravo arciere abbia nel corso dell’ultimo anno di gare dimostrato di fare centro con una frequenza pari al 60%. In base alla definizione frequentista delle probabilità, possiamo quindi supporre, ogni qualvolta l’arciere si appresta a scoccare la freccia, che la sua probabilità di fare centro è p=0.6.

Ammettiamo ora che una gara sia composta da una sequenza di 10 tiri. Qual è la

probabilità che il nostro arciere centri il bersaglio un numero esatto di volte, per esempio 8?

Se chiamiamo S l’evento «successo» ed F l’evento «fallimento», le sequenze SFSSSSSSFS, SSSSSSSSFF, FFSSSSSSSS, etc

saranno tutte buone perché contengono otto centri e due fallimenti.

(24)

EVENTI RIPETUTI

Concentriamoci sulla prima delle suddette sequenze e valutiamo la sua probabilità.

p(SFSSSSSSFS) = p(S)  p(F)  p(S)  p(S)  p(S)  p(S)  p(S)  p(S)  p(F)  p(S)

La probabilità dell’evento composto «sequenza di tiri» è la moltiplicazione dei singoli eventi elementari perché indipendenti (infatti il sussesso o non di un tiro non influenza la

probabilità di successo degli altri!) Ma,

p(S) = 0.6 per ipotesi,

p(F) = 0.4 perché ovviamente S+F= e p( )=1.

Quindi

p(SFSSSSSSFS) = 0.6 8  0.4 2 0.003 = 0.3% cioè 3 per mille!!!

Com’è possibile che per un arciere così bravo sia così bassa la probabilità di concludere una

gara da 10 tiri con 8 successi?

(25)

EVENTI RIPETUTI

Ma certo! Abbiamo calcolato la probabilità della sequenza SFSSSSSSFS, ma esistono tanti altri modi di fare esattamente 8 centri – per esempio SSSSSSSSFF, FFSSSSSSSS, etc.

E’ immediato convincersi che ognuna di queste sequenze ha la stessa probabilità di verificarsi, nel nostro caso 0.3%. Quindi non dobbiamo fare altro che contare il

numero di sequenze che danno 8 centri e 2 fallimenti e moltiplicare questo numero per 0.3%.

Facile! Basta calcolare il numero di permutazioni di 10 elementi suddivisi in due gruppi identici, il primo di 8 elementi (i successi), il secondo di 10-8=2 elementi (i fallimenti). Quindi:

p(SFSSSSSSFS) = ! ! !  0.6 8  0.4 2 = 45  0.6 8  0.4 2  12%

Questo è il risultato che cercavamo!

(26)

FORMULA DI BERNOULLI

Quanto appena visto può essere generalizzato con le celeberrime formule di BERNOULLI:

p( k successi su n tentativi ) =  p k  (1-p) n-k

p( al più k successi su n tentativi ) =  p i  (1−p) n−i

dove p è la probabilità di successo del singolo tentativo ed, ovviamente,

(1-p) la rispettiva probabilità di fallimento.

(27)

PROBLEMI RISOLTI

1. Un libro in quattro volumi è disposto a caso sullo scaffale di una libreria. Qual è la probabilità che l’ordine sia quello giusto – quindi, da sinistra a destra, primo volume, secondo volume, etc?

Considerate equiprobabili tutte le disposizioni possibili, basta contarle e calcolare la probabilità voluta come:

p =

( è )

( è )

Ma N=P

4

=4!=24, quindi p =

≃ 0.04 = 4%

2. Una password di lunghezza 5 caratteri è stata impostata utilizzando lettere minuscole dell’alfabeto e cifre

decimali. Sapendo che la password contiene almeno una cifra decimale, qual è la probabilità - digitando a caso - di centrare la sequenza corretta?

Dati i 36 (26 lettere dell’alfabeto latino + 10 cifre decimali) caratteri disponibili, possiamo comporre

,

= 36 = 60466176 password distinte Quelle composte da soli simboli alfabetici sono:

,

= 26 = 11881376

Le possibili password valide sono, quindi:

N= 60466176 – 11881376 = 48584800 Da cui la probabilità cercata:

p =

≃ 0.00000002

(28)

PROBLEMI RISOLTI

3. In due partite le quote offerte da un’agenzia di scommesse per il pareggio sono rispettivamente 4 e 2. Qual è la probabilità che solo una delle partite finisca con un pareggio? E quella che almeno una delle partite finisca con un pareggio? E quella, infine, che non ci sia nessun pareggio? Quale dovrebbe essere la quota offerta per quest’ultimo evento?

Ricaviamo le probabilità riferite alle singole partite calcolando i reciproci delle quote. Se chiamiamo X1ed X2, rispettivamente l’evento «prima partita finisce in parità» e «seconda partita finisce in parità», avremo:

p(X1) = = 0.25; p(X2) = = 0.5

Costruiamo ora gli eventi di cui la traccia ci chiede la probabilità, a partire da X1ed X2 :

=(  ) ∨ ( ∧ )

= ∨

=

Prestando attenzione alla compatibilità di X1ed X2, si avrà:

p( ) = (0.25·0.5)+(0.5·0.75) = 0.125 + 0.375 = 0.5 = 50%

p( ) = 0.25 + 0.5 − 0.25·0.5 = 0.75 − 0.125 = 0.625 = 62.5%

p( ) = 1-0.625=0.375 = 37.5%

= 1

( )≃ 2.7

(29)

PROBLEMI RISOLTI

4. Un’azienda dispone di tre tipi di macchinari – A, B e C – per assemblare un dato prodotto. Ogni prodotto richiede 5 minuti di lavoro con un macchinario A, oppure 15 con un macchinario B, oppure 6 con C. A, B e C lavorano

continuamente e mediamente commettono un’imperfezione ogni ora di attività. Quanti saranno, in media, i pezzi difettosi ogni cento prodotti dall’azienda?

Dai dati del problema è semplice ricavare:

p(«danneggiato» / «lavorato da A»)=

≃ 0.08 = 8%

p(«danneggiato» / «lavorato da B»)=

= 0.25 = 25%

p(«danneggiato» / «lavorato da C»)=

= 0.1 = 10%

p(«lavorato da A»)=

=

≃ 0.46 = 46%

p(«lavorato da B»)=

=

≃ 0.155 = 15.5%

p(«lavorato da C»)=

=

≃ 0.385 = 38.5%

Applicando il teorema delle probabilità totali, otteniamo il risultato voluto:

p(«danneggiato») = 0.08·0.46+0.25·0.155+0.1·0.38

(30)

PROBLEMI RISOLTI

5. Riconsideriamo il problema precedente. Qual è la probabilità che, trovato un prodotto danneggiato, sia stato assemblato dal macchinario B?

Adoperando il formalismo delle probabilità condizionate, la domanda della traccia significa chiedersi quanto vale p(«lavorato da B» /

«danneggiato»). Applichiamo il teorema di Bayes:

p(«lavorato da B» / «danneggiato») = p(«danneggiato» / «lavorato da B» ) · p(«lavorato da B»)p(«danneggiato» )

Sostituendo i valori ricavati precedentemente:

p(«lavorato da B» / «danneggiato») = 0.25 · 0.155

0.115 ≃ 0.335= 33.5%

Se calcoliamo le probabilità che la «causa» del guasto rilevato sia stata la lavorazione del macchinario A oppure quella del macchinario C, troviamo:

p(«lavorato da A» / «danneggiato») = 0.08 · 0.46

0.115 ≃ 0.32= 32%

p(«lavorato da C» / «danneggiato») = 0.1 · 0.385

0.115 ≃ 0.335= 33.5%

Sostanzialmente i calcoli effettuati ci informano del fatto che, trovando un pezzo guasto, non abbiamo nessuna ragione per incolpare uno dei tre macchinari più degli altri – dato che le probabilità relative alle tre ipotesi sono equivalenti! Questo risultato, ad una prima superficiale analisi del problema, può essere considerato sorprendente. Infatti il macchinario B sembra il colpevole predestinato, vista l’alta percentuale statistica di pezzi difettosi che rilascia (1 su 4)! Questa frettolosa conclusione non terrebbe però conto del fatto che B lavora pochi pezzi rispetto agli altri macchinari, quindi è, a-priori, improbabile come causa del problema riscontrato. Il teorema di Bayes consente, appunto, di ottenere risultati che tengano correttamente conto della probabilità a-priori delle cause.

(31)

PROBLEMI RISOLTI

6. Una società di trasporti organizza ogni mese 1 viaggio turistico con meta una capitale europea e vorrebbe dare una copertura assicurativa a questi viaggi. La società assicuratrice a cui si rivolge, utilizzando dati statistici in suo possesso, calcola che questo tipo di viaggi può essere turbato da un incidente serio con probabilità p=5%.

Propone, quindi, alla società di trasporti una polizza con validità annuale che prevede un risarcimento nel caso che durante l’anno si siano verificati almeno tre incidenti seri.

Qual è la probabilità che, a fronte di incidenti, la società di trasporti non riceva alcun risarcimento? E quella per cui riceva un risarcimento?

E’ evidente che bisogna applicare lo schema delle prove ripetute di Bernoulli.

p1 = p(«1 incidente su 12 viaggi») =

!( ! )!

 0.05

1

 (1-0.05)

12-1

= 12  0.05  (0.95)

11

≃ 0.34 = 34%

p2 = p(«2 incidenti su 12 viaggi») =

!( ! )!

 0.05

2

 (1-0.05)

12-2

= 66  0.0025  (0.95)

10

≃ 0.10 = 10%

Quindi:

p(«incidenti senza risarcimento») = p1 + p2 = 34% + 10% = 44%

p0 = p(«0 incidenti su 12 viaggi») =

!( ! )!

 0.05

0

 (1-0.05)

12-0

= 1  1  (0.95)

12

≃ 0.05 = 0.54 = 54%

Quindi:

p(«incidenti con risarcimento») = 1 – p0 - p1 - p2 = 100% – 54% - 34% - 10% = 2%

(32)

THE END

Riferimenti

Documenti correlati

A questo proposito, il problema di fondo è il seguente: i campioni che arrivano, in forma binaria, all’interpolatore, non arrivano in modo continuo, ma intervallati tutti di uno

aleatoria sono i numeri interi compresi fra 1 e 90, la probabilità associata a ciascuno di essi è 1/90, la distribuzione di probabilità associata all’estrazione del lotto è la

Ovvero la probabilità che nella centesima “estrazione” il numero N continui a non essere estratto, se non è mai stato estratto nelle 99 “estrazioni” precedenti

La serie `e, invece, assolutamente divergente per x &lt; −3/2 e x &gt; 3/2 e, come conseguenza del criterio della radice, si ottiene anche che il termine generale non ` e

Questo file è una estensione online dei corsi di matematica di Massimo Bergamini, Anna Trifone e Graziella

Tuttavia, esiste una profonda dif- ferenza tra la raccolta di informazioni e la statisti- ca inferenziale che ha portato alla definizione di un ampio gruppo di metodi statistici

Il margine totale, MT (calcolato sottraendo al tempo «al più tardi» del nodo destinazione il tempo «al più presto» del nodo origine e la durata dell’attività) valuta di

Il dominio (o insieme d’esistenza) di una funzione z=f(x,y) è l’insieme di tutte le coppie di valori delle variabili indipendenti a cui è possibile associare un valore della