A8=9> + ' M9J] Ä U _ p palline8:9; + \ ] X[X[X[X _acbed + ^ "ãf 4 \ Í ê X[X[X[X acbd + ^ "ãf media 30 stud. in8:9;304 4 \ ö CW04 4 4 4 @ A8:9;(04B:m 04 4 4 4 @ A8:9;(04B hn4 D @
media Ó*# hE 4 vedi tabelle distr. normale
p media Ó*# hE \ ] U Ä _acbmediaE >~[Ä f @ p media Ó*# hEäÓÒhE ' ä Ý A6J] U Ä _acbmediaE >~[Ä f @ p
media Ó*# hEN'*hE ' #xo57 3½¾5
Nel penultimo passaggio
Ý
E indicava la distribuzione cumulativa. Il risultato finale `e dato per permettere di verificare i conti.
7.11 ❄ Le distribuzioni osservate “erano” sempre
mol-to poco probabili!
Nei paragrafi precedenti abbiamo confrontato pi`u volte le previsioni delle di-stribuzioni statistiche con quanto ottenuto nelle esperienze simulate e, prati-camente, ogni volta queste ultime erano in ottimo accordo con le aspettative (tenendo conto delle incertezze di previsione). Al fine di togliere di mente a qualcuno che si fosse fatto l’idea strana che “la distribuzione sperimentale si `e verificata perch´e era altamente probabile”, calcoliamo ora la probabilit`a di una particolare distribuzione. Per semplicit`a, consideriamo nuovamente l’e-sperienza del contatore, ed, in particolare, l’esperimento del numero di conteg-gio a tempi prefissati. Cominciamo con il caso di¢
'vh s. Le probabilit`a sono gi`a state riportate nella tabella 7.3. Le previsioni della frequenza dei possibili numeri di conteggi osservabili in 100 misure sono:
p 4 conteggiC' yo57}VÁ D 57x p conteggiC' hn57hVÁ D 57} p
A6 conteggiC' yo5
D Áº6o5 p Ah conteggiC' n57VÁ,n576 p D conteggiC' 4576VÁð45 D p Ó conteggiC' 454E6VÁð45g#
La distribuzione osservata, con una frequenza di conteggi da 0 a 4 rispettiva-mente di 56, 32, 9, 2 e 1 occorrenze, `e in ottimo accordo con le previsioni. Ci`o nonostante la probabilit`a di osservare tale risultato (ovviamente “prima” del-l’esperimento, o comunque non conoscendone l’esito), `e molto piccola, come calcolabile facendo uso della distribuzione multinomiale3 e delle probabilit`a
3
Si noti gli infiniti termini corrispondenti aFGHI ,F!JHKI , etc., valgono tutti 1, in quanto oILMHON oPRQ
"
HSN , e quindi possono essere ignorati.
7.11 ❄ Le distribuzioni osservate “erano” sempre molto poco probabili! 133 Risultati Numero di conteggi Probabilit`a
0 1 2 3 4 5 6 7 í 56 32 9 2 1 0 0 0 D 57 O 04 íVU 63 29 7 3 0 0 0 0 n5g O 04 Ä í Ä 59 31 8 2 0 0 0 0 6o57} O 04 Ä íq 54 36 7 2 1 0 0 0 6o57y O 04 í ~ 55 34 10 1 0 0 0 0 6o576 O 04 Ä í | 52 37 8 3 0 0 0 0 o576 O 04 í { 70 22 5 2 1 0 0 0 6o5 D O 04 ~ í z 69 26 4 0 1 0 0 0 D 576 O 04 ~ í 53 29 13 3 1 1 0 0 n5g O 04 | íÜX 52 27 15 5 0 1 0 0 n57 O 04 { íÜ[ 45 28 18 5 3 1 0 0 `5 D O 04 U í U 71 19 2 1 3 1 2 1 ho54 O 04 U[X í >Ä 90 5 2 1 0 1 0 1 ho54 O 04 U[X í ; 24 52 0 8 0 4 4 8 ho5 O 04 {Ä í >~ 0 100 0 0 0 0 0 0 ho5 O 04 ~Æ
Tabella 7.6: Possibili risultati di 100 misure di conteggio da 3 secondi relative ad un fenomeno descritto da un processo di Poisson di intensit`a¯&°*±E²e³H´#µ conteggi al secondo. della tabella 7.3: 04 4 }o=h 6o=xo=6o#n 457 y } ~[| L#457h#h Ä U L454Ey h } L#454î D x U L454 4E6n4 ' D 57 O 04 5
Per confronto, riportiamo nella tabella 7.6 altre distribuzioni che sarebbero ugualmente risultate in “buon accordo” con le previsioni (í -í ~ ), altre per le quali l’accordo sarebbe stato giudicato “marginale” (í | -í X ) e altre che sarebbero risultate “sospette” (í [ -í >~ ). Si noti comunque che nessuna delle distribuzioni `e incompatibile con le previsioni. Questo dovrebbe servire ad abituarsi all’idea che una legge probabilistica non pu`o mai essere falsificata. Al pi`u, si potr`a attribuire ad essa un basso grado di fiducia alla luce dei dati osservati e della possibilit`a di altre ipotesi.
Si noti inoltre come la probabilit`a di una possibile distribuzione dipende da quanti sono i possibili esiti che hanno probabilit`a confrontabile fra loro e per i quali ci si attende una frequenza di conteggio sostanzialmente diversa da zero. Ad esempio le misure di conteggio a 100 secondi (tabella 4.1) mostrano un buon accordo con le previsioni (tabella 7.3), ma la loro probabilit`a sarebbe stata @ z 'wnm[ 'wnm050505: { 'w nm[ >z 'w#hom0505053'vho57h O 04 > 5
Finora abbiamo considerato soltanto la probabilit`a di distribuzioni statisti-che, ovvero avendo gi`a raggruppato i possibili esiti sotto forma di tabella e
134 Previsioni dei risultati avendo considerato la frequenza con la quale ciascun esito si pu`o verificare. Non si `e tenuto conto dell’ordine con cui si possono presentare i possibili esi-ti. Nel caso dei dati del contatore per¢
'ïh s la probabilit`a di osservare una sequenza come quella della tabella 1.1 vale:
@ UT4m4m4m4m4m0m=6om# m0L#L0Lrm#nm4m4VÅ ' 457 y } ~[| L#457h#h Ä U L454Ey h } L 454î D x U L#454 4E6n4 ' }o57 O 04 | 5
Il motivo per cui la probabilit`a della distribuzione `e invece 42 ordini di gran-dezze maggiore `e dovuto al grandissimo numero di sequenze che possono produrre la stessa distribuzione, dato dal coefficiente multinomiale
04 4 }o=h 6o=xo=6o#n ',457} x O 04 U 5
Ovviamente, nel caso delle misure da 100 secondi la probabilit`a della partico-lare sequenza sar`a ancora pi`u piccola, ed esattamente
@ UTB D m=6 6om##hom0L0L0L3m=6n4m=6 6!VÅÇ'v}o57} O 04 U ~
e, ci`o nonostante, . . . l’abbiamo osservata. Si faccia quindi attenzione ad espres-sioni fuorvianti del tipo “praticamente impossibile” riferito ad eventi che rite-niamo molto poco probabili (ad esempio aventi probabilit`a inferiore a04
|
). `E vero s`ı che essi possono avere probabilit`a “praticamente nulla”, ma non `e cor-retto escludere tali eventi dalle nostre considerazioni, altrimenti pu`o accadere, come nell’esempio che stiamo trattando, di dover escludere tutti i possibili esiti dell’esperimento.
7.12 ❄ Simulazioni
L’importanza di aver introdotto il processo di Bernoulli consiste nell’aver po-tuto ricondurre molte distribuzioni di probabilit`a (geometrica, binomiale, Er-lang) ad un solo processo elementare. La probabilit`a di eventi complicati sono quindi calcolati dalla probabilit`a di eventi semplici, applicando le regole gene-rali della probabilit`a. Non sempre `e possibile arrivare a formule compatte per calcolare la probabilit`a degli eventi di interesse. Si ricorre allora a simulazioni di processi elementari che compongono l’evento complicato. Questi metodi di simulazione sono chiamati di “Monte Carlo”, in quanto fanno uso di estrazioni casuali di numeri, un po’ come avviene in un casin`o.
Come esempio di un semplice problema impossibile analiticamente, si pensi al Gioco dell’Oca.4 Per esempio, si pu`o essere interessati al numero di
4
Come `e noto, questi giochi di societ`a si presentano con delle varianti. La simulazione che segue `e stata effettuata seguendo le regole della confezione Familienspiele della Ravensburger: alle caselle 5, 9, 23, 41 e 45 si indietreggia di quanto si era avanzato; alle caselle 14, 18, 27, 32, 36 e 50 si avanza di quanto si era gi`a avanzato; (se dalla 18 si finisce poi alla 23, o dalla 50 alla 54, si sta fermi un giro nella casella di arrivo); dalla casella 6 si avanza alla 12 e dalla 42 si retrocede alla 30; alle caselle 19 e 52 si sta fermi due giri; alla casella 31 si ha diritto ad un ulteriore lancio di dadi (due); se si va oltre la casella 63 si rimbalza dei punti che eccedono quelli per arrivare alla 63; si vince se si arriva esattamente alla casella 63. Applicando alla lettera il regolamento, si incontrano delle condizioni di loop infinito: se, essendo nella 23, si ottiene 9 ai dati, o se dalla 31 si ottiene 5. Si `e pertanto deciso di arrestarsi dopo la prima retrocessione.
7.12 ❄ Simulazioni 135 20 40 60 80 100 g 1000 2000 3000 4000 5000 n
Figura 7.2: Risultato della simulazione di 10ü000 volte del gioco dell’oca condotto da una sola persona: distribuzione del numero di giri (W ) necessari per vincere. Il diagramma a barre `e troncato aWV°º³Æ±± (5 partite superano tale limite).
giri necessari per vincere. Oppure, si immagini di entrare in una stanza dove alcuni bambini stanno giocando al gioco dell’oca. Quanto vale la probabilit`a che la pedina di un certo bambino che abbia passato il suo turno si trovi in una delle caselle numerate da 1 a 62 (a 63 si vince). Pur essendo l’applicazione banale, la tecnica di simulazione `e concettualmente simile a quella applica-ta in problemi di fisica nucleare o di traffico urbano. La figura 7.2 mostra la distribuzione di frequenze dei giri necessari per vincere ottenuta in 10È000 simulazioni. Si noti la lunga coda, dovuta alla regola di indietreggiare, so-prattutto in prossimit`a dell’arrivo, qualora si ottenga un punteggio pi`u alto di quello esattamente necessario per vincere. Come al solito, le code sono meglio apprezzate su scala logaritmica (figura 7.3). Oltre'u6n4 la coda esibisce un andamento esponenziale negativo, ovvero @X
§
Y ª¬
, ove © `e la “costante di tempo” e vale 12.75. Quindi, un singolo giocatore pu`o trascorrere, con proba-bilit`a “zero”, un tempo “infinito” per arrivare a vincere. Infine, la figura 7.4 mostra la frazione del tempo di occupazione delle diverse caselle una volta che il giocatore abbia passato la mano. Come `e noto dall’esperienza, la maggior parte del tempo viene perso nei rimbalzi intorno alla casella finale, finch´e es-sa non viene centrata ees-sattamente. Si notano gli zeri in corrispondenza delle caselle da cui si deve avanzare o retrocedere e i picchi in corrispondenza alle soste forzate o agli avanzamenti/retrocessioni dirette.
Cerchiamo di capire meglio l’andamento esponenziale della coda. Esso `e dovuto, infatti, ad una distribuzione geometrica di probabilit`a, in quanto la probabilit`a di successo `e pari alla probabilit`a si insuccesso nei tentativi prece-denti per la probabilit`a di singolo successo. Chiamando con la probabilit`a di successo al tentativo 2 , abbiamo, per 2 grande (2ðÐÔ6n4 ) R'ÒLîqõ
1
.
136 Previsioni dei risultati 0 20 40 60 80 100 120 140 g 1 10 100 1000 10000 n
Figura 7.3: Come figura 7.2, con la frequenza in scala logaritmica.
10 20 30 40 50 60 c 0.02 0.04 0.06 0.08 0.1 f
Figura 7.4:Frequenza di occupazione delle varie caselle del gioco dell’oca.
7.12 ❄ Simulazioni 137 Riscrivendo opportunamente questa formula otteniamo:
' ä K 1 (7.13) ' ZòL8 1 (7.14) 4\[^]R_ d ' [^]R_ d ZËS2 (7.15) [^]R_ d § L,`ã? ' [^]R_ d § L [ba ZÜR2 (7.16)
[ba ' [ba ZÜR2L [ba 8 (7.17)
' ZòL § 1 Ècd d (7.18) 4 ' ZòL § Y ª¬ (7.19) oveZ'ÒV e8ù'Éqõ , con 8ËÐï (il casoP' non `e preso in considerezione, in quanto poco interessante). Nell’ultimo passaggio abbiamo chiamato (“giro”) la generica2 e ©õ' [ba 8ù's [ba Võ. Dal valore di©'u#6o5n ottenuto dalla simulazione otteniamo',454Bn
D
'wo#ho57h . `
E interessante confrontare questa probabilit`a con quella che si ricava dalla probabilit`a di occupazione delle varie caselle e la probabilit`a di vincere con-dizionata da ciascuna casella. Applicando le regole della probabilit`a abbiamo, indicando conefY " la vittoria ad un generico giro:
@ ge Y "J>¾ÐÒ6n4BN' | U å Ø ~Æ @ ge Y "J F cL @ F J>Ð6n4Bm (7.20) ove @ ge Y "J F
`e pari alla probabilit`a di ottenere con i due dati il punteggio esatto per vincere (ovvero} hç
F
). La tabella 7.7 riporta i dettagli del calcolo. Abbiamo quindi'
@
ge Y "J>Ð6n4B3',454Bn }&'wo#ho576 , in perfetto accordo con quanto calcolato dalla costante di tempo della coda esponenziale.
Come ultimo esercizio su questa simulazione, poniamoci la seguente do-manda. Avendo saputo che una persona ha vinto dopo molti giri (,Ð 6n4 ), qual’era la sua posizione prima dell’ultimo lancvio di dadi? Si tratta di una semplice applicazione del teorema di Bayes:
@ =ZçJhe Y "[m¾Ð6n4BI' @ geY " J F ÐÒ6n4BcL @ F J>Ð6n4B )ji @ geY " J F Ð6n4BWL @ F J>Ð6n4B (7.21) ' @ ge Y "J F Ð6n4BWL @ F J>ÐÒ6n4B @ ge Y "J>Ð6n4B `m05 (7.22) I valori di probabilit`a, per le caselle da 51 a 62 sono, in percentuale: 0.4, 2.5, 2.5, 5.4, 9.3, 15.9, 17.7, 16.5, 14.0, 10.3, 5.4, 0. Sebbene la probabilit`a di vincere sia massima se ci si trova nella casella 56, sapere che un bambino ha vinto ci fa pensare che, con massima probabilit`a, si trovasse nella casella 57. Similmente, bench´e la probabilit`a di vincere dalle caselle 51 e 61 era la stessa, una volta che il bambino ha vinto ci fa credere che si trovasse nella casella 61 molto pi`u probabilmente che nella casella 51.
138 Previsioni dei risultati F @ F J>Ð6n4B } hù F @ ge Y "J F N' @ 2 @ ge Y "J F cL @ F J>ÐÒ6n4B (%) (%) 51 1.0 12 1/36 0.03 52 3.4 11 2/36 0.19 53 2.3 10 3/36 0.19 54 3.7 9 4/36 0.41 55 5.1 8 5/36 0.70 56 7.2 7 6/36 1.20 57 9.7 6 5/36 1.34 58 11.3 5 4/36 1.25 59 12.8 4 3/36 1.06 60 14.0 3 2/36 0.78 61 14.7 2 1/36 0.41 62 15.0 1 0 0 100.0 1 7.56
Tabella 7.7: Dettagli del calcolo della probabilit`a di vincere al gioco dell’oca, se si sa che il giocatore ha effettuato oltre 20 “mosse”.
7.13 Problemi 139
7.13 Problemi
1. Considerando il pallinometro a due file di chiodi, calcolare la probabilit`a che, lanciando 10 palline esattamente 2 finiscano nel bin 0, indipendente-mente dagli esiti delle altre 8.
2. Con riferimento alla tabella 1.3, calcolare la pro-babilit`a che lanciando 10 pallina si ottenga esat-tamente il risultato della prima sequenza. 3. . . .
140 Previsioni dei risultati