4.2 Le modalit` a dell’intervento didattico
5.1.3 Terza lezione
Come gi`a detto, si `e deciso di effettuare l’approfondimento sulla legge dei grandi numeri. Premettiamo che la classe non conosceva ancora i limiti. All’inizio di questa terza lezione ho effettuato un breve riassunto sulle questioni teoriche introdotte nell’incontro precedente, in cui ho sottolineato come ad una variabile casuale X si fosse associato il numero E(X). Ricollegandomi alle osservazioni effettuate sul finire della lezione precedente, riguardanti la differenza con cui il premio medio e la frequenza di vincite, nelle simulazioni del gratta e vinci, tendessero ai rispettivi valori attesi,
in seguito alle quali si era parlato in modo informale di varianza, ho poi introdotto formalmente questo concetto, annunciandolo come un altro importante numero da associare, assieme al valore atteso, ad una variabile casuale X. La definizione `e stata data come valore atteso della variabile casuale “composta” (X − E(X))2:
V ar(X) = Eh(X − E(X))2i. (5.10)
Ho cercato di dare a questa, che `e apparsa come una definizione complicata, un senso ben preciso. La variabile composta (X − E(X))2 assume valori tanto pi`u grandi quanto pi`u i possibili valori di X sono distanti dalla costante E(X). Dunque il valore atteso di (X − E(X))2 (cio`e appunto la varianza in questione) allo stesso modo `e alto se X pu`o discostarsi molto da E(X), cio`e se i suoi valori possibili sono molto sbilanciati rispetto al suo valore atteso.
Ho accompagnato la definizione con due esempi tratti dalla lezione precedente: la variabile X che descrive il premio sulla singola giocata del gratta e vinci, e la variabile Y che vale 1 in caso di premio, e 0 in caso di nessun premio. Ricordando che in questo caso E(X) = 3, 67 e che i valori possibili per X sono {0, 5, 10, . . . , 500.000}, la classe ha predetto giustamente che V ar(X) sarebbe stata alta, ottenendo il mio appoggio. Avendola calcolata in precedenza, ne ho rivelato il valore (58.955). Per Y invece `e stato calcolato il valore atteso col metodo classico, ottenendo naturalmente E(Y ) = 14, ed `e stato calcolato esplicitamente anche il valore della varianza, che stavolta `e risultata ben pi`u piccola, V ar(Y ) = 163 , confermando di nuovo la previsione della classe.
In seguito siamo passati a preparare il terreno per l’enunciato della legge dei grandi numeri. Riferendoci ad una generica variabile casuale X, abbiamo considerato
n prove ripetute ed indipendenti, indicate con X1, . . . , Xn. Ho introdotto poi la
notazione ¯Xn per indicare la media aritmetica risultante dalle n prove:
¯
Xn= X1+ · · · + Xn
denominando questo valore “media empirica”. Ho poi enunciato nel seguente modo la legge dei grandi numeri:
• scegliamo un numero ε > 0 a piacere;
• consideriamo l’evento A = “ | ¯Xn− E(X) | ≤ ε ”;
a questo punto ho aperto una piccola parentesi per permettere appieno la com- prensione di quest’ultima scrittura. Oltre che a parole, focalizzandosi sul fatto che E(X) fosse una costante ed ¯Xn la variabile, il suo significato `e stato spiegato anche mostrandone altre due scritture equivalenti: la prima attraverso il linguag- gio conosciuto E(X) − ε ≤ ¯Xn ≤ E(X) + ε, e la seconda, avendo denominato I = [ E(X) − ε; E(X) + ε ], in termini insiemistici con ¯Xn∈ I. Ho accompagnato le
due scritture da un disegno, e ho sottolineato ulteriormente che il valore di ε `e da scegliere a nostra discrezione, in base alla precisione che cerchiamo, cio`e in base a quanto stretto intorno a E(X) vogliamo l’intervallo I. Pi`u ε `e piccolo, pi`u Xn deve
essere vicino a E(X) per verificare l’evento A.
• La legge dei grandi numeri (LGN) afferma che per P(A) vale:
1 −V ar(X)
ε2n ≤ P(A) ≤ 1. (5.12)
Diversamente da quanto programmato ho preferito enunciarla in riferimento all’evento
A, in cui la media empirica si avvicina al valore atteso, invece che a quello in cui ¯Xn
sta fuori dall’intorno di E(X) di raggio ε, per facilitarne la comprensione. Tuttavia credo che non ci sia una grande differenza tra i due enunciati, che dovrebbero risultare complementari in modo piuttosto naturale.
Ho poi illustrato, aiutandomi di nuovo con un disegno, il significato dell’enunciato. Ho mostrato che l’evento A fosse tanto pi`u vicino all’evento certo quanto pi`u piccola fosse stata la frazione V ar(X)ε2n . Ho poi fatto osservare che, avendo fissato la variabile
X in questione, V ar(X) fosse un valore costante, allo stesso modo di ε2, essendo
ε fissato in precedenza a definire la larghezza dell’intervallo I. Alla domanda su
molto probabile, uno studente ha suggerito giustamente che n dovesse essere un numero grande. Ho confermato la correttezza dell’intuizione, aggiungendo un piccolo approfondimento sul ruolo di V ar(X) ed ε: se si avesse una variabile casuale che, sfortunatamente, presentasse un’alta varianza, allora n dovrebbe essere pi`u grande rispetto al caso in cui si avesse una variabile con bassa varianza, e similmente se si scegliesse una alta precisione (cio`e un ε molto piccolo) si avrebbe bisogno di un n pi`u grande rispetto al caso in cui ci si accontentasse di una precisione inferiore (cio`e di un ε un po’ pi`u grande).
Si `e presentata quindi l’occasione di riprendere il collegamento alla lezione prece- dente: come gi`a ricordato, nelle simulazioni di giocate al gratta e vinci, la classe aveva notato la differente propensione del premio medio e della frequenza di vittorie ad avvicinarsi al rispettivo valore atteso. Ho spiegato come questo fenomeno derivasse dall’enunciato appena fornito della legge dei grandi numeri: avendo una varianza bassa, per la variabile Y (premio-non premio) 10.000 prove erano pi`u che sufficienti per rendere molto vicina a 1 la probabilit`a che ¯Yn fosse vicina a 0,25; invece la varia-
bile X (entit`a del premio), avendo una varianza molto pi`u alta, avrebbe necessitato di un numero maggiore di giocate.
Avendo sottolineato a sufficienza che in ogni caso n avrebbe dovuto essere un numero grande, ho parlato, per la seconda volta (la prima era avvenuta, su spunto tratto dall’intervento di uno studente, nella prima lezione) di rappresentativit`a, come euristica che genera la credenza che le sequenze, anche brevi, debbano rispecchiare le aspettative teoriche. Gli studenti hanno evidenziato il contrasto tra tale credenza e quanto visto fino a quel momento riguardo la legge dei grandi numeri, riconoscendo nella rappresentativit`a la pretesa errata di far valere la legge dei grandi numeri anche per numeri che grandi non sono. Ho poi presentato la fallacia del giocatore come deriva negativa dell’euristica della rappresentativit`a. In particolare l’aspetto pi`u discusso `e stato quello della fallacia come credenza nell’autocorrezione dei processi sbilanciati. Credendo che una comune sequenza di giocate (dunque relativamente breve) abbia valore rappresentativo del dato teorico atteso, ogni sbilanciamento
rispetto a quel dato teorico in un senso o nell’altro, dovr`a essere ri-bilanciato nelle giocate immediatamente successive. Anche in questo caso, col mio aiuto, si `e detto che dalla legge dei grandi numeri non deriva affatto l’autocorrezione delle sequenze sbilanciate, in quanto le differenze non vengono ribilanciate, ma diluite nell’alto numero n di prove.
A questo proposito ho citato i risultati del quesito del questionario che domandava cosa sarebbe accaduto se, dopo aver ottenuto 40 teste e 10 croci, si continuasse a lanciare la moneta. Si `e constatato che sebbene una buona fetta di studenti (del campione 2) avesse risposto bene sostenendo che la differenza tra teste e croci poteva non assottigliarsi, circa 1 su 4 credeva nell’autocorrezione della sequenza, sostenendo che la differenza si sarebbe sicuramente assottigliata. Inoltre ho citato il quesito delle 9 sconfitte consecutive alla slot machine che presentava probabilit`a di vincita di
1
10, in cui pi`u del 60% degli studenti riteneva che alla decima partita probabilmente
avrebbe vinto. Per questo quesito, gi`a analizzato nella prima lezione parlando di indipendenza di eventi (in cui si era detto che una motivazione per le risposte errate era quella di non aver riconosciuto l’indipendenza delle giocate), abbiamo fornito un’ulteriore spiegazione per un numero cos`ı alto di risposte errate nel fatto che si fosse dato alta valenza rappresentativa del dato teorico (1 probabilit`a su 10) alla sequenza breve di sole 10 giocate, applicando cio`e scorrettamente la legge dei grandi numeri.
La lezione si `e conclusa, come previsto in fase di progettazione, con la presentazione di due fogli di calcolo. Il primo era finalizzato a mostrare l’alta variabilit`a presente nelle sequenze corte, in contrapposizione alla stabilit`a delle sequenze lunghe. Si `e preso in considerazione il gioco del gratta e vinci, avendone a disposizione i dati. Si consideravano 10 giocatori, impegnati prima in una serie di 30 giocate, e poi di 10.000 giocate, e di queste serie di giocate si studiava la frequenza di vincita di un premio di ciascun giocatore. Si `e potuto notare che con sole 30 giocate i 10 giocatori presentavano frequenze di vincita, certamente attorno a quella attesa del 25%, ma molto variabili da giocatore a giocatore. Viceversa nella serie da 10.000 giocate tutte
Figura 5.1: foglio di calcolo utilizzato per mostrare l’alta e la bassa variabilit`a rispettivamente delle corte e lunghe serie di giocate.
e 10 le frequenze risultavano molto pi`u stabilizzate vicino al 25%, come era stato previsto studiando la variabile Y poc’anzi. Il secondo foglio, modellato sul quesito del lancio ripetuto della moneta presente nel questionario iniziale, era invece finalizzato a confutare la propriet`a di autocorrezione. Ho inserito manualmente gli esiti dei primi 50 lanci, in modo che fossero 40 teste e 10 croci. Ho poi impostato come casuale gli esiti dei lanci successivi, e mostrato in un grafico l’andamento della differenza tra teste e croci. Attraverso diverse simulazioni, di diversa lunghezza (fino a 5000 lanci), si `e osservato che la differenza tra numero di teste e numero di croci non mostrava nessuna tendenza ad azzerarsi, o a diminuire con certezza. Certamente in alcune simulazioni `e diminuita, in altre `e aumentata, ma con l’aiuto del grafico si `e potuto notare che l’andamento non evidenziava comportamenti ricorrenti, mentre invece aumentando il numero di giocate, diversamente dalla differenza iniziale in numero, le percentuali si stabilizzavano sempre pi`u sul 50% e 50%.
Nonostante qualche dubbio iniziale sul fatto di proporre o meno questo approfon- dimento sulla legge dei grandi numeri, la classe ha mostrato interesse per i contenuti presentati, seppure piuttosto tecnici: il grado di attenzione `e stato alto nelle fasi iniziali e centrali finch´e le energie lo hanno permesso, ed `e andato per`o un po’ sce- mando sul finire dell’ora. Segnalo inoltre che a questa lezione met`a della classe non
Figura 5.2: foglio di calcolo utilizzato per confutare la propriet`a di autocorrezione.
era presente, perch´e occupata in un’altra attivit`a.