Gli eventi aleatori (cioè casuali) possono generare sia un insieme discreto che continuo di possibilità.
Consideriamo come esempio il voto di matematica che uno studente si vedrà assegnato a fine anno in pagella: è sicuramente una variabile aleatoria (o casuale) discreta. C’è infatti solo un insieme finito di possibilità: 1, 2, 3, .. 10; ad ognuna di queste, a seconda delle capacità e dell’ impegno nello studio, posso associare una probabilità ottenendo una funzione (o distribuzione) di probabilità:
Quindi, nell’esempio precedente, lo studente ha probabilità 0,3 – cioè 30% - di terminare l’anno con 6 in pagella. La probabilità di un bel 9 è invece pari solo a 0.05 – cioè 5%.
Si noti come la somma di tutte le probabilità sia pari ad 1, cioè il 100%.
Ad ogni distribuzione di probabilità restano associati due parametri fondamentali che la caratterizzano sinteticamente:
Il primo misura il cosiddetto valore atteso (o medio) degli N valori possibili della variabile casuale x.
μ = ∑
Ni=1
x
ip
i= x
1p
1+ x
2p
2+ . . + x
Np
Nσ = ∑
Ni=1
(x
i− μ)
2p
iIl secondo, deviazione standard o scarto quadratico medio, è una misura di dispersione. In altre parole un grande è indicativo del fatto che “non possiamo fidarci”
del valore medio , dato che non è trascurabile la probabilità che x assuma valori anche molto differenti dalla media.
Spesso è utile utilizzare le cosiddette funzioni cumulative (o di ripartizione). Se indichiamo questa funzione con la lettera maiuscola, intenderemo con P(4) la probabilità p(voto<=4).
Cioè la probabilità cumulata del voto 4 è pari alla probabilità che il voto sia al massimo pari a 4: cioè la somma delle probabilità associate ai voti 1, 2, 3 e 4. Quindi, nel nostro esempio: P(4)=0,25 (cioè 25%).
Conoscere i valori delle probabilità cumulate è comodo perché permette velocemente di conoscere la probabilità associata ad un intervallo di valori. E’ facile infatti convincersi che la probabilità di prendere un voto compreso fra 6 e 8 è pari alla probabilità di prendere un voto “fino ad 8” meno la probabilità di prendere un voto “fino a 5”. In formule:
probabilità(6<= voto <=8) = P(8) – P(5).
Nel grafico che segue è mostrato l’andamento della probabilità cumulata riferita all’esempio che stiamo trattando. E’, ancora una volta, facile convincersi che - proprio per come è definita - una funzione di probabilità cumulata non potrà mai essere decrescente!
μ σ
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
voto probabilità cumulata
Cosa succede se l’evento aleatorio di cui ci vogliamo occupare è invece rappresentabile mediante una variabile continua, una variabile cioè capace di assumere tutti i valori compresi in un certo intervallo numerico? Consideriamo per esempio la misura del lancio di un peso da parte di un atleta dilettante. Per un peso di 5 Kg se l’atleta è sufficientemente allenato la probabilità associata alla misura di un lancio potrebbe essere espressa dalla seguente funzione:
Come ci si aspetta questa volta la funzione non è un insieme di punti, bensì una curva continua che associa ad ogni possibile misura del lancio un valore che questa volta non rappresenta una probabilità bensì una densità di probabilità. Questo significa che nel caso continuo non ha senso domandarsi quale sia la probabilità di ottenere esattamente un certo valore (per esempio un lancio di 14 metri e 37 centimetri) ma solo qual è la probabilità di ottenere un valore in un certo intervallo (per esempio fra 18 metri e 19 metri e 50 centimetri).
Ed il valore di questa probabilità è data dall’area della superficie sottesa dall’arco di curva compresa fra i dati estremi.
Ovviamente questa volta sarà l’area sottesa dall’intera curva ad essere pari ad 1, così da essere coerente con il fatto che un lancio ha probabilità 100% di avere una gittata fra il minimo ed il massimo previsto (nel nostro caso rispettivamente 9 e 21 metri).
Se indichiamo con x la gittata del lancio in metri ed f(x) la funzione che abbiamo detto rappresentare una densità di probabilità, sappiamo che le aree sottese da porzioni del grafico sono calcolabili mediante un integrale definito. Nell’esempio precedente l’area che vale la probabilità di un lancio compreso fra 18 metri e 19,5 metri sarebbe:
p(18<= x <= 19,5) =
Calcolare queste aree può però essere in molti casi complicato, per cui sono di uso comune delle tavole di probabilità cumulata, dove - come nel caso delle probabilità discrete – la probabilità cumulata, ad esempio, P(18) vale probabilità che un lancio misuri dal valore minimo possibile (nel nostro caso 9 metri) fino a 18 metri.
Una porzione di una tavola potrebbe essere, per il nostro esempio, la seguente:
19,5 18
∫
f (x)dx
P(9,0) 0,000 P(10,0) 0,055 P(11,0) 0,192
P(9,1) 0,001 P(10,1) 0,066 P(11,1) 0,202
La misura di questa superficie corrisponde alla probabilità di un lancio
compreso fra 18 e 19,50 metri
Utilizzando i valori della tavola risulta allora immediato calcolare, ad esempio, la probabilità di ottenere un lancio compreso fra 10,2 e 10,8 metri:
p(10,2 <= x <= 10,8) = P(10,8) – P(10,2) = 0,166 – 0,078 = 0,088 = 8,8%
P(9,5) 0,015 P(10,5) 0,120 P(11,5) 0,238
P(9,6) 0,021 P(10,6) 0,135 P(11,6) 0,246
P(9,7) 0,028 P(10,7) 0,150 P(11,79 0,254
P(9,8) 0,036 P(10,8) 0,166 P(11,8) 0,261
P(9,9) 0,045 P(10,9) 0,182 P(11,9) 0,268