Introduzione alla Statistica
Corso di Misure Meccaniche e Termiche Prof. Ing. David Vetturi
Elementi di calcolo delle probabilità
• Il calcolo delle probabilità ha avuto origine con i giochi d’azzardo per valutare l’alea (casualità) legata alle puntate sui dadi e sulle carte da gioco
• Attualmente il calcolo delle probabilità trova applicazioni in numerose discipline tecniche e scientifiche
• Il concetto di probabilità trova rispondenza nel linguaggio comune senza necessità di definizioni:
“Prendi l’ombrello, è probabileche oggi piova”
• E’ necessario tuttavia definire la probabilità in termini matematici (“numerici”) al fine di poter trattare questo concetto naturale anche in modo quantitativo
• Esistono diverse formulazioni del concetto di probabilità che nel corso del tempo sono state proposte, classificabili in due categorie:
– definizione con criteri oggettivi;
– definizione con criteri soggettivi, cioè basati sulla percezione individuale di una realtà fisica.
Definizione a priori della probabilità (o classica)
– La probabilità di un evento E è definita come il rapporto tra il numero s dei risultati favorevoli (cioè il numero dei risultati che determinano E) ed il numero n dei risultati possibili:
E n s
P
purché i risultati siano tutti ugualmente possibili e tra loro incompatibili
Definizione assiomatica di probabilità
• Le definizioni di probabilità fin qui presentate non sono in generale utilizzabili per vari motivi.
• Per ovviare a questa assenza di generalità delle definizioni presentate la scelta preferibile sul piano teorico (non operativo in generale) è quella di utilizzare una definizione assiomatica di probabilità.
– Si dice fenomeno casuale (o aleatorio) un fenomeno empirico il cui risultato non è prevedibile a priori, caratterizzato cioè dalla proprietà che la sua osservazione in un insieme fissato di circostanze non conduce sempre agli stessi risultati
– L’insieme costituito da tutte le osservazioni possibili, cioè tutti i risultati possibili a priori, viene detto spazio campione S (Sample Space)
– Definiamo un evento E un sottoinsieme di S
– Nella loro totalità gli eventi formano lo spazio degli eventi A
S E
Diagramma di Venn
E F S
EF
Evento intersezione
– Due eventi E ed F si dicono incompatibili o mutuamente escludentisi se gli insiemi delle loro descrizioni sono disgiunti, cioè se
E S
F Eventi incompatibili
E F
EF
Assiomi di Kolmogoroff
• Una funzione di probabilità P è una funzione di insieme che ha come dominio lo spazio degli eventi, come codominio l’intervallo [0,1] e che soddisfa i seguenti assiomi:
E E A
P 0
S 1
P
i i
i
E
iP E
P
con E
ieventi (di A) che si escludono a vicenda
Probabilità Condizionata
– Dato uno spazio di probabilità (S, A, P[.]) si definisce probabilità condizionata dell’evento E dato l’evento F, con E ed F eventi qualunque di A, il rapporto:
E F P P EF F con P F 0
P
Esempio
Consideriamo il lancio di una coppia di dadi
– Sia l’evento E=“la somma dei numeri dei due dadi non sia superiore a 8”
– Sia l’evento F=“compaia almeno un 5”
E 36 26 P F 36 11 P
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Risultato del dado evento E evento F
Esempio
Se si volesse calcolare quale sia la probabilità dell’evento E=“la somma dei numeri dei due dadi non sia superiore a 8” condizionato all’evento F=“compaia almeno un 5”, allora
11 6
36 11 36 6
P P EF F F
E P
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Risultato del dado evento E evento F
E F 11 6
P
Variabili casuali
Assegnato uno spazio di probabilità (S, A, P[.]) si definisce variabile casuale X una funzione avente come dominio lo spazio dei campioni (S) e come codominio la retta reale.
S
x
Le variabili casuali si indicano con lettere maiuscole X X
Variabili casuali
• Definiamo una variabile casuale discreta se questa assume valori discreti
• Definiamo una variabile casuale continua se questa può assumere con continuità tutti i valori di R (asse reale)
Funzione di distribuzione cumulativa
x P X x
F
X
Data una variabile casuale X, si definisce funzione di distribuzione cumulativa FX(x) la funzione che ha per dominio l’asse reale e per codominio l’intervallo chiuso [0,1] così definita:
Funzione di densità discreta
j j
X j
x x
x x x
X x P
f 0 se
se
Data una variabile casuale discreta X con codominio=(x1, x2, x3, … xn), si definisce funzione di densità discreta fX(x) (o funzione di probabilità) la funzione così definita:
Funzione di densità discreta
i i i
h X i X X
x x
i X i
X
i X i
X
x x
x x h
x F x
x F f
x f x
F x f
x x
f
i
se 0
se lim
1 0
0 :
La funzione di densità discreta fX(x) ha le seguenti proprietà:
Funzione di densità di probabilità
x X
X
x f t dt
F
Data una variabile casuale continua X, si definisce funzione di densità di probabilità di X fX(x) la funzione tale per cui:
Funzione di densità di probabilità
a X b f x dx
P
dx x f
x x
f
b a X X
X
1 0
Analogamente a quanto appena visto, la funzione di densità di probabilità fX(x) ha le seguenti proprietà:
Esempio
Consideriamo il lancio di un dado e l’estrazione di una pallina da un’urna contenente 2 palline rosse, 3 blu e 5 verdi.
Attribuiamo all’estrazione della pallina il valore 5 se questa è rossa, 3 se blu e 1 se verde.
Consideriamo la variabile casuale X data dalla somma del risultato del dado con il valore della pallina estratta.
R R B B B V V V V V
d 12
a 3
d 4
o 5
6
pallina
5 3 1
R R B B B V V V V V
1 6 6 4 4 4 2 2 2 2 2
d 2 7 7 5 5 5 3 3 3 3 3
a 3 8 8 6 6 6 4 4 4 4 4
d 4 9 9 7 7 7 5 5 5 5 5
o 5 10 10 8 8 8 6 6 6 6 6
6 11 11 9 9 9 7 7 7 7 7
5 3 pallina 1
X2 34 56 78 9 1011
5 5
5 5
5+3 8
5+3 8
5+3+2 10 5+3+2 10
3+2 5
3+2 5
2 2
2 2
Ni P(X)=f(x) 0.083 0.083 0.133 0.133 0.167 0.167 0.083 0.083 0.033 0.033
0.083F(x) 0.167 0.300 0.433 0.600 0.767 0.850 0.933 0.967 1.000
Esempio
X F(x)
2 5 5 0.083
3 5 5 0.167
4 5+3 8 0.300
5 5+3 8 0.433
6 5+3+2 10 0.600
7 5+3+2 10 0.767
8 3+2 5 0.850
9 3+2 5 0.933
10 2 2 0.967
11 2 2 1.000
Ni P(X)=f(x) 0.083 0.083 0.133 0.133 0.167 0.167 0.083 0.083 0.033 0.033
0 0.02 0.04 0.06 0.080.1 0.12 0.14 0.16 0.180.2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X
fx(X)
fx(X)
0 0.2 0.4 0.6 0.8 1 1.2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X
Fx(X)
Fx(X)
Media
i
x
if
Xx
iX E
Si definisce media, o valore atteso, della variabile casuale X la funzione:
X
x f x dx
E
XVarianza
i i X X iX2
x
2f x
Si definisce varianza della variabile casuale X con media xla funzione:
x
Xf
Xx dx
X 2
2
Esempio
Consideriamo nuovamente il problema legato al lancio di un dado e all’estrazione di una pallina da un’urna contenete 2 palline rosse, 3 blu e 5 verdi.
Considerata la variabile casuale X come prima definita.
Si ha:
R R B B B V V V V V
1 6 6 4 4 4 2 2 2 2 2
d 2 7 7 5 5 5 3 3 3 3 3
a 3 8 8 6 6 6 4 4 4 4 4
d 4 9 9 7 7 7 5 5 5 5 5
o 5 10 10 8 8 8 6 6 6 6 6
6 11 11 9 9 9 7 7 7 7 7
5 3 pallina 1
X2 34 5 67 89 1011
5 5
5 5
5+3 8
5+3 8
5+3+2 10 5+3+2 10
3+2 5
3+2 5
2 2
2 2
Ni P(X)=f(x) 0.083 0.083 0.133 0.133 0.167 0.167 0.083 0.083 0.033 0.033
0.083F(x) 0.167 0.300 0.433 0.600 0.767 0.850 0.933 0.967 1.000
ni
x
if
Xx
iX
E
1( ) 5 . 9
( ) 5.357 2.311
2
in i 2 X i X X x E X f x
Esempio
X F(x)
2 5 5 0.083
3 5 5 0.167
4 5+3 8 0.300
5 5+3 8 0.433
6 5+3+2 10 0.600
7 5+3+2 10 0.767
8 3+2 5 0.850
9 3+2 5 0.933
10 2 2 0.967
11 2 2 1.000
Ni P(X)=f(x) 0.083 0.083 0.133 0.133 0.167 0.167 0.083 0.083 0.033 0.033
0 0.02 0.04 0.06 0.080.1 0.12 0.14 0.16 0.180.2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X
fx(X)
fx(X)
0 0.2 0.4 0.6 0.8 1 1.2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X
Fx(X)
Fx(X)
31 . 2 9
.
5
X
X
Deviazione Standard
Si definisce come deviazione standard o scarto quadratico medio o scarto tipo (della variabile casuale X) la radice quadrata della varianza, cioè:
2X
X
Disuguaglianza di Tchebycheff
• Corollario della disuguaglianza di Tchebycheff
Sia X variabile casuale a varianza finita.
Allora si ha:
1 1
2
x xX P
x
x X
x
x 1 1
2P
o equivalentemente:
Distribuzioni discrete
La variabile casuale X ha distribuzione uniforme discreta se la sua funzione di densità discreta è data da:
0 altrove
,.., 2 ,1
1 per x N
x N f
XSi dimostra che:
X N 2 1
2 N 12
2 1
E
xDistribuzioni binomiale
La variabile casuale X ha distribuzione binomialese la sua funzione di densità discreta è data da:
altrove 0
,.., 2 ,1 , 0 per )
1
( p x n
x p x n
f
X x n xSi dimostra che:
X n p n p p
E
x2 1
Distribuzioni binomiale
• Esempio
Consideriamo la variabile X relativa al lancio di una moneta 3 volte dove con X si indica il numero di volte in cui risulta testa.
T T
T T
T
T T
C C
C C C C C
X=3 X=2X=2
X=2X=1 X=1X=1
X=0
( 3 ) 8 1 8 3 ) 2 (
8 3 ) 1 (
8 1 ) 0 (
x x x x
f f f f
Distribuzioni binomiale
Utilizzando la distribuzione binomiale con:
• p=0.5
• n=3
altrove 0
,.., 2 ,1 , 0 per )
1
( p x n
x p x n
fX x n x
Si ha:
81 ) 3 8 (
) 3 2 (
83 ) 1 8 (
) 1 0 (
x x
x x
f f
f
3 f
0
12 21 0 ) 3 0
(
fx
Distribuzioni ipergeometrica
La variabile casuale X ha distribuzione ipergeometricase la sua funzione di densità discreta è data da:
altrove 0
,.., 2 ,1 , 0
per x n
M n M n x K K x
x f
XSi dimostra che:
2 M M 1 n M K
M K M M K n
n X
E
xDistribuzioni ipergeometrica
• Esempio
Consideriamo una fornitura di 30 PC portatili di cui 6 presentano un difetto allo schermo.
Esaminandone 10, qual è la probabilità di averne 3 con quel difetto?
10 6
30
K n
M
10 30 10 30 6
6 x
x x
f
Xf
X 3 0 . 23039
Distribuzioni ipergeometrica
• Utilizzo di Excel
Tornando all’esempio:
10 6
30
K n
M
Distribuzioni di Poisson
La variabile casuale X hadistribuzione di Poissonse la sua funzione di densità discreta è data da:
altrove 0
,..
,.., 2 ,1 , 0
! per x n
e x x f
x X
Si dimostra che:
X
2x E
Distribuzioni continue
La variabile casuale X ha distribuzione uniforme (continua) nell’intervallo [a,b] se la sua funzione di densità di probabilità è data da:
0 altrove
1 a per a x b x b
f
Xx fx(x)
a b
Distribuzioni uniforme
Media
x
x f x dx
E
x x( )
ax f
x( x ) dx
abx f
x( x ) dx
bx f
x( x ) dx
b ba
a
x 0 dx x b 1 a dx x 0 dx
b a b
a
x
a dx b
a x
b 1 1 2
2
2
2
1
22
2b a
a b b a a b a a b
b
Distribuzioni uniforme
Varianza
2 2
2 x
( )
xx
x f x dx
b b xa x
a
x
2f
x( x ) dx x
2f ( x ) dx x
2f ( x ) dx
bb a
a
x
20 dx x
2b 1 a dx x
20 dx
b a b
a
x
a dx b a x
b 1
21 3
3
3
3
1
33
3 2 2b
2ab a
2a b ab a b
a b a a b
b
Distribuzioni uniforme
Varianza
2 2
2 x
( )
xx
x f x dx
2
2 22
b ab 3 a b 2 a
x
2 4 3
2 2
2
2
ab a b ab a
b
12 3 6 3
4 4
4 b
2 ab a
2 b
2 ab a
2
12
2 12
2 22
ab a b a
b
Distribuzione esponenziale
La variabile casuale X hadistribuzione esponenziale (negativa) se la sua funzione di densità di probabilità è data da:
x e 0
per per x x 0 0
f
X
xcon:
R
cioè 0
Distribuzione esponenziale
Si dimostra che:
X
x 1
E
21
2
x
x
fx(x)
0
Variabile casuale funzione di variabile casuale
In molti casi si fa uso di trasformazione di variabili casuali.
Sia X variabile casuale con funzione di densità di probabilità f
X(x) assegnata.
Sia Y una variabile casuale funzione di X con Y=g(X).
Ovviamente è possibile calcolare media e varianza di Y nota la sua funzione densità di probabilità f
Y(y).
Trasformazione di variabile casuale Y=g(X)
Ci siamo già occupati del problema riguardante una variabile casuale Y funzione di una assegnata variabile casuale X
Un teorema ci consente di calcolare la funzione di densità di probabilità di Y nota la funzione di densità di probabilità di X ed il legame fra Y ed X, cioè Y=g(X)
Riferimento:
G. Vicario, R. Levi, “Statistica e probabilità per ingegneri”, Esculapio (Bologna) - Paragrafo. 3.3 - pag. 104
Trasformazione di variabile casuale Y=g(X)
• Teorema 3.17
Sia X una variabile casuale continua con funzione di densità di probabilità fx(x). La variabile casuale Y=g(X) è continua ed inoltre
y dy d g y f g y
f
y
1
x 1dove y=g(x) è una trasformazione biunivoca da Dxin Dye
y y D
ydy d g
1 0 e continua
Trasformazione di variabile casuale Y=g(X)
x
fx(x) y
Y=g(X)
fx(x)
Trasformazione di variabile casuale Y=g(X)
• Osservazione
Decomponendo Dx in un insieme di sottoinsiemi Dxi
disgiunti tali per cui y=g(x) sia biunivoca fra ciascun Dxie Dyiallora
i i x i
y
g y f g y
dy d y
f
1 1Variabile casuale funzione di variabile casuale
Si dimostra che, se Y=g(X), allora:
Y y f y dy E Y
E
Y YY
( )
)
( x f x dx E g X
g
X XY
Teorema della media
Variabile casuale funzione di variabile casuale
Si dimostra che, se Y=g(X), allora:
E Y
Yy
Yf
Yy dy
Y 2 2
2
Teorema della media (caso della varianza)
2 2
2 22Y
E
YY
YE
Xg ( x )
Y
g x
Yf
Xx dx
Y 2
2
( )
Distribuzione normale (di Gauss)
La variabile casuale X ha distribuzione normale (o distrubuzione di Gauss)se la sua funzione di densità di probabilità è data da:
2
21
2 1
x
X
x e
f
Distribuzione normale (di Gauss)
Si dimostra che:
X
x
E
x2
2x
fx(x)
Distribuzione normale standardizzata
La variabile casuale X con distribuzione normale tale per cui
2 1
12x2X
x e
f
1
0
Viene chiamata variabile casuale normale standardizzata e comunemente è indicata con Z
2 1
12z2Z
z e
f
Distribuzione normale standardizzata
Poiché comunemente è necessario calcolare il valore della funzione di distribuzione comulativa di Z, questa è stata calcolata una volta per tutte.
I risultati di questa valutazione sono disponibili in tabelle come la seguente:
z uZ
z z e du
F
21 22 1
z u
Z
z z e du
F
21 22 1
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586 0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535 0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409 0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173 0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793 0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240 0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490 0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524 0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327 0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891 1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214 1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298 1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147 1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91308 0.91466 0.91621 0.91774 1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189 1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408 1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449 1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327 1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062 1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670 2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
53 . 1
z z 1 . 53 0 . 93699
z u
Z
z z e du
F
21 22 1
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586 0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535 0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409 0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173 0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793 0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240 0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490 0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524 0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327 0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891 1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214 1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298 1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147 1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91308 0.91466 0.91621 0.91774 1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189 1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408 1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449 1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327 1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062 1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670 2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
78 . 0
zz
z 1
0.78
10.782300.21770Distribuzione normale
Se Z è una variabile casuale normale standardizzata allora X=g(Z) con
Z X
è una variabile casuale con normale con
X
x
E
x2
2Distribuzione normale
Utilizzando quanto visto precedentemente si ha:
Z Z
g
X ( )
E quindi sostituendo in Zg1(X) X
x dx d g x f g x
f
x
1
z 1con
1 )1(
x
dxd g si ha:
2
21
2 1
1
x z
x