IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Rappresentazione tabellare della serie storica
2 Sequenza
ordinata Sequenza
cronologica
Osservazioni di massimo annuo di pioggia in un giorno
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Rappresentazione grafica della serie storica (Sequenza cronologica)
3 0
100 200 300 400 500
1921 1926 1931 1936 1941 1946 1951 1956 1961 1966 1971 1976 1981 1986
h(mm)
anno
massimo annuo di pioggia in un giorno
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
4 Altro esempio: regione Lombardia. Consumi energetici annui
Non stazionarietà (Civile, industria) Bassa variabilità (Agricolt.)
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
5
Diagramma a punti
Ampiezza del campione
Distribuzione del campione (Caratteristiche di variabilità)
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
6
n= numero totale di dati campionari k= numero di classi
Numero di dati campionari che ricadono nella classe(0-75) divisi per il numero totale di dati
• Rappresentazione ad istogramma delle frequenze di classe, sia
• Assolute (n°elementi per classe), che
• Relative: (n° elementi per classe divisi per N=numero totale dati) frequenza relativa
Per evitare arbitrarietà nella determinazione del numero di classi, si può utilizzare la relazione suggerita da Sturges che lega il numero delle classi, k, alla dimensione del campione, N, secondo la relazione :
(logaritmo in base 10)
Distribuzione del campione (Caratteristiche di variabilità)
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
7
0 0.2 0.4 0.6 0.8 1 1.2
0 50 100 150 200 250 300 350 400 450
X(mm)
frequenza cumulata
Curva di Frequenza cumulata (campionaria)
Frequenza cumulata campionaria:
Distribuzione del campione (Caratteristiche di variabilità)
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Media campionaria Varianza
Coefficiente di asimmetria (skewness)
Coefficiente di appiattimento (kurtosi)
8 MOMENTI CAMPIONARI
singolo dato campionario Media campionaria
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
9
QUARTILI del Campione
0 0.2 0.4 0.6 0.8 1 1.2
0 50 100 150 200 250 300 350 400 450
X(mm)
frequenza cumulata
0,25
I II III 0,50
0,75
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Rappresentazione Box-Plot della serie
Limiti del box:
Si definisce range interquartile (IQR) la differenza:
IQR = X(Φ=0.75) - X(Φ=0.25)
10
Inferiore: I quartile del campione x(Φ=0.25) Superiore: III quartile del campione x(Φ=0.75) Linea mediana: II quartile del campione x(Φ=0.50)
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Limiti dei whiskers:
Inferiore
Valor minimo della serie delle osservazioni (X1) oppure
I quartile - 1.5 volte IQR ! X(Φ=0.25) - 1.5 IQR
Se negativo può essere posto pari a zero quando le osservazioni sono definite positive
Superiore
Valor massimo della serie delle osservazioni (Xn) oppure
III quartile + 1.5 volte IQR ! X(Φ=0.75) + 1.5 IQR
11
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Nella rappresentazione con i whiskers si possono indicare tutte le osservazioni di valore inferiore al whisker minimo e superiore al whisker massimo
12
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
13
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
14 SIMBOLOGIA
CONCETTI FONDAMENTALI DELLA TEORIA DELLE PROBABILITA’.
Esperimento aleatorio.
Spazio campionario o popolazione.
Esempi:
Esperimento Popolazione Tipo
Numero di giorni piovosi in un anno { 0 , 1 , 2 ,... 365 } Finito, numero Numero di giorni non piovosi consecutivi { 0 , 1 , 2 ... } Infinito, numero Valori osservati della portata { x ; ! x 0 } Infinito, non numero
• Evento aleatorio semplice A , , B C : ciascun elemento della popolazione (punto).
• Evento aleatorio composto A , , B C : insieme di due o più punti.
• Complemento dell’elemento A : A : insieme dei punti che non appartengono ad A.
• Evento certo ! : insieme di tutti i punti della popolazione.
• Evento nullo ! : insieme vuoto.
• Unione di eventi A e B : A ! B : insieme dei punti dei due eventi.
• Intersezione di A ! C : insieme dei punti comuni ad A e a B
PROPRIETA’ FONDAMENTALI DELLA PROBABILITA’.
Probabilità dell’evento A:
1. 0 ! P [ ] A ! 1
2. P [ ] ! = 1
3. Se B = A
1! A
2! A
3.... e se A
1, A
2, A
3... sono mutuamente escludentisi:
[ ] B = P [ ] A
1+ P [ ] A
2+ P [ ] A
3+ ....
P
Esempi:
[ ] A P [ ] A
P = 1 !
[ ] # = 1 " P [ ] ! = 0
P
PROBABILITA’ DELLE UNIONI DI EVENTI.
Esempio: In un istituto universitario vi sono 10 docenti (3 donne e 7 uomini) e 30 non docenti (10 donne e 20 uomini).
Qual è la probabilità che un membro dell’istituto scelto a caso sia un docente e/o una donna?
[ D F ] P [ ] D P [ ] [ F P D F ]
P " = + ! !
Eventi mutuamente escludentisi: P [ A ! B ] = 0
PROBABILITA’ CONDIZIONATA.
Esempio: Qual è la probabilità che un membro dell’istituto donna sia docente?
[ ] [ ]
[ ] F
P F D F P
D
P !
=
Eventi statisticamente indipendenti: P [ A ! B ] = P [ ] [ ] A ! P B
Eventi mutuamente escludentisi: P [ ] A B = 0
TEOREMA DELLA PROBABILITA’ TOTALE.
A evento qualsiasi.
! "
#
$
n
=
n
B B B
si escludenti mutuamente
eventi B
B B
B ! ! ... !
.... . ,
2 1 3
2 1
( B
1! A ) , ( B
2! A ) , ( B
3! A ) , ...., ( B
n! A ) Altra serie di eventi mutuamente escludentisi.
( B
1" A ) ! ( B
2" A ) ! ( B
3" A ) ! .... " ( B
n! A ) = A
[ ] A = P [ A B
1] P [ ] B
1+
P P [ A B
2] P [ ] B
2+ ... P [ A B
n] P [ ] B
nVARIABILI ALEATORIE E LORO DISTRIBUZIONE.
Variabili aleatoria o casuale.
Il valore assunto da una variabile aleatoria associata con un esperimento dipende dal risultato dell’esperimento.
Ad ogni punto dello spazio campionario si associa un valore della variabile.
Esempio:
“Testa e Croce”: due monete (argento e oro) lanciate simultaneamente.
Variabile aleatoria (v.a.): X numero di teste ottenute.
Evento Semplice Descrizione
Valore di X Dorata Argentata
A Croce Croce x = 0
B Testa Croce x = 1
C Croce Testa x = 1
D Testa Testa x = 2
VARIABILI DISCRETE.
V.a. che possono assumere solo valori interi un dato intervallo.
Funzione massa di probabilità (f.m.p.) associa una probabilità ad ogni valore della variabile.
[ X x ] p (x )
P = =
XEsempio:
[ ] [ ]
4 0 1
) 0
( = P X = = P A =
p
X[ ] [ ] [ ] [ ]
2 1 1
) 1
( = P X = = P B C = P B + P C =
p
x!
[ ] [ ]
4 2 1
) 2
( = P X = = P D = p
X• 0 ! p
X( x ) ! 1
• ! p
X( x
i) = 1
• [ ] !
"
"
=
"
"
b x a
i x
i
x p b
X a
P ( )
Funzione di distribuzione cumulata.
[ ] !
"
=
"
=
x x
i X X
i
x p x
X P x
F ( ) ( )
Esempio:
[ ] !
"
=
"
=
x x
i X X
i
x p x
X P x
F ( ) ( )
1 ) ( = 2 F
X4 ) 3 ( = 1 F
X4 ) 1 ( = 0
F
XF
X( ! 1 ) = 0
VARIABILI ALEATORIE CONTINUE.
Possono assumere qualsiasi valore numerico reale in un dato intervallo.
Funzione di densità di probabilità.
x x x x X
x P x
f
X x!
"
#
% $
&
' !
+ (
! ( )
=
! *2 lim 2
)
(
0! f
X( ! x ) 0 ! ( ) = 1
+"
"
#
dx x
f
XP [ a X b ] f x dx
b
a
!
X=
"
" ( )
Funzione di distribuzione cumulata:
[ X x ] f u du
P x
F
X!
X+"
"
#
=
$
= ( )
) (
! ( ) ( )
x dx f
x dF
x
X
= solo per variabili assolutamente continue.
! F
X( ! ) = 1 ; F
X( !" ) = 0
! F
X( x + " ) ! F
x( x ) per qualsiasi ! > 0 ; F
X( x
2) " F
X( x
1) = P [ x
1! X ! x
2]
Per ogni tipo di variabile definita nell’intervallo [ ] a, b :
! 0 ! F
X( x ) ! 1 ; F
X( = a ) 0 ; F
X( = b ) 1
MOMENTI
MEDIA (VALORE SPERATO) di una variabile aleatoria discreta.
[ ] = ! =
xi
i x i
P x x X
E ( ) µ
di una variabile aleatoria continua.
[ ] = ! = µ
+"
"
#
dx x xf X
E
x( )
di una funzione g (x ) di una v.a. continua o discreta:
[ ] = !
xi
i x
i
P x
x g x
g
E ( ) ( ) ( )
[ g x ] g x f x dx
E !
x+"
"
#
= ( ) ( )
) (
r-esimo momento di X :
[ ]
[ ] X x f x dx E [ ] X
E
x P x X
E
x r r
r
x
i x r i r
r
i
=
=
! !
"
!! #
$
=
=
=
=
%
&
' +
' (
µ µ µ
µ
1
) (
)
(
r-esimo momento di centrale di X :
[ ]
[ ]
1' 2'[ ]
2[ ]
2 2[ ]
2' 2' '
'
var
; 0 )
( ) (
) (
) ( ) (
) (
µ µ
! µ
µ µ
µ µ
µ µ
µ
"
=
"
=
=
=
=
# #
$
## %
&
"
=
"
=
"
=
"
=
' (
) +
)
"
X E X
E X
dx x f x
X E
x P x
X E
x r r
r
x
i x r i
r r
i
MISURA DI LOCAZIONE.
Moda: x~
max
~ )
( x =
f
xMediana: x x !
5
=
. 0
50 . 0 ) ( x = F
x!
Media: µ
x= E [ ] x
Media geometrica:
ik i
g
x k
M = !
[ x ]
E M
glog
log =
MISURA DI DISPERSIONE.
Varianza: var [ ] x = E [ ( x " µ )
2] = !
2Scarto quadratico medio: ! = var [ ] x
Coefficiente di variazione: ! µ
"
= Cv =
MISURA DI ASIMMETRIA.
Coefficiente di asimmetria:
3' 1 3
!
" = Ca = µ
MISURA DI APPIATTIMENTO O CURTOSI.
Curtosi:
4' 4
!
= µ k
Coefficiente di eccesso o di Curtosi: 3
43
' 4
2
= ! = !
"
# k µ
DISTRIBUZIONE NORMALE DEL CASO O DI GAUSS
Funzione densità di probabilità:
Funzione di distribuzione cumulata:
può essere calcolata numericamente per ogni θ
1e θ
2.
I parametri θ
1e θ
2sono dati da:
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Il confronto tra un campione e la popolazione si può effettuare attraverso la comparazione delle forme delle curve di distribuzione cumulata (campionaria e teorica).
Affinchè la comparazione sia coerente, per la distribuzione campionaria si deve usare una Stima della probabilità cumulata della popolazione, chiamata Plotting position
Una possibilità valida se non si ha alcuna indicazione sulla distribuzione teorica da usare è:
detta Weibull Plotting position (è distribution free).
Corrisponde a porre =0 nella relazione più generale:
18
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
• Distribution dependent
Si hanno ad esempio:
- Distribuzioni debolmente asimmetriche (Cunnane)
- Distribuzioni debolmente asimmetriche (Gringorten)
- Distribuzioni fortemente asimmetriche (Hazen)
19
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
Analogamente, le stime dei momenti della popolazione richiedono alcune correzioni sulle espressioni dei momenti campionari:
per la varianza:
per l’asimmetria
20
IDROLOGIA
P Claps
Analisi esplorativa di serie di dati
21
DISTRIBUZIONE NORMALE IN FORMA CANONICA
Variabile normale standardizzata o ridotta
Valori notevoli di u(F) e di F(u)
Esempio:
Quantile di X corrispondente a F(x) = 0.025
F u(F)
0.025 -1.96 0.50 0.00 0.975 +1.96
u F(u)
-2.0 0.0228 -1.0 0.1587 0.0 0.5000 1.0 0.8413 2.0 0.9772
dist-s-norm inv.s.norm
DISTRIBUZIONI DERIVATE
Funzione Y = g(x) strettamente monotona crescente e derivabile di una v.a. continua X
Esempio: oppure oppure
Quando si conosce la distribuzione della Y e si ricerca quella della X vale, ovviamente
Esempio: variabile normale standard
Vale anche:
MEDIA DI UNA VARIABILE FUNZIONE DI UN ALTRA
Se c è una costante:
Similmente
In generale
Esempio:
VARIANZA DI UNA VARIABILE FUNZIONE
VARIABILE STANDARDIZZATA
Carta probabilistica normale
In diagramma cartesiano con ascissa X ed ordinata u la funzione di probabilità cumulata F
(X)x sarà rappresentata dalla retta
Rappresentazione in carta normale delle osservazioni x
iEsempio:
F
i=0,975
u(F
i)=1,96
PROPRIETA' DELLA DISTRIBUZIONE NORMALE
Probabilità che una variabile casuale normale cada in un intervallo
Coefficiente di asimmetria:
Somma di variabili normali indipendenti e
Coefficiente di Curtosi (misura dell appiattimento di una distribuzione):
è
Periodo di Ritorno
L’occorrenza di un nuovo evento puo’ essere considerato un esperimento tipo Bernoulli che genera solo due eventi incompatibili, tipo successo – insuccesso.
p = probabilità di un insuccesso . (1-p) = probabilità di un successo .
Esempio:
Q
iMassima portata nell’anno. Q
0Portata di progetto.
p=P(Q
i>Q
0)
Tp è il numero medio di insuccessi in T prove.
Assegnata la condizione Tp=1 si ha che
T è il numero di prove (anni) da attendere mediamente prima di un insuccesso
T = PERIODO DI RITORNO
R
L,T= 1− 1− 1 T
"
# $ %
&
'
L