• Non ci sono risultati.

ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI

N/A
N/A
Protected

Academic year: 2021

Condividi "ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI"

Copied!
36
0
0

Testo completo

(1)
(2)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Rappresentazione tabellare della serie storica

2 Sequenza

ordinata Sequenza

cronologica

Osservazioni di massimo annuo di pioggia in un giorno

(3)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Rappresentazione grafica della serie storica (Sequenza cronologica)

3 0

100 200 300 400 500

1921 1926 1931 1936 1941 1946 1951 1956 1961 1966 1971 1976 1981 1986

h(mm)

anno

massimo annuo di pioggia in un giorno

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

4 Altro esempio: regione Lombardia. Consumi energetici annui

Non stazionarietà (Civile, industria) Bassa variabilità (Agricolt.)

(4)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

5

Diagramma a punti

Ampiezza del campione

Distribuzione del campione (Caratteristiche di variabilità)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

6

n= numero totale di dati campionari k= numero di classi

Numero di dati campionari che ricadono nella classe(0-75) divisi per il numero totale di dati

•  Rappresentazione ad istogramma delle frequenze di classe, sia

•  Assolute (n°elementi per classe), che

•  Relative: (n° elementi per classe divisi per N=numero totale dati) frequenza relativa

Per evitare arbitrarietà nella determinazione del numero di classi, si può utilizzare la relazione suggerita da Sturges che lega il numero delle classi, k, alla dimensione del campione, N, secondo la relazione :

(logaritmo in base 10)

Distribuzione del campione (Caratteristiche di variabilità)

(5)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

7

0 0.2 0.4 0.6 0.8 1 1.2

0 50 100 150 200 250 300 350 400 450

X(mm)

frequenza cumulata

Curva di Frequenza cumulata (campionaria)

Frequenza cumulata campionaria:

Distribuzione del campione (Caratteristiche di variabilità)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Media campionaria Varianza

Coefficiente di asimmetria (skewness)

Coefficiente di appiattimento (kurtosi)

8 MOMENTI CAMPIONARI

singolo dato campionario Media campionaria

(6)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

9

QUARTILI del Campione

0 0.2 0.4 0.6 0.8 1 1.2

0 50 100 150 200 250 300 350 400 450

X(mm)

frequenza cumulata

0,25

I II III 0,50

0,75

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Rappresentazione Box-Plot della serie  

Limiti del box:

 

Si definisce range interquartile (IQR) la differenza:

IQR = X(Φ=0.75) - X(Φ=0.25)

10

Inferiore: I quartile del campione x(Φ=0.25) Superiore: III quartile del campione x(Φ=0.75) Linea mediana: II quartile del campione x(Φ=0.50)

(7)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Limiti dei whiskers:

Inferiore

Valor minimo della serie delle osservazioni (X1) oppure

I quartile - 1.5 volte IQR ! X(Φ=0.25) - 1.5 IQR

Se negativo può essere posto pari a zero quando le osservazioni sono definite positive

Superiore

Valor massimo della serie delle osservazioni (Xn) oppure

III quartile + 1.5 volte IQR ! X(Φ=0.75) + 1.5 IQR

11

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Nella rappresentazione con i whiskers si possono indicare tutte le osservazioni di valore inferiore al whisker minimo e superiore al whisker massimo

12

(8)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

13

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

14 SIMBOLOGIA

(9)

CONCETTI FONDAMENTALI DELLA TEORIA DELLE PROBABILITA’.

Esperimento aleatorio.

Spazio campionario o popolazione.

Esempi:

Esperimento Popolazione Tipo

Numero di giorni piovosi in un anno { 0 , 1 , 2 ,... 365 } Finito, numero Numero di giorni non piovosi consecutivi { 0 , 1 , 2 ... } Infinito, numero Valori osservati della portata { x ; ! x 0 } Infinito, non numero

• Evento aleatorio semplice A , , B C : ciascun elemento della popolazione (punto).

• Evento aleatorio composto A , , B C : insieme di due o più punti.

• Complemento dell’elemento A : A : insieme dei punti che non appartengono ad A.

• Evento certo ! : insieme di tutti i punti della popolazione.

• Evento nullo ! : insieme vuoto.

• Unione di eventi A e B : A ! B : insieme dei punti dei due eventi.

• Intersezione di A ! C : insieme dei punti comuni ad A e a B

(10)

PROPRIETA’ FONDAMENTALI DELLA PROBABILITA’.

Probabilità dell’evento A:

1. 0 ! P [ ] A ! 1

2. P [ ] ! = 1

3. Se B = A

1

! A

2

! A

3

.... e se A

1

, A

2

, A

3

... sono mutuamente escludentisi:

[ ] B = P [ ] A

1

+ P [ ] A

2

+ P [ ] A

3

+ ....

P

Esempi:

[ ] A P [ ] A

P = 1 !

[ ] # = 1 " P [ ] ! = 0

P

PROBABILITA’ DELLE UNIONI DI EVENTI.

Esempio: In un istituto universitario vi sono 10 docenti (3 donne e 7 uomini) e 30 non docenti (10 donne e 20 uomini).

Qual è la probabilità che un membro dell’istituto scelto a caso sia un docente e/o una donna?

[ D F ] P [ ] D P [ ] [ F P D F ]

P " = + ! !

Eventi mutuamente escludentisi: P [ A ! B ] = 0

(11)

PROBABILITA’ CONDIZIONATA.

Esempio: Qual è la probabilità che un membro dell’istituto donna sia docente?

[ ] [ ]

[ ] F

P F D F P

D

P !

=

Eventi statisticamente indipendenti: P [ A ! B ] = P [ ] [ ] A ! P B

Eventi mutuamente escludentisi: P [ ] A B = 0

TEOREMA DELLA PROBABILITA’ TOTALE.

A evento qualsiasi.

! "

#

$

n

=

n

B B B

si escludenti mutuamente

eventi B

B B

B ! ! ... !

.... . ,

2 1 3

2 1

( B

1

! A ) , ( B

2

! A ) , ( B

3

! A ) , ...., ( B

n

! A ) Altra serie di eventi mutuamente escludentisi.

( B

1

" A ) ! ( B

2

" A ) ! ( B

3

" A ) ! .... " ( B

n

! A ) = A

[ ] A = P [ A B

1

] P [ ] B

1

+

P P [ A B

2

] P [ ] B

2

+ ... P [ A B

n

] P [ ] B

n

(12)

VARIABILI ALEATORIE E LORO DISTRIBUZIONE.

Variabili aleatoria o casuale.

Il valore assunto da una variabile aleatoria associata con un esperimento dipende dal risultato dell’esperimento.

Ad ogni punto dello spazio campionario si associa un valore della variabile.

Esempio:

“Testa e Croce”: due monete (argento e oro) lanciate simultaneamente.

Variabile aleatoria (v.a.): X numero di teste ottenute.

Evento Semplice Descrizione

Valore di X Dorata Argentata

A Croce Croce x = 0

B Testa Croce x = 1

C Croce Testa x = 1

D Testa Testa x = 2

(13)

VARIABILI DISCRETE.

V.a. che possono assumere solo valori interi un dato intervallo.

Funzione massa di probabilità (f.m.p.) associa una probabilità ad ogni valore della variabile.

[ X x ] p (x )

P = =

X

Esempio:

[ ] [ ]

4 0 1

) 0

( = P X = = P A =

p

X

[ ] [ ] [ ] [ ]

2 1 1

) 1

( = P X = = P B C = P B + P C =

p

x

!

[ ] [ ]

4 2 1

) 2

( = P X = = P D = p

X

• 0 ! p

X

( x ) ! 1

• ! p

X

( x

i

) = 1

• [ ] !

"

"

=

"

"

b x a

i x

i

x p b

X a

P ( )

(14)

Funzione di distribuzione cumulata.

[ ] !

"

=

"

=

x x

i X X

i

x p x

X P x

F ( ) ( )

Esempio:

[ ] !

"

=

"

=

x x

i X X

i

x p x

X P x

F ( ) ( )

1 ) ( = 2 F

X

4 ) 3 ( = 1 F

X

4 ) 1 ( = 0

F

X

F

X

( ! 1 ) = 0

(15)

VARIABILI ALEATORIE CONTINUE.

Possono assumere qualsiasi valore numerico reale in un dato intervallo.

Funzione di densità di probabilità.

x x x x X

x P x

f

X x

!

"

#

% $

&

' !

+ (

! ( )

=

! *

2 lim 2

)

(

0

! f

X

( ! x ) 0 ! ( ) = 1

+"

"

#

dx x

f

X

P [ a X b ] f x dx

b

a

!

X

=

"

" ( )

(16)

Funzione di distribuzione cumulata:

[ X x ] f u du

P x

F

X

!

X

+"

"

#

=

$

= ( )

) (

! ( ) ( )

x dx f

x dF

x

X

= solo per variabili assolutamente continue.

! F

X

( ! ) = 1 ; F

X

( !" ) = 0

! F

X

( x + " ) ! F

x

( x ) per qualsiasi ! > 0 ; F

X

( x

2

) " F

X

( x

1

) = P [ x

1

! X ! x

2

]

Per ogni tipo di variabile definita nell’intervallo [ ] a, b :

! 0 ! F

X

( x ) ! 1 ; F

X

( = a ) 0 ; F

X

( = b ) 1

(17)

MOMENTI

MEDIA (VALORE SPERATO) di una variabile aleatoria discreta.

[ ] = ! =

xi

i x i

P x x X

E ( ) µ

di una variabile aleatoria continua.

[ ] = ! = µ

+"

"

#

dx x xf X

E

x

( )

di una funzione g (x ) di una v.a. continua o discreta:

[ ] = !

xi

i x

i

P x

x g x

g

E ( ) ( ) ( )

[ g x ] g x f x dx

E !

x

+"

"

#

= ( ) ( )

) (

r-esimo momento di X :

[ ]

[ ] X x f x dx E [ ] X

E

x P x X

E

x r r

r

x

i x r i r

r

i

=

=

! !

"

!! #

$

=

=

=

=

%

&

' +

' (

µ µ µ

µ

1

) (

)

(

(18)

r-esimo momento di centrale di X :

[ ]

[ ]

1' 2'

[ ]

2

[ ]

2 2

[ ]

2' 2

' '

'

var

; 0 )

( ) (

) (

) ( ) (

) (

µ µ

! µ

µ µ

µ µ

µ µ

µ

"

=

"

=

=

=

=

# #

$

## %

&

"

=

"

=

"

=

"

=

' (

) +

)

"

X E X

E X

dx x f x

X E

x P x

X E

x r r

r

x

i x r i

r r

i

MISURA DI LOCAZIONE.

Moda: x~

max

~ )

( x =

f

x

(19)

Mediana: x x !

5

=

. 0

50 . 0 ) ( x = F

x

!

Media: µ

x

= E [ ] x

Media geometrica:

i

k i

g

x k

M = !

[ x ]

E M

g

log

log =

(20)

MISURA DI DISPERSIONE.

Varianza: var [ ] x = E [ ( x " µ )

2

] = !

2

Scarto quadratico medio: ! = var [ ] x

Coefficiente di variazione: ! µ

"

= Cv =

MISURA DI ASIMMETRIA.

Coefficiente di asimmetria:

3

' 1 3

!

" = Ca = µ

MISURA DI APPIATTIMENTO O CURTOSI.

Curtosi:

4

' 4

!

= µ k

Coefficiente di eccesso o di Curtosi: 3

4

3

' 4

2

= ! = !

"

# k µ

(21)

DISTRIBUZIONE NORMALE DEL CASO O DI GAUSS

Funzione densità di probabilità:

Funzione di distribuzione cumulata:

può essere calcolata numericamente per ogni θ

1

e θ

2

.

I parametri θ

1

e θ

2

sono dati da:

(22)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Il confronto tra un campione e la popolazione si può effettuare attraverso la comparazione delle forme delle curve di distribuzione cumulata (campionaria e teorica).

Affinchè la comparazione sia coerente, per la distribuzione campionaria si deve usare una Stima della probabilità cumulata della popolazione, chiamata Plotting position

Una possibilità valida se non si ha alcuna indicazione sulla distribuzione teorica da usare è:

detta Weibull Plotting position (è distribution free).

Corrisponde a porre =0 nella relazione più generale:

18

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

•  Distribution dependent

Si hanno ad esempio:

- Distribuzioni debolmente asimmetriche (Cunnane)

- Distribuzioni debolmente asimmetriche (Gringorten)

- Distribuzioni fortemente asimmetriche (Hazen)

19

(23)

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

Analogamente, le stime dei momenti della popolazione richiedono alcune correzioni sulle espressioni dei momenti campionari:

per la varianza:

per l’asimmetria

20

IDROLOGIA

P Claps

Analisi esplorativa di serie di dati

21

(24)

DISTRIBUZIONE NORMALE IN FORMA CANONICA

Variabile normale standardizzata o ridotta

Valori notevoli di u(F) e di F(u)

Esempio:

Quantile di X corrispondente a F(x) = 0.025

F u(F)

0.025 -1.96 0.50 0.00 0.975 +1.96

u F(u)

-2.0 0.0228 -1.0 0.1587 0.0 0.5000 1.0 0.8413 2.0 0.9772

dist-s-norm inv.s.norm

(25)

DISTRIBUZIONI DERIVATE

Funzione Y = g(x) strettamente monotona crescente e derivabile di una v.a. continua X

Esempio: oppure oppure

Quando si conosce la distribuzione della Y e si ricerca quella della X vale, ovviamente

Esempio: variabile normale standard

Vale anche:

(26)

MEDIA DI UNA VARIABILE FUNZIONE DI UN ALTRA

Se c è una costante:

Similmente

In generale

Esempio:

(27)

VARIANZA DI UNA VARIABILE FUNZIONE

VARIABILE STANDARDIZZATA

(28)

Carta probabilistica normale

In diagramma cartesiano con ascissa X ed ordinata u la funzione di probabilità cumulata F

(X)

x sarà rappresentata dalla retta

Rappresentazione in carta normale delle osservazioni x

i

Esempio:

F

i

=0,975

u(F

i

)=1,96

(29)

PROPRIETA' DELLA DISTRIBUZIONE NORMALE

Probabilità che una variabile casuale normale cada in un intervallo

Coefficiente di asimmetria:

Somma di variabili normali indipendenti e

Coefficiente di Curtosi (misura dell appiattimento di una distribuzione):

è

(30)

Periodo di Ritorno

L’occorrenza di un nuovo evento puo’ essere considerato un esperimento tipo Bernoulli che genera solo due eventi incompatibili, tipo successo – insuccesso.

p = probabilità di un insuccesso . (1-p) = probabilità di un successo .

Esempio:

Q

i

Massima portata nell’anno. Q

0

Portata di progetto.

p=P(Q

i

>Q

0

)

Tp è il numero medio di insuccessi in T prove.

Assegnata la condizione Tp=1 si ha che

T è il numero di prove (anni) da attendere mediamente prima di un insuccesso

T = PERIODO DI RITORNO

(31)

R

L,T

= 1− 1− 1 T

"

# $ %

&

'

L

L Orizzonte temporale di riferimento.

P

L

Probabilità di un superamento in un periodo di L anni consecutivi.

Il Rischio (naturale) RESIDUALE

R L = F X (L) = 1− 1− p ( ) L

1

p = T (Periodo di Ritorno) Rischio RESIDUALE

Se R L,T è assegnato :

T = 1

1− 1− R (

L.T

)

1L

Il periodo di ritorno T non caratterizza completamente il

rischio idrologico in campo progettuale e nella pianificazione

Tenuto conto che

(32)

Esempi

Perchè accada una piena con T=50 non si devono attendere 50 anni!

R 10,50 = 1− 1− 1

50

"

# $ %

&

'

10

≅ 0.2

La probabilità che in un orizzonte di 10 anni venga superata una piena con T=50 è circa pari al 20%

Per L<<T vale

R L,T = 1− 1− 1 T

"

# $ %

&

'

L

L T

Si può considerare L come un moltiplicatore del rischio naturale

(33)

Inoltre:

Che, per L=T conduce a:

Se L diventa grande, in via approssimata vale:

Ovvero:

R L,T ≅ 1− e −L/T

R L ≅ 1− e −1 = 0.632

Un sistema idrico progettato per un quantile XT corrispondente al

periodo di ritorno T sara’ inadeguato con una probabilità 0.632 almeno

una volta durante un periodo di T anni.

(34)

DISTRIBUZIONE LOG-NORMALE

La variabile X si dice log-normalmente distribuita se:

è normalmente distribuita

Funzione di densità di probabilità:

(35)

Espressioni teoriche dei momenti:

Relazioni tra momenti e parametri:

Espressioni semplificate :

Due momenti della popolazione: e Due parametri: e

per piccolo

per

(36)

Carta probabilistica Log-normale

In diagramma cartesiano con ascissa ln X ed ordinata u la funzione di probabilità cumulata F

(Y)

y sarà rappresentata dalla retta

Rappresentazione in carta Log-normale delle osservazioni x

i

Esempio:

F

i

=0,975 u(F

i

)=1,96

L’asse delle ascisse puo’ essere

Relativo alle y o, in scala logaritmica,

Anche riferito alle x.

Riferimenti

Documenti correlati

per ogni circuito semplice γ con sostegno contenuto in E, il teorema 1 suggerisce che in aperti connessi dove ogni circuito semplice `e omotopo ad un punto la chiusura di una

• lo spazio campionario (S o U, per “universo”) di un esperimento è l’insieme dei possibili risultati di un singolo tentativo casuale: T,C se si lancia una moneta; 1,2,...6

Per l’esplorazione degli stereotipi di genere, abbiamo impiegato tre moda- lità di indagine ampiamente usate nella letteratura specialistica (cfr., Kuhn et alii, 1978; Weinraub et

Date due

Numero di dati campionari che ricadono nella classe(0-75) divisi per il numero totale di dati. •  Rappresentazione ad istogramma delle frequenze di

Onde evitare l'arbitrarietà della determinazione del numero di classi, si può utilizzare la relazione suggerita da Sturges che lega il numero delle classi, k,

Per evitare l'arbitrarietà della determinazione del numero di classi, si può utilizzare la relazione suggerita da Sturges che lega il numero delle classi, k, alla dimensione del

Il suo valore dipende dal numero di righe e di colonne della “parte interna” della tabella (quella comprendente le caselle in corrispondenza delle quali sono calcolate le