POLITECNICO DI TORINO Repository ISTITUZIONALE
Appunti di topografia / C. Sena. - ELETTRONICO. - (2013).
Original
Appunti di topografia
Publisher:
Published DOI:
Terms of use:
openAccess
Publisher copyright
(Article begins on next page)
This article is made available under terms and conditions as specified in the corresponding bibliographic description in the repository
Availability:
This version is available at: 11583/2518647 since:
3-Trattamento delle Misure 3-Trattamento delle Misure
topografiche
Trattamento delle Misure Trattamento delle Misure
topografiche
Premessa
Tutto il nostro Trattamento era in passato chiamato “Teoria delle Misure” ed era basato sulla gestione di quelli che si chiamavano “errori accidentali
effettivamente serve. Serve anche per i cosi detti “
questi al metodo delle reiterazioni dei pesi per eliminarli o ridurli o ad altri test e processi.
Serve poco o nulla per gli “errori sistematici”: ma purtroppo anche questi intervengono quando si misura, così come gli altri errori e sotto certi aspetti sono anche più pericolosi ( possono avere anche valori più elevati).
Occorrerebbe trovare un modo per tenere conto di tutto e non solamente di una parte. La Statistica quindi sotto questo punto di vista non serve o serve a poco.
Si dovrebbe agire logicamente in questo modo:
Si dovrebbe agire logicamente in questo modo:
1. Vedere se le misure possono essere affette da errori sistematici
2. Se sì, vedere come fare per eliminare la sistematicità nell’organo di misura (ma l’errore sistematico di taratura di un campione non può essere eliminato; si deve ricorrere alla ripetizione con campioni diversi, indipendenti)
3. Se no, applicare la teoria statistica che viene qui descritta per eliminare gli errori (fluttuazioni) accidenta Occorre fare anche attenzione a pensare che le distribuzioni di errore siano solamente quelle gaussiane e fare
attenzione ai casi di variabili tra loro dipendenti. Si vedrà nel dettaglio:
• Il concetto di grandezza e della sua misura diretta
• Si introducono i concetti di: variabile statistica
sintetica; di eventi aleatori o stocastici, di variabili casuali
• Si affronta il problema della stima dei parametri, o dell’i
• Si affronta il problema della stima dei parametri, o dell’i composta da un numero limitato di estrazioni a caso, con il
che porta al principio dei minimi quadrati, per ottenere media e varianza empiriche.
• Si esamina il concetto di media ponderata, con un esempio
• Si passa quindi alle misure indirette, distinguendo i tre casi classici (con l’importante caso della sovrabbondanza, il 3 °) , nei sottocasi lineari e non .
• Si approfondisce il calcolo della varianza dell’unità di peso e si fornisce la risoluzione, con il pratico
Premessa
era in passato chiamato “Teoria delle Misure” ed era basato sulla gestione errori accidentali” (adesso “fluttuazioni accidentali”) e per essi effettivamente serve. Serve anche per i cosi detti “errori grossolani” ma meglio ricorrere per
per eliminarli o ridurli o ad altri test e processi.
”: ma purtroppo anche questi intervengono quando si misura, così come gli altri errori e sotto certi aspetti sono anche più pericolosi ( possono avere anche valori più elevati).
Occorrerebbe trovare un modo per tenere conto di tutto e non solamente di una parte. La Statistica quindi sotto questo punto di vista non serve o serve a poco.
Vedere se le misure possono essere affette da errori sistematici
Se sì, vedere come fare per eliminare la sistematicità nell’organo di misura (ma l’errore sistematico di taratura di un campione non può essere eliminato; si deve ricorrere alla ripetizione con campioni diversi, Se no, applicare la teoria statistica che viene qui descritta per eliminare gli errori (fluttuazioni) accidentali.
Occorre fare anche attenzione a pensare che le distribuzioni di errore siano solamente quelle gaussiane e fare
. Si vedrà nel dettaglio:
misura diretta
variabile statistica ad una o più dimensioni e della rappresentazione variabili casuali e di alcune distribuzioni importanti Si affronta il problema della stima dei parametri, o dell’inferenza statistica, in una popolazione Si affronta il problema della stima dei parametri, o dell’inferenza statistica, in una popolazione composta da un numero limitato di estrazioni a caso, con il principio di massima verisimiglianza
, per ottenere media e varianza empiriche.
, con un esempio
, distinguendo i tre casi classici (con l’importante caso ) , nei sottocasi lineari e non .
Si approfondisce il calcolo della varianza dell’unità di peso e si fornisce la risoluzione, con il pratico
3
-INDICE TRATTAMENTO delle MISURE1. Schemi introduttivi 2. Grandezze fisiche e geometriche 3. Misure e fluttuazioni accidentali
4. Fenomeni collettivi 5. Grafici
6. Variabile statistica ad una dimensione 1
7. Rappresentazione sintetica di variabile statistica 8. Valori centrali 9. Disuguaglianza di Tchebyceff 10. Funzione cumulativa di frequenza 10. Funzione cumulativa di frequenza 11. Evento aleatorio o stocastico 12. Legge empirica del caso 13. Variabili casuali 14. Evento aleatorio composto da più variabili 15. Distribuzione binomiale o di Bernoulli 16. Distribuzione di Poisson 17. Distribuzione normale o di Gauss 18. Variabile statistica doppia 19. Problema della stima dei parametri di una distribuz 20. Principio di massima verosimiglianza 21. Principio dei minimi quadrati 22. Media e varianza empiriche 8
23. Esempio di calcolo 24. Media ponderata 9
24. Media ponderata 9
25. Esempio di media ponderata 26. Misure indirette 27. 1° caso –sottocaso lineare 10
28. 1° caso –sottocaso non lineare 10
29. 2° caso –sottocaso lineare 1
30. 2° caso –sottocaso non lineare 11
31. 3° caso –sottocaso lineare 11
32. 3° caso –sottocaso non lineare 1
TRATTAMENTO delle MISURE Schemi introduttivi 4
7
9
10
12
Variabile statistica ad una dimensione 16
Rappresentazione sintetica di variabile statistica 18
23
24
Funzione cumulativa di frequenza 26
Funzione cumulativa di frequenza 26
27
28
Variabili casuali 29
Evento aleatorio composto da più variabili 33
iale o di Bernoulli 40
Distribuzione di Poisson 44
46
53
di una distribuzione 77
Principio di massima verosimiglianza 79
Principio dei minimi quadrati 81
Media e varianza empiriche 83
Esempio di calcolo 89
Media ponderata 94
Media ponderata 94
Esempio di media ponderata 99
103
sottocaso lineare 104
non lineare 105
sottocaso lineare 108
so non lineare 111
sottocaso lineare 114
lineare 122
Introduzione
Individuare le LEGGI della NATURA
Analisi del FENOMENO REALE Schematizzazione di
alcune sue caratteristiche Nasce il FENOMENO ASTRATTO
Fare esempio dall’OTTICA:
Fare esempio dall’OTTICA:
definizione delle ABERRAZIONI Affinità procedurale
Introduzione
Individuare le LEGGI della NATURA
Analisi del FENOMENO REALE Schematizzazione di
alcune sue caratteristiche Nasce il FENOMENO ASTRATTO
Fare esempio dall’OTTICA:
Fare esempio dall’OTTICA:
definizione delle ABERRAZIONI Affinità procedurale
NON esiste un’unica misura vera di una GRANDEZZA
LE GRANDEZZE
Cos’è una GRANDEZZA (secondo Euclide, secondo Russell, ecc.) Introduzione del concetto
di QUANTITA’
Ad es. 1 km, 1 m, ecc. sono grandezze della Classe delle Lunghezze
Le grandezze si riuniscono in CLASSI
Corrispondenza tra rapporti di grandezze e numeri reali positivi Possibilità di stabilire CONFRONTI tra grandezze della stessa classe, ecc.
NON esiste un’unica misura vera di una GRANDEZZA
LE GRANDEZZE
Cos’è una GRANDEZZA (secondo Euclide, secondo Russell, ecc.)
Introduzione del concetto Classi di grandezza di DIVISIBILITA’
Classi di grandezza di DISTANZA Ad es. 1 km, 1 m, ecc. sono grandezze
della Classe delle Lunghezze
Introduzione
Misurare una Grandezza = ottenere una CORRISPONDENZA con dei numeri MISURARE
Operazione di MISURA estranea alla Grandezza. E’ un mezzo umano di rappresentare la grandezza
Come si fa una MISURA DIRETTA
Definire le unità campioni u.c. Si sommano le u.c., si confrontano con la grandezza e si fa un’operazione di conteggio
Sperimentalmente le misure cambiano nel tempo Sperimentalmente le misure cambiano nel tempo
Distinguere tra ERRORI GROSSOLANI, SISTEMATICI, ACCIDENTALI
Introduzione
Misurare una Grandezza = ottenere una CORRISPONDENZA con dei numeri MISURARE
Operazione di MISURA estranea alla Grandezza. E’ un mezzo umano di rappresentare la grandezza
Come si fa una MISURA DIRETTA
Definire le unità campioni u.c. Si sommano le u.c., si confrontano con la grandezza e si fa un’operazione di conteggio
Sperimentalmente le misure cambiano nel tempo Sperimentalmente le misure cambiano nel tempo
Distinguere tra ERRORI GROSSOLANI, SISTEMATICI, ACCIDENTALI
GRANDEZZE
• Euclide (V libro degli “Elementi”):
1. le grandezze vengono ripartite in CLASSI, formate ciascuna di ENTI;
2. si stabiliscono opportuni procedimenti di “confronto” tra due grandezze della stessa classe;
3. il rapporto tra due grandezze è sempre un numero reale positivo ( 3. il rapporto tra due grandezze è sempre un numero reale positivo ( 4. il rapporto è 1 se le due grandezze sono uguali
• Russell (“I principi della matematica”):
• Eudosso da Cnido (membro dell’Accademia platonica)
1. La grandezza non è concepita come un numero, ma come un’ entità geometrica che può variare in modo continuo
2. Definisce il concetto di rapporto tra grandezze e quello di uguaglianza o proporzione tra due rapporti di grandezze (sia razionali che irrazionali) .
• Russell (“I principi della matematica”):
1. le grandezze sono concetti astratti che comprendono una molteplicità di termini;
2. se una grandezza si “particolarizza”, diventa una QUANTITA’ di grandezza.
Le “quantità” non possono essere maggiori o minori (relazioni valide solo per grandezze della stessa classe). Hanno solamente la proprietà dell’uguaglianza
GRANDEZZE
le grandezze vengono ripartite in CLASSI, formate ciascuna di ENTI;
si stabiliscono opportuni procedimenti di “confronto” tra due grandezze della stessa classe;
tra due grandezze è sempre un numero reale positivo (misura );
tra due grandezze è sempre un numero reale positivo (misura );
il rapporto è 1 se le due grandezze sono uguali
.
(“I principi della matematica”):
(membro dell’Accademia platonica)
La grandezza non è concepita come un numero, ma come un’ entità geometrica che può Definisce il concetto di rapporto tra grandezze e quello di uguaglianza o proporzione tra
due rapporti di grandezze (sia razionali che irrazionali) .
(“I principi della matematica”):
le grandezze sono concetti astratti che comprendono una molteplicità di termini;
se una grandezza si “particolarizza”, diventa una QUANTITA’ di grandezza.
non possono essere maggiori o minori (relazioni valide solo per grandezze della stessa classe). Hanno solamente la proprietà dell’uguaglianza
.
GRANDEZZE secondo Russell
CLASSI di GRANDEZZE di
DIVISIBILITA’:
un Tutto (o un Insieme finito o limitato) si correla con il numero di parti semplici
che lo compongono.
Ha significato la “somma”.
Ha significato la “somma”.
GRANDEZZE secondo Russell
CLASSI di GRANDEZZE di
DISTANZA:
sono quelle grandezze che devono avere un punto o un evento di riferimento (ad es. il
tempo).
Non ha significato l’operazione di “somma”.
Non ha significato l’operazione di “somma”.
FLUTTUAZIONI ACCIDENTALI
COME SI FA UNA MISURA DIRETTA 1. Definire le unità campione (u.c.);
2. Si sommano le u.c. e si confrontano con la grandezza da misurare;
3. Si fa un operazione di conteggio delle u.c.
Introduzione del concetto di FLUTTUAZIONE ACCIDENTALE:
Tutte misure vere della stessa grandezza
Popolazioni di MISURE POSSIBILI
Estrarre un unico valore rappresentativo:
la MEDIA la MEDIA
Accoppiare la valutazione numerica della variabilità dei dati:
la VARIANZA
FLUTTUAZIONI ACCIDENTALI
COME SI FA UNA MISURA DIRETTA:
con la grandezza da misurare;
Introduzione del concetto di FLUTTUAZIONE ACCIDENTALE:
Tutte misure vere della stessa grandezza
Popolazioni di MISURE POSSIBILI
Estrarre un unico valore rappresentativo:
MEDIA MEDIA
Accoppiare la valutazione numerica della variabilità dei dati:
VARIANZA
Non è facile dare la definizione di scienza STATISTICA.
Ma così è anche per altre scienze.
Ogni scienza è in continuo progresso, quindi non la si può circoscrivere e quindi definire perfettamente.
Senza dubbio la STATISTICA richiede “conteggi”.
Permette di dare un valore quantitativo (=misura) ai fenomeni collettivi.
FENOMENO COLLETTIVO:
• relativo ad una collettività di casi singoli (popolazione di individui)
• relativo ad un caso singolo, su cui si effettua una collettività di osservazioni
Quasi tutte le scienze fanno ricorso alla STATISTICA
• scienze che hanno per oggetto una collettività di enti, della quale studiano un aspetto
• scienze sperimentali, ecc.
Non è facile dare la definizione di scienza STATISTICA.
Ogni scienza è in continuo progresso, quindi non la si può circoscrivere e quindi definire Senza dubbio la STATISTICA richiede “conteggi”.
Permette di dare un valore quantitativo (=misura) ai fenomeni collettivi.
FENOMENO COLLETTIVO:
relativo ad una collettività di casi singoli (popolazione di individui)
relativo ad un caso singolo, su cui si effettua una collettività di osservazioni
STATISTICA: ad esempio
scienze che hanno per oggetto una collettività di enti, della quale studiano un aspetto
Occorre dire ancora qualcosa sulle “corrispondenze numeriche
Esse possono essere relative a:
• distribuzioni
• non distribuzioni
Le distribuzioni possono essere:
• di frequenza
• di quantità
• di quantità
Le non distribuzioni si distinguono in:
• serie storiche - di stato
- di movimento
• serie territoriali
Esempio di distribuzione di quantità Esempio di distribuzione di quantità La Banca XY ha conteggiato che nel 2005 si sono avuti:
• cambiali ordinarie € 3.284.500
• tratte € 5.242.825
• assegni bancari € 2.854.300
corrispondenze numeriche” o “tabelle”, in generale.
distribuzione di quantità:
distribuzione di quantità:
GRAFICI
GRAFICI
di DISTRIBUZIONI SEMPLICI
di DISTRIBUZIONI DOPPIE
SEMPLICI DOPPIE
GRAFICI
GRAFICI
di DISTRIBUZIONI DOPPIE
di NON
DISTRIBUZIONI
DOPPIE DISTRIBUZIONI
GRAFICI
DISTRIBUZIONI SEMPLICI
• Secondo un carattere di qualsiasi tipo:
- diagrammi simbolici o pictogrammi - grafici:
a segmenti
a nastri
a colonne - areogrammi
• Secondo un carattere ordinato:
- rettilineo → ISTOGRAMMi - ciclico:
grafico a raggi
grafico a settori circolari di uguale ampiezza
grafico a settori circolari di uguale ampiezza
• Secondo un carattere quantitativo rettilineo discreto
GRAFICI
DISTRIBUZIONI SEMPLICI
grafico a settori circolari di uguale ampiezza grafico a settori circolari di uguale ampiezza carattere quantitativo rettilineo discreto
GRAFICI di
DISTRIBUZIONI DOPPIE
• A colonne suddivise
• A cerchi suddivisi
• Cartodiagrammi a rappresentazioni suddivise:
- lineare - areale
• Stereogrammi
GRAFICI di
NON DISTRIBUZIONI
• Delle serie territoriali
• Cartogrammi:
- a tratteggio - a tratteggio - a colonne - a cerchi
- misto (colonne e cerchi)
• Delle serie storiche
GRAFICI di
DISTRIBUZIONI DOPPIE
GRAFICI di
NON DISTRIBUZIONI
Vari tipi di diagrammi: alcuni esempi
1-a torta
FIG.1alcuni esempi
0 20 40
05/01 /2002
06/01 /2002 09/01
/2002 Serie 1
2-ad anello
0 /2002
07/01 /2002 08/01
/2002
/2002 Serie 1
Serie 2
4-radar
VARIABILE STATISTICA AD UNA DIMENSIONE
Si prenda in esame un insieme ben determinato di (popolazione), caratterizzati da un
argomentali x
1, x
2,..., x
ndiversi.
argomentali diversi.
Classificare la popolazione secondo l’attributo X vuole dire esaminare tutti gli individui della popolazione e determinare,per ognuno di essi, il valore argomentale ; quindi si procede ad un raggruppamento di
valori argomentali (e quindi di individui), definendo un
raggruppamento ∆x: si assume che tutti i valori argomentali compresi in questo intervallo, assumano il valore argomentale intermedio.
x
nx
x
1,
2,...,
x
iVARIABILE STATISTICA AD UNA DIMENSIONE
Si prenda in esame un insieme ben determinato di individui
), caratterizzati da un attributo X che può assumere valori diversi.
diversi.
la popolazione secondo l’attributo X vuole dire esaminare tutti gli individui della popolazione e determinare,per ognuno di essi, il valore argomentale ; quindi si procede ad un raggruppamento di
valori argomentali (e quindi di individui), definendo un intervallo di
x: si assume che tutti i valori argomentali compresi in questo intervallo, assumano il valore argomentale intermedio. x
ix
i∆ x
Si potrà allora scrivere una corrispondenza numerica:
dove gli sono ordinati in senso crescente e gli rappresentano il numero di individui che hanno il valore argomentale (
x
i nn
F F
F
x x
x
...
...
2 1
2
{
1X
numero di individui che hanno il valore argomentale (
assoluta). E’ evidente che (essendo N= numero totale individui):
Si possono introdurre le frequenze relative:
N F
n
i i
=
∑
=1n
f f
f
x x
x
...
...
2
X {
1Questa corrispondenza numerica si chiama
dimensione (ma si possono definire, in maniera analoga, anche se più complessa, variabili a 2 o più dimensioni).
f
nf
f
1 2...
{
Si potrà allora scrivere una corrispondenza numerica:
dove gli sono ordinati in senso crescente e gli rappresentano il numero di individui che hanno il valore argomentale (frequenza
ix
n
F
numero di individui che hanno il valore argomentale (frequenza ). E’ evidente che (essendo N= numero totale individui):
Si possono introdurre le frequenze relative:
x
iN
N f
i= F
i= 1
∑ n i i f
Questa corrispondenza numerica si chiama variabile statistica ad 1 dimensione (ma si possono definire, in maniera analoga, anche se più complessa, variabili a 2 o più dimensioni).
1
1 =
∑
i i
=f
Si divida l’asse x secondo l’intervallo di
Rappresentazione grafica della v.s. ad 1 dimensione:
ISTOGRAMMA
y Si divida l’asse x secondo l’intervallo di y
raggruppamento ∆xi; la mezzeria di ogni intervallo sia in corrispondenza del valore xi della variabile. Per ogni intervallo costruiamo un rettangolo di altezza yi tale che:
y
i* ∆x = f
iL’area racchiusa da ogni rettangolo rappresenta la frequenza relativa f yi
FIG.2
L’area racchiusa da ogni rettangolo rappresenta la frequenza relativa f valore argomentale xi.
L’istogramma dà una rappresentazione visiva di come i valori argomentali siano distribuiti tra gli individui della popolazione.
Rappresentazione grafica della v.s. ad 1 dimensione:
ISTOGRAMMA
L’area racchiusa da ogni rettangolo rappresenta la frequenza relativa f , corrispondente al xi x
∆x
L’area racchiusa da ogni rettangolo rappresenta la frequenza relativa fi , corrispondente al
L’istogramma dà una rappresentazione visiva di come i valori argomentali siano distribuiti tra gli
Per un numero N di individui molto elevato, con valori che si susseguono ad intervalli molto ristretti, se non esistono discontinuità nelle frequenze di gruppi vicini, l’istogramma può essere rappresentato con una curva continua chiamata
introducano elementi estranei o incongruenti con il tipo di variabile esaminato).
( )
xy =ϕ
y
y=
a
Per un numero N di individui molto elevato, con valori che si susseguono ad intervalli molto ristretti, se non esistono discontinuità nelle frequenze di gruppi vicini, l’istogramma può essere rappresentato con una curva continua chiamata curva di frequenza (sempre che non si introducano elementi estranei o incongruenti con il tipo di variabile esaminato).
x
i( ) ⋅ = 1
∫
bx dx
a
ϕ
y=ϕ(x)
a
b x FIG.3
Occorre introdurre il concetto di MOMENTO, che dà informazioni quantitative distribuzione.
Si chiama momento del K grado della variabile:
mo
( ) x = ∑
nx ⋅ f = ∑ x
kF
i≅
m 1
RAPPRESENTAZIONE SINTETICA di una Variabile Statistica
Per variabile continua:
Esaminiamo alcuni momenti rappresentativi:
• Momento di 1°grado:
( ) ∑ ∑
=
≅
=
⋅
=
ik ii
i i
k
N N
x F f
x x
m
1
1
( ) x x ( ) x dx
m
b
a k
k
= ∫ ⋅ ϕ
( ) x
nx f
m = ∑ ⋅
Indica genericamente quale è la posizione della variabile sull’asse delle x, perché i valori argomentali si distribuiscono intorno al valore della media.
x
i( )
ii
i
f x x
m = ∑ ⋅
=1
1 MEDIA
Occorre introdurre il concetto di MOMENTO, che dà informazioni quantitative globali sulla della variabile:
∑
Nx
kRAPPRESENTAZIONE SINTETICA di una Variabile Statistica
∑
r= kx
rN
1Indica genericamente quale è la posizione della variabile sull’asse delle x, perché i valori argomentali si distribuiscono intorno al valore della media.
• Momento di 2°grado:
(questo valore ha, per noi, poco significato pratico).
( )
in
i
i
f
x x
m = ∑ ⋅
=1 2
2 QUADRATICO MEDIO
(questo valore ha, per noi, poco significato pratico).
• Si consideri una nuova variabile statistica, così definita:
Questa variabile ha la stessa distribuzione della variabile X:
M x
v
i=
i−
Variabile SCARTO
n n
f f
f
v v
v v
....
....
2 1
2 1
1
∑ =
= n
i
f
i( ) ∑
n- momento di 1°grado:
- momento di 2°grado:
( )
1
1 =
∑
= i
n
i
i f v v
m
( ) ∑ (
=
=
ni
i
x f v
m
1 2
(questo valore ha, per noi, poco significato pratico).
VALORE
QUADRATICO MEDIO (questo valore ha, per noi, poco significato pratico).
Si consideri una nuova variabile statistica, così definita:
Questa variabile ha la stessa distribuzione della variabile X:
Variabile SCARTO
= 1
( )
∑
n( )
01
=
−
=
∑
= i
n
i
i M f
x
) ∑
=
=
−
ni
i i
i
M f v
x
1 2 2
VARIANZA
σ
2La varianza indica come la variabile è distribuita intorno alla media: è, cioè, un indice di dispersione.
Per quanto riguarda il calcolo della media:
Per quanto riguarda il calcolo della media:
( ) ∑
=
=
=
=
ni
i i
f x x
m M
1 1
Per quanto riguarda la varianza σ2:
( ) ∑ ( ) ∑ ( )
= =
= −
⋅
−
=
ni
n
i
i i
i
N
M f x
M x
v m
1 1
2 2 2
2
σ
( )
2(
2 22
x M f x M 2
n n
− +
=
⋅
−
= ∑ ∑
σ ( ) (
2 1
1 2 1
2
1 1
2 2 2
2
2
2 m f
x M
f M
f x
M x
f M
x
n
i
i i n
i i n
i
i i
i i
i i
i
=
− +
=
− +
=
⋅
−
=
∑
∑
∑
∑ ∑
=
=
=
= =
σ
La varianza indica come la variabile è distribuita intorno alla media: è, cioè, un indice di
∑ ∑
= =
=
=
ni
N
r r i
i
x
N N
F x
1 1
1
F
i2
∑ ( − ) ⋅ =
= n
i
i
i
M F
x
1
2 devianza della distribuzione
)
2 x M ) ⋅ f =
( )
22
M x
f M
x
i i−
=
⋅
σ=
Devianza standard o s.q.m.
VALORI CENTRALI
In statistica, oltre la media, si definiscono altri valori centrali nella distribuzione:
• MEDIANA: è quel valore dell’argomento in corrispondenza del quale
l’ordinata ha la caratteristica di dividere la curva di frequenza in due parti di aree equivalenti;
equivalenti;
• MODA o NORMA: è quel valore dell’argomento per il quale si ha il massimo di frequenza (ordinata) f
i.
Si possono avere più mode:
- unimodale - bimodale - trimodale - trimodale - ecc.
VALORI CENTRALI
In statistica, oltre la media, si definiscono altri valori centrali nella distribuzione:
MEDIANA: è quel valore dell’argomento in corrispondenza del quale
l’ordinata ha la caratteristica di dividere la curva di frequenza in due parti di aree MODA o NORMA: è quel valore dell’argomento per il quale si ha il massimo
FIG.4
DISUGUAGLIANZA di TCHEBYCHEFF
(o teorema di BYENAYME’
La varianza σ2 è un indice di dispersione abbastanza significativo: si può infatti dimostrare che la maggior parte dei valori argomentali xi è contenuta entro i limiti M
la distribuzione. Infatti, scriviamo:
∑ = +
=
nv
2f v
2f v
2f σ
2(le vi2 siano ordinate in ordine crescente).
Si prenda un valore intermedio vm2 e ad esso diamo il valore c
minori di c2. Si pongano uguali a c2 tutti quelli maggiori. Sarà allora:
∑
=
= +
=
i
i
i
f v f v f
v
1
2 2 2 1 2 1 2
σ
2.... f f
*f
f + + + = σ
2≥
( f
mf
c +
≥
2σ
2Si pone da cui . Si ricavi ( frequenza relativa degli scarti inferiori a c):
Imponendo c=λσ si ottiene:
f
**
1
.... f f
f
f
m+
m++ +
n= σ
2≥
*
≥ 1 − f
DISUGUAGLIANZA di TCHEBYCHEFF
(o teorema di BYENAYME’-TCHEBYCHEFF)
è un indice di dispersione abbastanza significativo: si può infatti dimostrare è contenuta entro i limiti M±3σ, qualunque sia
+ +
+ +
+ .... v
2f .... v
2f v
2f
e ad esso diamo il valore c2. Si azzerino tutti i valori vi2 tutti quelli maggiori. Sarà allora:
−
−
+
+ +
+
+ v
m2f
mv
n2 1f
n 1v
n2f
n2
.... ....
) 1
2
(
f c −
≥
)
n
m
f
f
+1+ .... +
Si pone da cui . Si ricavi ( frequenza relativa degli scarti inferiori a c):
) 1
(
*2
f
c −
≥
2
1
− λ
La disuguaglianza di Tchebycheff:
è significativa per λ>1. In particolare:
* 2
1 1
− λ
≥ f
è significativa per λ>1. In particolare:
• per λ=2
• per λ=3
cioè: per qualsiasi variabile statistica, almeno il 75% degli scarti ha un valore inferiore o uguale a ±2σ, e almeno l’89% ha un valore inferiore o uguale a
Si può dire anche che la frequenza relativa dei termini che sono non interni ad un intorno
75 , 4 0
1 1
*
≥ − =
f
89 , 9 0
1 1
*
≥ − =
f
Si può dire anche che la frequenza relativa dei termini che sono non interni ad un intorno della media, non può superare un certo limite ( è un caso particolare del più generale teorema di Markov).
2
1
cioè: per qualsiasi variabile statistica, almeno il 75% degli scarti ha un valore inferiore o , e almeno l’89% ha un valore inferiore o uguale a ±3σ.
Si può dire anche che la frequenza relativa dei termini che sono non interni ad un intorno Si può dire anche che la frequenza relativa dei termini che sono non interni ad un intorno della media, non può superare un certo limite ( è un caso particolare del più generale
FUNZIONE CUMULATIVA DI FREQUENZA
E’ la variabile originaria: x1 x2 … xn X
f1 f2 … fn
{
f1 f2 … fnSi definisce funzione cumulativa di frequenza la seguente: x
con: t1 = f1 t2 = f1 + f2
tn = f1 + f2 + … + fn = Σfi = 1
Il valore ti rappresenta la frequenza relativa di tutti gli individui che hanno un valore argomentale inferiore od uguale a xi.
Le curve cumulative di frequenza sono assai utili per trovare rapidamente il numero
{
t
Le curve cumulative di frequenza sono assai utili per trovare rapidamente il numero di individui che hanno valori argomentali compresi
FUNZIONE CUMULATIVA DI FREQUENZA
Si definisce funzione cumulativa di frequenza la seguente: x1 x2 … xn Y
t1 t2 … tn
di tutti gli individui che hanno un valore Le curve cumulative di frequenza sono assai utili per trovare rapidamente il numero
{
FIG.5 x
Le curve cumulative di frequenza sono assai utili per trovare rapidamente il numero compresi in un intervallo qualsiasi.
E’ un evento del quale non si può prevedere la modalità Ad esempio. pensare ad una moneta che viene lanciata lancio effettuato, si verificherà l’evento “testa” o l’evento
ESTRAZIONE a CASO
EVENTO ALEATORIO O STOCASTICO
ESTRAZIONE a CASO
Un particolare evento aleatorio è l’estrazione a caso numero N1 di palline, tutte uguali tra loro, ma con scritto pallina. All’atto dell’estrazione tutte le palline sono identiche non deve poter scegliere e cioè non deve esserci ragione Si estrae una pallina, si legge il numero sopra scritto
Si continua in queste estrazioni un numero di volte ottiene la corrispondenza:
{
xxf’che si chiama
VARIABILE STATISTICA CAMPIONE.
{
X
modalità di uscita.
lanciata: non è mai possibile prevedere se, a l’evento “croce”.
ESTRAZIONE a CASO
EVENTO ALEATORIO O STOCASTICO
ESTRAZIONE a CASO
caso. Si pensi ad un’urna con un certo scritto un numero distintivo su ogni
identiche e chi effettua l’estrazione ragione di estrazioni preferenziali.
scritto e la si rigetta all’interno dell’urna.
volte N2, grande a piacere (N2>>N1). Si x1 x2 … xn
x1 x2 … xn f’1 f’2 … f’n
VARIABILE STATISTICA CAMPIONE.
Se incrementiamo il numero N2 di estrazioni a caso, accorge che:
• i valori argomentali xi della variabile campione popolazione assoggettata alle estrazioni a caso
• le frequenze f corrispondenti ad ogni valore
LEGGE EMPIRICA del CASO
• le frequenze fi corrispondenti ad ogni valore
convergere verso il valore proprio della frequenza quale si sarebbe ottenuto facendo un’indagine
Da questa “legge” si possono trarre due conclusioni 1) non si può mai prevedere l’estrazione di
argomentale. E’ prevedibile, invece, la distribuzione estrazioni a caso, si può prevedere la distribuzione frequenze) della variabile campione;
2) Esiste la possibilità di postulare l’esistenza 2) Esiste la possibilità di postulare l’esistenza
l’indagine su un fenomeno aleatorio mostra
autorizzati ad immaginare una popolazione “ignota”, fenomeno aleatorio.
Questa popolazione si chiama
POPOLAZIONE POSSIBILE
caso, sino a valori molto grandi, ci si
campione assumeranno tutti i valori propri della caso;
valore argomentale tendono a stabilizzarsi ed a
LEGGE EMPIRICA del CASO
valore argomentale tendono a stabilizzarsi ed a frequenza di quell’argomento nella popolazione, un’indagine di tipo statistico.
conclusioni:
di un determinato individuo o di un valore distribuzione, e cioè: dopo un certo numero N2 di distribuzione dei valori argomentali (ovvero le di una popolazione. Cioè tutte le volte che di una popolazione. Cioè tutte le volte che mostra una “stabilità statistica”, si può essere
“ignota”, ma “determinata”, che fa da sfondo al
POPOLAZIONE POSSIBILE .
Se si effettua una serie sempre crescente popolazione di composizione nota, o
una specie di VARIABILE LIMITE, caratterizzata
VARIABILI CASUALI
una specie di VARIABILE LIMITE, caratterizzata valori argomentali, in corrispondenza
“frequenze limite”: solo che, essendo il la variabile che così si definisce non eseguita e cristallizzata, ma di una
definibile cioè dopo un numero di estrazioni il nome di VARIABILE CASUALE ed alle argomentali, si da’ il nome di PROBABILITA’
x x … x
{ x1 x
2 … x
X
cp
1p
2… p
{
crescente di estrazioni a caso da da popolazione possibile, si ottiene caratterizzata ancora da una serie di
VARIABILI CASUALI
caratterizzata ancora da una serie di corrispondenza dei quali si definiscono delle il numero di estrazioni a caso infinito, non ha il carattere di un’operazione già una VARIABILE TEORICA in divenire, estrazioni infinito. A questa variabile si da’
alle frequenze limite, relative ai valori PROBABILITA’:
… x
… x
nΣ p
i= 1
… p
nPROBABILITÀ
• definizione a posteriori: è il limite a cui tende la frequenza di un dato valore argomentale della variabile campione, quando il numero di prove tende all’infinito
• definizione a priori : è il rapporto tra
• definizione a priori : è il rapporto tra
= numero casi favorevoli al presentarsi dell’evento numero di casi possibili
Noi scegliamo la “definizione a posteriori” che presuppone che siano effettivamente state fatte delle prove e che da queste si giunga alla definizione della variabile casuale.
Per variabile casuale continua si definisce:
essendo f(x) = densità di probabilità
essendo F(x) = funzione di distribuzione
( )
x =∫
x f( )
x ⋅dxF
( )
x dxf dp = ⋅
essendo F(x) = funzione di distribuzione
E per i MOMENTI :
( )
x =∫
f( )
x ⋅dxF
0
( ) = ∫
b( )
a k i
k
x x f x dx
m
: è il limite a cui tende la frequenza di un dato valore argomentale della variabile campione, quando il numero di prove tende all’infinito
numero casi favorevoli al presentarsi dell’evento
Noi scegliamo la “definizione a posteriori” che presuppone che siano effettivamente state fatte delle prove e che da queste si giunga alla definizione della variabile casuale.
essendo f(x) = densità di probabilità
essendo F(x) = funzione di distribuzione essendo F(x) = funzione di distribuzione
Proprietà delle probabilità composte:
se un evento aleatorio A risulta dal concorso di due eventi aleatori indipendenti B e C di probabilità pb e pc, la probabilità dell’evento A è data
Se l’ordine di uscita degli eventi C e B non ha importanza, si ha:
p
a=
p ' =
In generale:
essendo n! in numero delle disposizioni possibili degli n eventi attesi.
p '
a= '
a= p
Proprietà delle probabilità totali:
se un evento aleatorio A può presentarsi con modalità diverse B e C ognuna delle quali ha se un evento aleatorio A può presentarsi con modalità diverse B e C ognuna delle quali ha probabilità pb e pc, la probabilità di A è data dalla
p
ase un evento aleatorio A risulta dal concorso di due eventi aleatori indipendenti B e C di , la probabilità dell’evento A è data dal prodotto delle probabilità di B e C:
ha importanza, si ha:
c
b
p
p ⋅
=
p p ⋅
⋅
= 2
in numero delle disposizioni possibili degli n eventi attesi.
c
b
p
p ⋅
⋅
= 2
...
! ⋅ ⋅ ⋅
= n p
bp
cse un evento aleatorio A può presentarsi con modalità diverse B e C ognuna delle quali ha se un evento aleatorio A può presentarsi con modalità diverse B e C ognuna delle quali ha
, la probabilità di A è data dalla somma delle probabilità:
c b
a
= p + p
1°caso: ci sono 4 palline colorate in modo diverso: come possono essere sistemate in fila? La 1° posizione può essere occupata da una pallina qualsiasi (4 diversi modi di occupare la 1
occupare la 2° posizione, 2 modi di occupare la 3
occupare la 4 posizione. Quindi 4x3x2x1= 24 R.: Ci sono 24 modi di sistemare le palline.
2°caso: si vogliono sistemare 7 persone attorno ad un tavolo rotondo Alcuni esempi
2°caso: si vogliono sistemare 7 persone attorno ad un tavolo rotondo a) ognuno può sedere in un posto qualsiasi; la 1
posto qualsiasi, le restanti 6 persone in 6! = 720 modi diversi b) due persone non devono essere vicine: le 2 persone possono essere
sistemate in 2 ! modi diversi e le altre 5 in 5! modi diversi. Quindi 2! 5!
=240 modi diversi di sistemare le 7 persone, con due che siedono vicini.
R.:si dovrà quindi fare 720-240 = 480 modi di sistemare le persone, tenendo conto della restrizione imposta
3°caso
:
scegliere tra un totale di 9 persone, un comitato composto da sole 5 persone.sole 5 persone.
R.: = 9!/5! =9x8x7x6x5/ 5! = 126 modi di scegliere il comitato 4° caso : in un dado che probabilità ha l’uscita del 3 o del 5 ?
R.: 1/6 + 1/6 = 1/3 (probabilità più vantaggiosa, totale) . 5° caso : qual è la probabilità di uscita del 3 e del 5 ?
R.: 1/6 x 1/6 = 1/ 36 ( probabilità composta).
9 5
: ci sono 4 palline colorate in modo diverso: come possono essere posizione può essere occupata da una pallina qualsiasi (4 diversi modi di occupare la 1° posizione); ci sono 3 modi di
posizione, 2 modi di occupare la 3° posizione, 1 modo di occupare la 4 posizione. Quindi 4x3x2x1= 24
R.: Ci sono 24 modi di sistemare le palline.
: si vogliono sistemare 7 persone attorno ad un tavolo rotondo : si vogliono sistemare 7 persone attorno ad un tavolo rotondo a) ognuno può sedere in un posto qualsiasi; la 1° persona può sedere in un
posto qualsiasi, le restanti 6 persone in 6! = 720 modi diversi b) due persone non devono essere vicine: le 2 persone possono essere
sistemate in 2 ! modi diversi e le altre 5 in 5! modi diversi. Quindi 2! 5!
=240 modi diversi di sistemare le 7 persone, con due che siedono 240 = 480 modi di sistemare le persone,
tenendo conto della restrizione imposta
.
scegliere tra un totale di 9 persone, un comitato composto da
R.: = 9!/5! =9x8x7x6x5/ 5! = 126 modi di scegliere il comitato n un dado che probabilità ha l’uscita del 3 o del 5 ?
1/6 + 1/6 = 1/3 (probabilità più vantaggiosa, totale) . qual è la probabilità di uscita del 3 e del 5 ?
.: 1/6 x 1/6 = 1/ 36 ( probabilità composta).
Se un fenomeno aleatorio risulta dalla concomitanza
quello di definire la variabile casuale relativa al fenomeno aleatorio composto.
EVENTO ALEATORIO COMPOSTO con 2 o più eventi aleatori. OPERAZIONI con VARIABILI CASUALI
quello di definire la variabile casuale relativa al fenomeno aleatorio composto.
Devono essere note:
• le variabili casuali componenti
• la modalità matematica con cui si ottiene il risultato Si abbia la variabile casuale:
e la variabile casuale
2 1
2 1
...
...
p p
x X x
y y ...
Vogliamo ottenere la variabile casuale “somma” delle due: cioè, riconducendoci allo schema dell’estrazione a caso, supponiamo di estrarre a caso un individuo della popolazione possibile definito dalla variabile X e di estrarre a caso un individuo dalla variabile Y.
2 1
2 1
...
...
g g
y Y y
concomitanza di due o più fenomeni aleatori, il problema è quello di definire la variabile casuale relativa al fenomeno aleatorio composto.
EVENTO ALEATORIO COMPOSTO con 2 o più eventi aleatori. OPERAZIONI con VARIABILI CASUALI
quello di definire la variabile casuale relativa al fenomeno aleatorio composto.
la modalità matematica con cui si ottiene il risultato
∑
= n=
1 j
1
...
...
j n
n
p
p x
∑
ny
delle due: cioè, riconducendoci allo schema dell’estrazione a caso, supponiamo di estrarre a caso un individuo della popolazione possibile definito dalla variabile X e di estrarre a caso un individuo dalla variabile Y.
∑
= n
=
1 k
1
k m
m
g
g
y
Nell’eseguire un numero molto grande di doppie estrazioni, tutti i valori x
valori yi e daranno luogo ad una serie di t valori della “somma” ( con modalità matematica definita).
y x
s = +
e quindi si avrà la variabile composta
La deduzione della distribuzione della variabile composta può alle volte essere molto complessa e spesso occorre ricorrere a soluzioni approssimate.
k j
i
x y
s = +
1 1
f f S s
Nell’eseguire un numero molto grande di doppie estrazioni, tutti i valori xi si combineranno con i valori della “somma” ( con modalità matematica
La deduzione della distribuzione della variabile composta può alle volte essere molto complessa e spesso occorre ricorrere a soluzioni approssimate.
∑
= n=
1 i
2
2
1
...
...
i t
t
f
f f
s
s
Cerchiamo le relazioni che permettono, noti i momenti di 1 momenti di 1° e 2° grado della variabile casuale composta S:
( )
( )
∑ ∑ ∑
∑ ∑
∑
= =
=
±
=
=
±
=
=
n m m
jk n
j
m
k
k j
t
i
i i
s s f x y f
m
1 1
1 1
∑ ∑ ∑
= = =
±
= n
j
m
k
k k j
m
k
k j
j p g p y g
x
1 1 1
REGOLA N.1: il valore medio di una variabile casuale somma (o differenza) di due variabili casuali è pari alla somma (o differenza) dei valori medi delle variabili casuali componenti:
( ) s m m 1 =
( )
(
∑ ∑ ∑
∑ ∑ ∑
= = =
=
=
n m n
t
i
n
j m
k
j i
i
s s f x
m
1 1 1
2 2
∑ ∑ ∑
= =
+
= n
j m
k
n
j k j j p g x
1 1 1
2
REGOLA N.2: il valore quadratico medio di una variabile somma (o differenza) di due variabili casuali è la somma di valori quadratici medi delle variabili componenti aumentata (o diminuita) del doppio prodotto delle due medie.
( )
sm ( )
xm
2=
2Cerchiamo le relazioni che permettono, noti i momenti di 1° e 2° grado della X e della Y, di ricavare i grado della variabile casuale composta S:
( )
∑ ∑ ∑
∑ ∑
= =
±
=
=
±
=
n n m
k j n
j
m
k
k
j y p g
x
1 1
∑ ∑ ∑
= = =
±
=
n
j
n
j
m
k
k k j
j
j p p y g
x
1 1 1 Modalità
Si = xj + yk
REGOLA N.1: il valore medio di una variabile casuale somma (o differenza) di due variabili casuali è pari alla somma (o differenza) dei valori medi delle variabili casuali componenti:
( ) x m ( ) y
m ±
) ( )
∑ ∑
∑
∑ ∑
= ==
±
=
±
n m
m
n
j m
k
k j k
j jk
k
j y f x y p g
1 1
2 2
∑ ∑
∑
= = =+ n
j m
k
k j k j m
k
k j
k p g x y p g
y
1 1
1
2 2
REGOLA N.2: il valore quadratico medio di una variabile somma (o differenza) di due variabili casuali è la somma di valori quadratici medi delle variabili componenti aumentata (o diminuita) del
) + m
2( )
y± 2 m
1( )
x⋅ m
1( )
yREGOLA N.3: la VARIANZA di una variabile casuale somma (o differenza) di due variabili casuali è la somma delle varianze casuali componenti.
( )2s
m
2(σ =
la somma delle varianze casuali componenti.
aX W =
In generale, data la funzione:
( ) ( )
21
W
m
Wσ =
si ha (REGOLA N.4):
=
REGOLA N.3: la VARIANZA di una variabile casuale somma (o differenza) di due variabili casuali è ( )v
= σ
x2+ σ
y2cZ bY
aX ± ±
In generale, data la funzione:
( ) ( ) ( )
( )
2 2( )
2 2( )
22
1 1
1
Z Y
X
Z Y
X