Trattamento e Analisi statistica dei dati sperimentali
Modulo II : Sintesi dei dati sperimentali
L3. Dati Ordinali
Prof. Carlo Meneghini
dip. di Scienze Università Roma Tre e-mail: carlo.meneghini@uniroma3.it
Sintesi Dati Ordinali
Ripartizione
Rappresentazioni grafiche (qualitative)
Istogramma di frequenze
Sintesi Dati Ordinali
Indici
di posizione
• Media
• Mediana
di dispersione
• Range
• Deviazione standard
• Interquartile
Sintesi quantitative
Box plot
Dati Ordinali: Ripartizione
T(x
i)
numero di valori osservati minori o uguali a x
iRipartizione: T(x i )
)
max(
0 ≤ T x
i≤ N
Dati Ordinali: Ripartizione
Min
MedianaMax
N
maxN
max/2
Ripartizione: T(x)
)
max(
0 ≤ T x ≤ N
Dati Ordinali: Distribuzione
distribuzione cumulata: F(x)
F(x)
Frazione di valori osservati minori o
uguali a x
1 )
(
0 ≤ F x ≤ N
totx x T
F ( )
)
( =
Dati Ordinali: Distribuzione
Intuitivo individuare valori notevoli della
distribuzione:
Quartili e Mediana
Q
1Mediana=Q
2Q
3distribuzione cumulata: F(x)
Dati Ordinali: Distribuzione
Mediana e Quartili
Quartili
F(Q
1)=0.25 (25%) F(Q
2)=0.50 (50%) F(Q
3)=0.75 (75%)
Mediana
F(Mediana)=0.50 (50%)
Q
1Mediana=Q
2Q
3Dati Ordinali: Distribuzione
F(x)
Consente il confronto diretto tra set di dati che
abbiano numerosità (N
tot) diversa
Dati Ordinali: Distribuzione Calcolo di ripartizioni e
distribuzioni per un set di dati in colonna
(video)
Ordino i dati
Definisco l'indice
Costruisco il grafico (xy)
• File Dati
• File con soluzione
Dati Ordinali: calcolo delle T(x) e F(x)
1: ordina i valori (x) in ordine crescente
2: Costruisci la T(x)
numerando i valori da 1 a Ntot
2: Calcola la F(x) dividendo i valori T(x) per Ntot
Dati Ordinali: Distribuzione
Per dati in tabelle
=conta.numeri(DATI)
=min(DATI)
=max(DATI)
La Funzione Frequenza per il calcolo delle funzioni di
ripartizione T(x) e distribuzione F(x)
1: Genero una sequenza di valori K (tra min(x) e max(x)) per i quali calcolare le distribuzioni
Dati Ordinali: Distribuzione
La Funzione Frequenza per il calcolo delle funzioni di ripartizione T(x) e distribuzione F(x)
=Frequenza(dati;classe)
=Frequenza(dati;classe)/Ntot
2: La funzione FREQUENZA conta il numero di dati in una matrice minori o uguali al valore della CLASSE, ovvero la T(X)
3: La F(x) si ottiene dividendo i valori della T(x) per Ntot
Istogrammi di Frequenza
Un Istogramma di Frequenze è l'analogo di un diagramma a Barre per dati nominali:
I dati sono aggregati in K- classi
Nj (j=1,...K) è la frequenza (assoluta) di ciascuna
classe
f
j (j=1,...K) è la frequenza (relativa) di ciascunaclasse
∆x
= ampiezza delle classitot i
i N
f = N
Dati Ordinali: Frequenze
NOTA
Negli istogrammi l’informazione (frequenza) è rappresentata
dall’area delle barre:
L’altezza delle barre è:
rappresentando una densità di frequenza
i i
i
x h
N = ∆ ×
i i
i x
h N
= ∆
Sono state intervistate Nt persone, In media:
N1=33 tra [18 -20) anni (totale 2x33) N2=34 tra [20 -30) anni (totale 9x34) N2=36 tra....
N1=(2x33)..
N2=(9x34) N=(5x36) 3 N=(5x27)4
Dati Ordinali: Frequenze
1. L'aspetto dell'istogramma dipende dalla scelta delle classi:
posizione (x
min)
Dati Ordinali: Frequenze
L'aspetto dell'istogramma dipende dalla scelta delle classi:
Ampiezza (∆x)
Dati Ordinali: Frequenze
Definizione delle classi
Il numero delle classi
deve essere commisurato al numero di dati
x x K xMax min
∆
= −
N
totK ≈
Orientativamente:
K x x xMax − min
≈
∆
Dati Ordinali: Frequenze
Buon senso:
1. Per ampiezza ed estremi usiamo numeri semplici
evitando troppe cifre decimali e numeri difficilmente leggibili
2. un numero ragionevole di intervalli
Definizione delle classi
∆k=17 è di difficile interpretazione!
Dati Ordinali: Frequenze La funzione:
FREQUENZA(dati;classi)
In forma standard la
funzione frequenza calcola la T(x) corrispondente ad
un dato valore
Dati Ordinali: Frequenze La funzione:
FREQUENZA(dati;classi)
La Frequenza in una classe di valori si ottiene per
differenza:
N(x
1-x
2)=T(x
2)-T(x
1)
T(70)=78 T(80)=122
N(70-80)=T(80)-T(70)=44
Dati Ordinali: Frequenze La funzione:
FREQUENZA(dati;classi)
La funzione FREQUENZA in forma di matrice calcola la N(x)
(o la f(x)) per un set di valori della x