Corso di Laurea Specialistica in SCIENZE DELLE
PROFESSIONI SANITARIE DELLA RIABILITAZIONE
Consentono il passaggio da una pluralità di informazioni
ad un’unica misura numerica;
Sintetizzano l’intera distribuzione in un singolo valore,
consentendo così confronti nel tempo, nello spazio o tra
circostanze differenti;
In alcuni casi, consentono di verificare se le conseguenze
di una determinata azione abbiano prodotto il risultato
desiderato, in quale direzione e con quale intensità.
µ =19.4+14.0+16.8+...+17.720 =305.920 =15.3 mmHG
Esempio: Pressione
Oculare
Osservazione 1 19.4 Osservazione 2 14.0 Osservazione 3 16.8 Osservazione 4 14.5 Osservazione 5 12.0 Osservazione 6 12.0 Osservazione 7 13.7 ... ... Osservazione 19 19.7 Osservazione 20 17.7 Se i dati sono organizzati in forma di serie,x1,x2, ...,xnessa si ottiene sommando tutti i valori
osservati e dividendo per il numero di osservazioni:
µ =
P
ni=1
x
in
La
Media artimetica
, di seguito indicata con µ, è quel valore che,
sostituito a tutte le osservazioni, lascia invariata la loro somma.
Esempio: Età
Età Frequenza 20 4 21 3 22 3 23 3 24 3 25 4 Totale 20 Se i dati sono organizzati in forma di distribuzionedi frequenza, (x1,n1), (x2,n2), ..., (xk,nk)essa si
ottiene moltiplicando ciascun valore per la corrispondente frequenza, sommando tutti questi prodotti e dividendo quindi per la somma delle frequenze:
µ =
P
k j=1x
j× n
jP
k j=1n
jLa
Media artimetica
, di seguito indicata con µ, è quel valore che,
sostituito a tutte le osservazioni, lascia invariata la loro somma.
µ =(20×4)+(21×3)+...+(25×4)=450=22.5 anni
Esempio: Età
Età Frequenza 20 4 21 3 22 3 23 3 24 3 25 4 Totale 20 Se i dati sono organizzati in forma di distribuzionedi frequenza, (x1,n1), (x2,n2), ..., (xk,nk)essa si
ottiene moltiplicando ciascun valore per la corrispondente frequenza, sommando tutti questi prodotti e dividendo quindi per la somma delle frequenze:
µ =
P
k j=1x
j× n
jP
k j=1n
jLa
Media artimetica
, di seguito indicata con µ, è quel valore che,
sostituito a tutte le osservazioni, lascia invariata la loro somma.
Proprietà della Media aritmetica
La media aritmetica è sempre compresa tra il minimo e il
massimo della distribuzione osservata;
La media aritmetica è espressa nella stessa unità di
misura dei dati originali;
La somma algebrica degli scarti di ciascuna osservazione
dalla media aritmetica è nulla;
La media aritmetica è una sintesi di tutti i valori ed è quindi
influenzata da outliers; è cioè un indicatore poco robusto;
La media aritmetica può essere calcolata solo per variabili
quantitative.
N.B.Nel caso in cui n è pari e quindi esistono due posizioni mediane, se si è in pre-senza di variabili quantitative la mediana è ottenuta come semi-somma dei due valori corrispondenti; se la variabile è qualitativa ordinale allora si dice che la distribuzione
Calcolo della mediana
1 Si ordina la distribuzione in modo non decrescente; 2 Si determina la posizione mediana
Se il numero di osservazioni n è dispari allora PosMe= n+12
Se il numero di osservazioni n è pari allora PosMe=
˘n 2,
n 2+1
¯ 3 Si osserva il valore che occupa la posizione mediana
LaMediana, di seguito indicata con Me, è il valore assunto dall’unità statistica che occupa la posizione centrale della distribuzione ordinata in modo non decrescente; quel valore cioè che lascia alla sua sinistra il 50% delle osservazioni più piccole e alla sua destra il 50% delle osservazioni più grandi
Un esempio: n dispari
Valore Posizione 19 1 22 2 25 3 26 4 27 5P
Me=
n+12=
5+12=
3
Un esempio: n dispari
Valore Posizione 19 1 22 2 25 3 26 4 27 5P
Me=
n+12=
5+12=
3
Me = 25
Un esempio: n dispari
Valore Posizione 19 1 22 2 25 3 26 4 27 5Un esempio: n pari
Valore Posizione 19 1 22 2 25 3 26 4 27 5P
Me=
n+12=
5+12=
3
Me = 25
Un esempio: n dispari
Valore Posizione 19 1 22 2 25 3 26 4 27 5P
Me=
n 2=
3,
n 2+
1 = 4
Un esempio: n pari
Valore Posizione 19 1 22 2 25 3 26 4 27 5 41 6P
Me=
n+12=
5+12=
3
Me = 25
Un esempio: n dispari
Valore Posizione 19 1 22 2 25 3 26 4 27 5P
Me=
n 2=
3,
n 2+
1 = 4
Me =
25+262=
25.5
Un esempio: n pari
Valore Posizione 19 1 22 2 25 3 26 4 27 5P
Me=
n+12=
5+12=
3
Me = 25
Un esempio: n dispari
Valore Posizione 19 1 22 2 25 3 26 4 27 5Assenza di dolore 0
Dolore Insostenibile 100 LaVASè una rappresentazione grafica della gravità del dolore che un paziente crede di avvertire. È costituita da una linea orizzontale di 100 millimetri con barre verticali alle due estremità che rappresentano l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il paziente indica il punto che ritiene identifichi il suo stato algico. La distanza di questo dal punto di assenza di dolore, misurata in millimetri corrisponde al punteggio dolorifico
Assenza di dolore 0
Dolore Insostenibile 100 LaVASè una rappresentazione grafica della gravità del dolore che un paziente crede di avvertire. È costituita da una linea orizzontale di 100 millimetri con barre verticali alle due estremità che rappresentano l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il paziente indica il punto che ritiene identifichi il suo stato algico. La distanza di questo dal punto di assenza di dolore, misurata in millimetri corrisponde al punteggio dolorifico
Assenza di dolore 0
Dolore Insostenibile 100
22
LaVASè una rappresentazione grafica della gravità del dolore che un paziente crede di avvertire. È costituita da una linea orizzontale di 100 millimetri con barre verticali alle due estremità che rappresentano l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il paziente indica il punto che ritiene identifichi il suo stato algico. La distanza di questo dal punto di assenza di dolore, misurata in millimetri corrisponde al punteggio dolorifico
Prima Dopo Diff. 61 32 29 26 29 -3 56 56 0 30 35 -5 63 28 35 68 10 58 56 21 35 31 37 -6 10 49 -39 44 30 14 69 14 55 50 46 4 51 51 0 78 34 44 50 54 -4 76 18 58 47 34 13 52 31 21 37 18 19
Diff. Pos. -39 1 -6 2 -5 3 -4 4 -3 5 0 6 0 7 4 8 13 9 14 10 19 11 21 12 29 13 35 14 35 15 44 16 55 17 58 18 58 19 Ordinamento
Prima Dopo Diff.
61 32 29 26 29 -3 56 56 0 30 35 -5 63 28 35 68 10 58 56 21 35 31 37 -6 10 49 -39 44 30 14 69 14 55 50 46 4 51 51 0 78 34 44 50 54 -4 76 18 58 47 34 13 52 31 21 37 18 19
n = 19
P
Me=
n+12=
10
Diff. Pos. -39 1 -6 2 -5 3 -4 4 -3 5 0 6 0 7 4 8 13 9 14 10 19 11 21 12 29 13 35 14 35 15 44 16 55 17 58 18 58 19 OrdinamentoPrima Dopo Diff.
61 32 29 26 29 -3 56 56 0 30 35 -5 63 28 35 68 10 58 56 21 35 31 37 -6 10 49 -39 44 30 14 69 14 55 50 46 4 51 51 0 78 34 44 50 54 -4 76 18 58 47 34 13 52 31 21 37 18 19
n = 19
P
Me=
n+12=
10
Me = 14
Diff. Pos. -39 1 -6 2 -5 3 -4 4 -3 5 0 6 0 7 4 8 13 9 14 10 19 11 21 12 29 13 35 14 35 15 44 16 55 17 58 18 58 19 OrdinamentoPrima Dopo Diff.
61 32 29 26 29 -3 56 56 0 30 35 -5 63 28 35 68 10 58 56 21 35 31 37 -6 10 49 -39 44 30 14 69 14 55 50 46 4 51 51 0 78 34 44 50 54 -4 76 18 58 47 34 13 52 31 21 37 18 19
Proprietà della Mediana
La mediana è sempre compresa tra il minimo e il massimo
della distribuzione osservata;
La mediana è espressa nella stessa unità di misura dei
dati originali;
La mediana può essere calcolata sia per variabili
quantitative che per variabili qualitative ordinali
(Attenzione
però al caso in cui n è pari!)
La mediana non risente della presenza di eventuali outliers
perché si disinteressa di ciò che accade nelle code della
distribuzione dei dati;
I quartili sono indicatori di posizione che, al pari della mediana, si calcolano rilevando il valore assunto dalle unità statistiche che occupano posizioni cruciali nella serie ordinata (in senso non decrescente) dei dati
Il primo quartile (di seguito indicato con Q1) è quel valore che
lascia alla sua sinistra il 25 % delle osservazioni più piccole e alla sua destra il 75 % delle osservazioni più grandi
Il secondo quartile è quel valore che lascia alla sua sinistra il 50 % delle osservazioni più piccole e alla sua destra il 50 % delle osservazioni più grandi. Esso quindi coincide con la Mediana Il terzo quartile (di seguito indicato con Q3è quel valore che lascia
alla sua sinistra il 75 % delle osservazioni più piccole e alla sua destra il 25 % delle osservazioni più grandi
La variabilità di un fenomeno è la sua attitudine ad assumere differenti modalità.
Un indice di variabilità è una misura di tale attitudine, e dovrebbe possedere le seguenti caratteristiche:
1 Deve essere non negativo
2 Deve essere nullo se e solo se tutte le unità presentano la stessa modalità del carattere;
3 Deve aumentare all’aumentare della diversità tra le unità. La variabilità può essere calcolata rispetto ad un centro (misure di dispersione) o valutando le differenze tra tutte le possibili coppie di unità osservate (misure di diseguaglianza)
X
µ
LaVarianza(di seguito indicata con σ2) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento.
X
µ
X
µ
LaVarianza(di seguito indicata con σ2) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento.
Indici Sintetici di Variabilità: Varianza
Razionale della Varianza
n X i=1 (xi− µ) i=1 Pn i=1(xi− µ)2 n = σ2Media di scarti al quadrato
LaVarianza(di seguito indicata con σ2) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento.
Indici Sintetici di Variabilità: Varianza
Razionale della Varianza
nX
i=1
(xi− µ) Il risultato è sempre uguale a 0
i=1
Pn
i=1(xi− µ)2
n = σ
2Media di scarti al quadrato
LaVarianza(di seguito indicata con σ2) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento.
Indici Sintetici di Variabilità: Varianza
Razionale della Varianza
nX
i=1
(xi− µ) Il risultato è sempre uguale a 0 n
X
i=1
(xi− µ)2
LaVarianza(di seguito indicata con σ2) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento.
Indici Sintetici di Variabilità: Varianza
Razionale della Varianza
nX
i=1
(xi− µ) Il risultato è sempre uguale a 0 n
X
i=1
(xi− µ)2Dipende dal numero di osservazioni
LaVarianza(di seguito indicata con σ2) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento.
Razionale della Varianza
nX
i=1
(xi− µ) Il risultato è sempre uguale a 0 n
X
i=1
(xi− µ)2Dipende dal numero di osservazioni
Pn
i=1(xi− µ)2
n = σ
2Media di scarti al quadrato
LaVarianza(di seguito indicata con σ2) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come valore di riferimento e si basa sulle distanze di ciascuna osservazione dal centro assunto come riferimento.
Prima Dopo 61 32 26 29 56 56 30 35 63 28 68 10 56 21 31 37 10 49 44 30 69 14 50 46 51 51 78 34 50 54 76 18 47 34 52 31 37 18
µprima= 61 + 26 + ... + 37 19 =50.3 µdopo= 32 + 29 + ... + 56 19 =33.0 Prima Dopo 61 32 26 29 56 56 30 35 63 28 68 10 56 21 31 37 10 49 44 30 69 14 50 46 51 51 78 34 50 54 76 18 47 34 52 31 37 18
σ2 prima= (61 − 50.3)2+ (26 − 50.3)2+ ... + (37 − 50.3)2 19 =298 σ2 dopo= (31 − 33)2+ (29 − 33)2+ ... + (56 − 33)2 19 =173 µprima= 61 + 26 + ... + 37 19 =50.3 µdopo= 32 + 29 + ... + 56 19 =33.0 Prima Dopo 61 32 26 29 56 56 30 35 63 28 68 10 56 21 31 37 10 49 44 30 69 14 50 46 51 51 78 34 50 54 76 18 47 34 52 31 37 18
Conclusioni
Prima del trattamento, il grado di dolore percepito dai pazienti risultain mediamaggiore (il trattamento ha cioè prodotto benefici nel collettivo esaminato). Si è inoltre determinata una riduzione della dispersione che è passata da 298 a 173; ciò indica che a seguito del trattamento, i valori di dolore risultano concentrati in misura maggiore attorno al punteggio medio. Vi è in altre parole un effetto stabilizzante. Cosa si sarebbe potuto concludere se invece la dispersione dei dati fosse aumentata a seguito del trattamento???
σ2 prima= (61 − 50.3)2+ (26 − 50.3)2+ ... + (37 − 50.3)2 19 =298 σ2 dopo= (31 − 33)2+ (29 − 33)2+ ... + (56 − 33)2 19 =173 µprima= 61 + 26 + ... + 37 19 =50.3 µdopo= 32 + 29 + ... + 56 19 =33.0 Prima Dopo 61 32 26 29 56 56 30 35 63 28 68 10 56 21 31 37 10 49 44 30 69 14 50 46 51 51 78 34 50 54 76 18 47 34 52 31 37 18
Dati in forma di serie µ = Pn i=1xi n σ2= Pn i=1(xi− µ)2 n
Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di serie µ = Pn i=1xi n σ2= Pn i=1(xi− µ)2 n
Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di distribuzione µ = Pk j=1xj× nj Pk j=1nj
Dati in forma di serie
µ = Pn i=1xi n σ2= Pn i=1(xi− µ)2 n
Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di distribuzione µ = Pk j=1xj× nj Pk j=1nj
Dati in forma di serie
µ = Pn i=1xi n σ2= Pn i=1(xi− µ)2 n
Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di distribuzione µ = Pk j=1xj× nj Pk j=1nj σ2= Pk j=1(xj− µ)2× nj Pk j=1nj
Dati in forma di serie
µ = Pn i=1xi n σ2= Pn i=1(xi− µ)2 n
Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di distribuzione µ = Pk j=1xj× nj Pk j=1nj σ2= Pk j=1(xj− µ)2× nj Pk j=1nj
Dati in forma di serie
µ = Pn i=1xi n σ2= Pn i=1(xi− µ)2 n
Quando i dati sono espressi sotto forma di distribuzione è necessario tener conto delle frequenze con cui ciascun valore è stato osservato. Ricordando che la Varianza è una media di scarti al quadrato allora...
σ2=(26 − 28.6)2× 5 + (27 − 28.6)2× 3 + ... + (30 − 28.6)2× 14 40 =1.83 anni 2 µ =(26 × 5) + (27 × 3) + ... + (30 × 14) 40 =28.6 anni Età Frequenza 26 5 27 3 28 7 29 11 30 14 Totale 40
Distribuzione di frequenza dell’età al primo parto per un collettivo di 40 donne italiane.
Proprietà della Varianza
La varianza non può assumere valori negativi;
E’ nulla
se e solo se
tutte le osservazioni sono uguali tra di
loro (e quindi la media coincide con esse);
Attribuisce lo stesso peso ad osservazioni distanti dalla
media in una direzione piuttosto che nell’altra;
E’ espressa in una unità di misura che è il quadrato di
quella dei dati originali.
Lo s.q.m possiede le stesse caratteristiche della varianza ed ha in più il vantaggio di misurare la variabilità di un fenomeno utilizzando la stessa lingua dei dati
σ =
√
σ
2=
r P
n i=1(x
i− µ)
2n
Al fine di riportare la misura di variabilità all’unità di misura originale si estrae la radice quadrata della Varianza ottenendo un indice noto come
Scarto quadratico medio(abbreviato con s.q.m) oDeviazione standard
Utilizzando gli opportuni indici di posizione e di variabilitàconfrontarele due distribuzioni ecommentarei risultati ottenuti.
Durata Prima Dopo
60 6 14
70 4 3
80 4 3
90 6 0
Totale 20 20
Distribuzione di frequenza del tempo (in secondi) impiegato per il completamento di un test di lettura in un colletivo di 20 soggetti dislessici prima e dopo lo svolgimento di una terapia logopedica.