• Non ci sono risultati.

Misure di tendenza centrale: media Misure di tendenza centrale: media

N/A
N/A
Protected

Academic year: 2021

Condividi "Misure di tendenza centrale: media Misure di tendenza centrale: media "

Copied!
5
0
0

Testo completo

(1)

a cura di Paolo Pandolfi a cura di Paolo Pandolfi

Misure di tendenza centrale Misure di tendenza centrale

Misure di variabilit Misure di variabilitàà

Misure di tendenza centrale Misure di tendenza centrale

Le misure descrittive possono essere calcolate dai dati di un campione o dai dati di una popolazione.

Una misura descrittiva calcolata dai dati di un campione è chiamatastatistica.

Una misura descrittiva calcolata dai dati di un popolazione è chiamataparametro.

Misure di tendenza centrale: media Misure di tendenza centrale: media

La caratteristica più comunemente studiata di una serie di dati è il suo centro, o il punto in cui le osservazioni tendono a raccogliersi.

La misura di tendenza centrale più frequentemente utilizzata è lamedia aritmeticamedia aritmeticaomedia.media.

La media è calcolata sommando tutte le osservazioni in una serie di dati e dividendo per il numero totale delle misurazioni:

E STATISTICH

UNITA' DI N

CARATTERE

DEL TOTALE AMMONTARE

  n x c

Esempio di calcolo della media aritmetica

Esempio di calcolo della media aritmetica

I tempi di arrivo di 8 nuotatori in una batteria di 200 metri stile libero sono stati i seguenti (in minuti e secondi):

1:23 1:18 1:22 1:22 1:24 1:19 1:19 1:20

Calcolare il tempo medio aritmetico della batteria.

Soluzione:

Prima di tutto è necessario ridurre i dati a un’unica unità di misura, ad esempio il minuto secondo (o, equivalentemente, il minuto primo):

x1 x2 x3 x4 x5 x6 x7 x8

83 78 82 82 84 79 79 80

Il tempo medio aritmetico della batteria risulta pari a (83+78+…+80) / 8 = 80,875 sec., ovvero poco meno di 1 minuto e 21 secondi:

80 . 82 78 83

8

1

i

xi

c 80875

8 80 . 78 83 8 8

8

1 .

i

xi

x c

Alcune caratteristiche della media aritmetica Alcune caratteristiche della media aritmetica

1. UNICITA’:Per un dato insieme di dati vi è una ed una sola media aritmetica.

2. SEMPLICITA’: La media aritmetica è facile da capire e da calcolare.

3. Poiché il calcolo della media aritmetica coinvolge ogni valore dell’insieme dei dati, essa è influenzata da ciascun valore. Pertanto, i valori estremi hanno un’influenza sulla media e, in qualche caso, ciò rappresenta un limite.

Esempio sui valori estremi Esempio sui valori estremi

Esempio di come i valori estremi possono influenzare la media.

Volumi espiratori forzati in un secondo in 13 adolescenti asmatici

litri 95 2 13

35 38

13 38 3 85 2 02 4 15 2 30 2 1

. ,

. . . ...

. .

i

xi

x n

litri 73 5 13

53 75 13

2 40 30 2

1 . ... . . ,

i

x n x

(2)

Sensibilit

Sensibilità à ai valori estremi della media ai valori estremi della media

La media è estremamente sensibile a valori insoliti.

Spesso l’errore potrebbe non essere così evidente, oppure l’osservazione insolita potrebbe addirittura non essere un errore.

Poiché il nostro obiettivo è quello di caratterizzare un intero gruppo di individui, potremmo preferire una misura di sintesi che non sia così sensibile ad ogni singola osservazione.

Misure di tendenza centrale: mediana Misure di tendenza centrale: mediana

Una misura di tendenza centrale che non è così sensibile al valore di ciascuna misurazione è la mediana, che può essere utilizzata come misura di sintesi per dati qualitativi ordinali, quantitativi discreti e quantitativi continui.

La mediana è definita come il cinquantesimo percentile di una serie di misurazioni; se una lista di osservazioni è classificata in ordine crescente, la metà dei valori sarà maggiore o uguale alla mediana, mentre l’altra metà sarà minore o uguale ad essa.

Misure di tendenza centrale: mediana Misure di tendenza centrale: mediana

E’ determinabile anche rispetto a caratteri QUALITATIVI, purché RIGOROSAMENTE ORDINABILI.

Quindi, la mediana di un insieme finito di osservazioni è quelvalore che divide l’insieme in due parti ugualitale che il numero delle osservazioni uguale o maggiore della mediana è uguale al numero delle osservazioni uguale o minore della mediana.

Se il numero delle osservazioni è dispari, la mediana sarà il valore centrale dopo che tutte le osservazioni sono state ordinate. Quando il numero delle osservazioni è pari, non vi è un solo valore mediano.

Misure di tendenza centrale: mediana Misure di tendenza centrale: mediana

Pertanto, se una serie di dati contiene un totale di n

osservazioni dove n è dispari, la mediana è il valore centrale o la misurazione corrispondente a [(n+1)/2];

se n è pari, la mediana è la media dei due valori centrali, l’osservazione corrispondente a (n/2)e a [(n/2)+1].

Esempio Esempio - -1 1

Mediana = (13+1)/2 = 7° osservazione = 2.82 litri

Pertanto, la mediana del volume espiratorio forzato in un secondo rimarrà 2.82 litri.

La mediana è definita robusta, cioè molto meno sensibile a valori insoliti rispetto alla media.

Alcune caratteristiche della Mediana Alcune caratteristiche della Mediana

Le caratteristiche più salienti della mediana sono le seguenti:

1. UNICITA’: Così come per la media, vi è una sola mediana per un insieme di dati.

2. SEMPLICITA’: La media aritmetica è facile da calcolare.

3. Non è così drasticamente influenzata dai valori estremi come la media.

(3)

Esempio Esempio - - 2 2

Supponiamo di avere un collettivo di 20 donne su cui osserviamo il carattere NUMERO DI FIGLI AVUTO.

Il protocollo elementare è: 0, 3, 1, 1, 2, 5, 1, 0, 4, 2, 0, 1, 3, 2, 1, 6, 1, 2, 2, 1.

 ORDINIAMO IL PROTOCOLLO: 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 5, 6.

n=20 pari  due posti centrali: n/2 = 10° posto (modalità 1) e (n/2)+1 = 11° posto (modalità 2) nella graduatoria ordinata: in tal caso le modalità che corrispondono ai 2 posti centrali non coincidono e per convenzione se ne fa la MEDIA ARITMETICA  in tal caso è possibile.

 Me = (1+2)/2 = 1.5 figli.

Misure di tendenza centrale: moda Misure di tendenza centrale: moda

Una terza misura di tendenza centrale è la moda, che può essere utilizzata come misura di sintesi per tutti i tipi di dati (qualitativi e quantitativi).

La moda di una serie di valori

La moda di una serie di valori èèll’’osservazione che osservazione che si verifica con maggiore frequenza.

si verifica con maggiore frequenza.

Se tutti i valori sono diversi tra loro, l’insieme di osservazioni non ha moda; così come un insieme di valori può avere più di una moda.

Misure di tendenza centrale: moda Misure di tendenza centrale: moda

La moda è determinabile per ogni tipo di carattere sia quantitativo che qualitativo.

In una distribuzione vi possono essere più modalità che presentano il massimo delle frequenze. In questo caso, la distribuzione avrà più di una moda (bimodale, trimodale).

Misure di tendenza centrale: moda Misure di tendenza centrale: moda

ESEMPIO di distribuzioneBIMODALE:

Le due mode sono x1e x3.

Se avessi tre mode distribuzione TRIMODALE.

Misure di tendenza centrale: moda Misure di tendenza centrale: moda

Distribuzione degli iscritti all’Università (Totale) nell’a.a. 1991-92 per gruppi di corsi di laurea.

Moda = Gruppo Letterario.

Misure di variabilit Misure di variabilità à

Una serie di dati non va solo analizzata in termini di media, mediana o moda ma, per conoscere quanto sia realmente valida una misura di tendenza centrale, dobbiamo avere un’idea della variabilità dei dati a disposizione.

In questo modo si valuta anche la rappresentatività del campione in studio

(4)

Misure di variabilit Misure di variabilità à

Le più importanti misure di variabilità sono:

CAMPO DI VARIAZIONE (o RANGE) DEVIANZA

VARIANZA

DEVIAZIONE STANDARD COEFFICIENTE DI VARIAZIONE

Misure di variabilit Misure di variabilità à: range : range

Ilrange (o campo di variazione)di un gruppo di misurazioni è definito come la differenza tra l’osservazione più grande e quella più piccola.

1) E’ uguale a 0 se non c’è variabilità e aumenta all’aumentare di questa

2) Non sfrutta tutte le informazioni disponibili

3) E’ fortemente dipendente dalla presenza di dati anomali (outliers)

4) E’ espresso nella stessa unità di misura della variabile analizzata

Misure di variabilit

Misure di variabilità à: devianza (DEV) : devianza (DEV)

La devianza rappresenta la sommatoria degli scarti di ogni singola osservazione rispetto al valore medio, il tutto al quadrato.

Misure di variabilit

Misure di variabilità à: devianza (DEV) : devianza (DEV)

La devianza

1) E’ uguale a 0 se non c’è variabilità e aumenta all’aumentare della variabilità

2) E’ espressa nel quadrato dell’unità di misura della variabile in studio (X)

3) E’ influenzata dal numero di osservazioni (n)

Misure di variabilit Misure di variabilità à: : varianza e deviazione standard (DS) varianza e deviazione standard (DS)

Dividendo la DEVIANZA per il numero di osservazioni (VARIANZA) e ponendola sotto radice quadrata ottengo laDEVIAZIONE STANDARD.

In questo modo evito: l’influenza della numerosità di osservazioni e un’unità di misura al quadrato

DS = DEV / n

Misure di variabilit

Misure di variabilità à: deviazione standard : deviazione standard

La DEVIAZIONE STANDARD:

1) Rappresenta il minimo degli scostamenti quadratici medi dal valore medio

2) E’ espressa nella stessa unità di misura del valore medio osservato (x)

3) Rispetto alla devianza sovrappesa gli scarti più grandi perché li eleva al quadrato

4) E’ la misura di variabilità utilizzata dai test statistici (ad esempio test t)

(5)

Misure di variabilit

Misure di variabilità à: coefficiente di variazione : coefficiente di variazione

Il coefficiente di variazione rappresenta la DEVIAZIONE STANDARD diviso il valore medio osservato ed esprime il grado di variabilità.

C.V. = DS/x

Misure di variabilit

Misure di variabilità à: coefficiente di variazione : coefficiente di variazione

Il coefficiente di variazione (C.V.):

1) e’ un numero puro (non ha unità di misura);

2) non dipende dal valore medio della X;

3) può essere utilizzato per confrontare la variabilità:

a) dello stesso carattere in due gruppi con media diversa;

b) dello stesso carattere espresso in diverse unit à di misura;

c) di due caratteri diversi per unità di misura e per livello medio.

Riferimenti

Documenti correlati

L’influenza sulla cella obiettivo è diretta se il valore delle celle variabili sono utilizzate come riferimento nella formula presente nella cella obiettivo; è indiretta se il

– Chi è formato all’uso delle tecnologie, e le pratica da tempo, tende ad avere una migliore prestazione nelle prove cognitive, ed ha una maggiore tendenza al gioco e alle

p Bper chiude un febbraio di grandi «lavori» e dopo l’acqui - sizione di Unipol Banca, del 49% del Banco di Sardegna e l’aumento della quota in Arca Srg presenta il piano indu-

E i primi importanti ricono- scimenti non si sono fatti attendere: primo posto ex aequo come campione italiano a 24 anni, quarto posto come finalista europeo, la

L'idea alla base di un quantile-p dove p ∈ [0; 1] e di cercare un numero che sia più grande p% dei dati osservati e più piccolo del restante (1-p%) dei dati. Dividono la popolazione

Non tiene però conto degli altri valori e spesso in un insieme di dati vi è più di un valore che corrisponde alla definizione di moda. •  La mediana non è

Presentazione dei concetti di base di popolazione e campione Sintesi e presentazione in tabelle dei dati categorici. Presentazione grafica dei

Presentazione dei concetti di base di popolazione e campione Sintesi e presentazione in tabelle dei dati categorici. Presentazione grafica dei