• Non ci sono risultati.

3.2- Medie di posizione: VALORE MEDIANO-MODA

QUANTILE: si definisce quantile ogni valore particolare di una successione ordinata di valori che suddivide la serie in q+1 parti di uguale numerosità.

Se q=1 avremo 1+1 = 2 parti uguali. Il Quantile corrispondente prende il nome di VALORE MEDIANO.

Se q=3 avremo 3+1= 4 parti uguali. I quattro Quantili prendono il nome di Primo-Secondo-Terzo Quartile.

Il quantile 0,5, ossia la MEDIANA di X rappresenta quel valore che, rispetto all’ordinamento crescente delle osservazioni, risulta preceduto e seguito dalla stessa porzione di osservazioni (il 50%), a meno degli effetti della discretezza.

Quando i dati vengono presentati mediante una distribuzione di frequenze di un carattere quantitativo suddiviso in classi non e’ possibile individuare esattamente la mediana. Tuttavia, in questo caso, è possibile ottenere una sua approssimazione attraverso la seguente formula:

𝑀𝑒 ≅ 𝑥𝑖−1+ (𝑥𝑖− 𝑥𝑖−1)0,5 − 𝐹𝑖−1 𝐹𝑖 − 𝐹𝑖−1 dove:

xi-1 è l’estremo inferiore della classe mediana xi è l’estremo superiore della classe mediana

Fi-1 è la frequenza relativa cumulata fino alla classe precedente a quella mediana Fi è la frequenza relativa cumulata fino alla classe mediana.

Esercizio 1.

Calcolare la mediana per la seguente seriazione di dati

Statura (cm) num

Nel linguaggio corrente si intende per moda un comportamento, un vestito, un oggetto e non la frequenza delle persone che adotta quel comportamento, indossa il vestito, compra quell’oggetto.

Come tutti gli indici di posizione, la moda deve essere espressione del fenomeno oggetto di studio, quindi deve essere un valore scelto tra quelli manifestati dalla variabile nella popolazione: la moda è una modalità, non una frequenza ossia è quella modalità cui corrisponde la massima frequenza.

Esercizio 2.

Dopo aver svolto un ‘indagine riguardante la colazione degli allievi di una scuola media, il medico scolastico ha ottenuto i seguenti risultati: 120 allievi mangiano latte e biscotti, 25 solo un pezzo di focaccia , 20 mangiano una fetta di torta con succo di frutta, altri 15 bevono solo succo di frutta, 10 mangiano frutta e 10 non mangiano niente.

Dopo aver compilato una tabella di frequenza, determina, per ogni tipo di colazione, la frequenza relativa e individua la moda.

Svolgimento Esercizio n° 3

Per ciascuna successione di dati quantitativi, determina la moda, il campo di variazione e la mediana.

a) 12; 14; 14; 14; 15; 15; 18; 20; 20

b) 15; 10; 20; 18; 18; 15; 16 ; 22 Svolgimento

IX

a

LEZIONE

12.1.2022, 8.30-10.30, Tot. 18 ore

Cap. 3: SINTESI DELLA DISTRIBUZIONE DI UN CARATTERE – LE MEDIE

§3.2-1 Media e Mediana di una distribuzione marginale o condizionata

CAP. 3- SINTESI DELLA DISTRIBUZIONE DI UN CARATTERE – LE MEDIE

Esercizio 1

Si considerino le distribuzioni per le classi di età della popolazione residente (espressa in migliaia) in Piemonte nel 1979:

Calcolare l'età mediana nella regione Piemonte.

Svolgimento

§3.2-1 Media e Mediana di una distribuzione marginale o condizionata

Capita spesso di avere a che fare con una distribuzione di frequenza doppia, ossia una tabella in cui sono presenti le frequenze di due caratteri statistici.

Vediamo con esempi come trattare questi casi.

Si parla di distribuzione di frequenza congiunta quando si raccolgono più informazioni riguardo una stessa unità statistica e si è interessati al verificarsi contemporaneo di certe modalità.

Tratteremo il caso in cui ogni unità statistica può presentare solo due caratteri X e Y aventi rispettivamente le seguenti modalità:

x1,x2,…,xr y1, y2,…,yc

Indicando con nij la frequenza assoluta della coppia (xi,yj), possiamo riassumere tutte le

osservazione delle variabili X e Y in una tabella a doppia entrata detta tabella di contingenza del tipo seguente.

Leggiamo la tabella formata da r righe e c colonne (escluse la riga e la colonna dei totali):

La parte centrale della tabella, ossia le nij rappresentano le frequenze assolute per quanto riguarda le modalità xi e yj (ad esempio n21 indica la frequenza assoluta per le modalità x2 e y1.

n1⋅,n2⋅,…,nr⋅ sono le frequenze marginali assolute della variabile X, anche dette frequenze marginali assolute di riga; esse rappresentano rispettivamente le somme delle frequenze assolute della 1°, 2°,..., r-esima riga (ad esempio n1⋅=n11+n12+⋯+n1c). In generale per la i-esima riga possiamo scrivere

ni⋅=ni1+ni2+⋯+nic

Invece n⋅1,n⋅2,…,n⋅c sono le frequenze marginali assolute della variabile Y, anche dette frequenze marginali assolute di colonna; esse rappresentano rispettivamente le somme delle frequenze assolute della 1°, 2°,..., c-esima colonna (ad esempio n⋅2=n12+n22+⋯+nr2). In generale per la j-esima colonna possiamo scrivere

n⋅j=n1j+n2j+⋯+nrj.

n è la somma totale delle frequenze assolute nij, nonchè la somma delle frequenze marginali assolute di riga e di colonna, ossia:

n=n1⋅+n2⋅+⋯+nr⋅=n⋅1+n⋅2+⋯+n⋅c

La j-esima colonna della tabella rappresenta la distribuzione condizionata X|Y=yj (si legge “X dato Y=yj”). Ad esempio, la 3° colonna è la distribuzione condizionata della X dato Y=y3.

La i-esima riga della tabella rappresenta la distribuzione condizionata Y|X=xi (si legge “Y dato X=xi”). Ad esempio, nella seconda riga troviamo la distribuzione condizionata della Y dato X=x2 Esempio

Esempio di distribuzione doppia di frequenza con caratteri qualitativi

La tabella seguente raccoglie alcune informazioni riguardo la strage del Titanic; in particolare sono presenti le frequenze assolute per la variabile X=esito

(con modalità x1=salvato e x2=non salvato) e per la variabile Y=Classe (con modalità y1=I classe, y2=II classe e y3=III classe).

Osserviamo innanzitutto che entrambe le variabili X e Y sono qualitative; inoltre, la tabella ci dice, ad esempio, che 203 passeggeri che viaggiavano in I classe si sono salvati. Analogamente,

possiamo dire che 528 paasseggeri che viaggiavano in III classe non si sono salvati. Inoltre,

guardando i bordi della tabella, in particolare quello destro, si evince che il totale dei sopravvissuti sono stati 499 a prescindere dalla classe in cui viaggiavano; mentre, guardando il bordo inferiore della tabella, si può dedurre che il numero totale dei passeggeri che viaggiavano in II classe erano 285 a prescindere dall'esito del disastro.

Osserviamo infine che:

I valori presenti nella parte interna della tabella (n11=203, n12=118, n13=178, n21=122, n22=167 e n23=528) sono le frequenze assolute

I valori presenti nel bordo destro sono le frequenze marginali della variabile Esito e si ha che:

n1⋅=499=203+118+178, n2⋅=817=122+167+528

I valori presenti nel bordo inferiore sono le frequenze marginali della variabile Classe e si ha che:

n⋅1=325=203+122, n⋅2=285=118+167, n⋅3=706=178+528

Il numero posto nell'angolo in basso a destra è il totale delle frequenze marginali di riga e di colonna

n=1316=499+817==325+285+706

Se consideriamo una sola riga otteniamo la distribuzione della variabile Classe condizionata ad una modalità della variabile Esito. Ad esempio i valori della 1° riga esprimono la distribuzione della

variabile Classe condizionata alla modalità "Salvato" della variabile Esito

Se consideriamo una sola colonna otteniamo la distribuzione della variabile Esito condizionata ad una modalità della variabile Classe. Ad esempio i valori della 2° colonna

esprimono la distribuzione della variabile Esito condizionata alla modalità "II classe" della variabile Classe

Di seguito vediamo come calcolare tramite un esempio la media condizionata ad un gruppo di dati di una distribuzione doppia di dati.

Esercizio 2

Il responsabile di un centro medico di un ente pubblico è interessato a studiare le abitudini dei dipendenti rispetto al fumo e all'alcool. Dalla somministrazione di un questionario ai suoi dipendenti ottiene le seguenti informazioni:

Calcolare la media del numero di sigarette fumate dagli astemi e dai bevitori.

Svolgimento

Esercizio 3.

In riferimento ai dati presenti nell’esercizio 2, calcolare la mediana del numero di sigarette fumate dagli astemi e dai bevitori.

Svolgimento

X^ LEZIONE 14.1.22 14.1.2022, 8.30-11.30, Tot. 21 ore

ARGOMENTI SALIENTI DELLA LEZIONE:

Cap. 3: SINTESI DELLA DISTRIBUZIONE DI UN CARATTERE – LE MEDIE

Documenti correlati