• Non ci sono risultati.

(Mediana, quartili, decili, media, ecc.).

§ 1. — Oltre la grandezza tipica, o punto di densità mas-sima, e i punti laterali di densità, sono da considerare, per avere immagine di altri punti caratteristici di una seria-zione, la grandezza mediana, i quartili (quartile inferiore e quartile superiore) e i dieci decili in cui la seriazione può scomporsi. Anche questi valori sono, come i precedenti in fino a qui presi in esame, valori segnaletici del modo di distribuirsi del fenomeno.

§ 2. — In una successione di termini disposti in ordine crescente o decrescente ( e ciò, anche se parecchi di essi si seguono uno dopo l'altro ripetendosi) il valore di quel termine che bipartisce la successione è il valore mediano. Come si vede, la mediana è uno dei tanti valori « medi » che si trovano tra gli estremi della successione di cui sopra. Se il numero di termini, formanti la successione, è di-spari, il valore mediano sarà dato dal valore del termine centrale; se il numero di termini è pari, sarà dato dalla media aritmetica dei valori dei due termini centrali. Quel valore, d'altro canto, che separa il primo 25 per cento dei termini della successione di cui sopra, è il quartile inferiore; quello, per contro, che separa l'ultimo 25 per cento è il

quar-tile superiore.

Medesimamente, quel valore che, nella suddetta succes-sione, separa il primo 10 per cento dei termini, è il primo

de-cile, quello che separa il secondo 10 per cento dei termini, è

il secondo decile, e così di seguito.

Come si vede, mediana e quinto decile, sono sinonimi. La mediana, poi, corrisponde, anche, a un << secondo quar-tile », dato che il quarquar-tile inferiore sia un primo quarquar-tile, e il quartile superiore un terzo quartile.

Analogamente, in una seriazione, e cioè allorché le fre-quenze sono ordinate secondo una variabile quantitativa, o grandezza, la mediana è la grandezza al di sopra e al di sotto della quale si trova il medesimo numero di frequenze; il quartile inferiore è quella grandezza che separa il primo 25 per cento delle frequenze dell'intera seriazione (a comin-ciar da quelle che cadono sulle grandezze più piccole); il

quartile superiore separerà, per contro,"l'ultimo 25 per cento

delle frequenze.

Chiameremo il quartile inferiore con l'indicazione e il quartile superiore con l'indicazione Q La mediana po-trebbe essere indicata con Q ; ma per maggiore chiarezza la indicheremo con M„a. I quartili e la mediana sono punti

di riferimento, in una seriazione, che dànno immagine della

sua configurazione. Non di rado bastano a mostrare con sufficiente evidenza alcuni principali caratteri della seria-zione stessa e presentano quindi il vantaggio considerevole di concentrare l'immagine della seriazione in tre soli valori nu-merici.

I decili, infine, e cioè, il 10 decile, il 2° decile, il 3° decile, ecc., fino al 10 0, sono costituiti, in una seriazione, dalle grandezze che separano successivamente il primo 10 per cento delle frequenze, il secondo 10 per cento, e così via. Anche i decili, con i loro dieci valori susseguentisi, ci dànno concentrata immagine del modo con cui si distribui-scono le. frequenze della seriazione, e la descrivono efficace-mente per quanto sinteticaefficace-mente.

§ 3. — Per cercare o calcolare i suddetti valori, occor-rerà, prima di tutto, date N frequenze scaglionate in seria-zione. vedere, quale è il numero d'ordine della frequenza su cui cade il valore mediano; poi, cercare o calcolare tale valore mediano, ossia quale è la grandezza di quella fre-quenza di cui si è trovato il numero d'ordine.

frequenza su cui cadrà il valore mediano occuperà il posto,

N + 1

o numero d'ordine, ; la frequenza su cui cadrà il va-lore del quartile inferiore occuperà il posto ^ 14 • quella su cui cadrà il valore del quartile superiore occuperà il posto

/pj I j \ g

— — . Trovato, in tal modo, il numero d'ordine della

fre-4

quenza, occorrerà cercare, nella seriazione stessa, quale gran-dezza, esattamente, è presentata dalla frequenza di cui si è cercato il numero d'ordine. Se si tratta di seriazione costruita con grandezze discontinue, e non aggruppate in classi, la frequenza in quistione presenterà grandezza ben determinata, che si trova facilmente, e, per così dire, a colpo d'occhio. Ma se si tratta, come il più delle volte accade, di seriazioni costruite con grandezze continue, la frequenza che è guida al calcolo non presenterà grandezza imme-diatamente determinabile, ma si troverà entro una classe di grandezze. Sarà necessario calcolare, grazie ad interpo-lazione, basata su ipotesi semplicissima, a quale delle gran-dezze, esattamente, contenute nella classe, corrisponde la fre-quenza in quistione. E tanto nel caso della mediana quanto in quello dei quartili si procederà come segue. Chiamando / la grandezza che è limite inferiore della classe di grandezze ove cade la mediana (o il quartile); chiamando n il nu-mero di frequenze che è necessario aggiungere alle frequenze delle classi precedenti per raggiungere il numero d'ordine della frequenza in quistione; chiamando N i il numero totale delle frequenze che cadono nella classe ove cade la me-diana (o il quartile); chiamando d l'ampiezza della classi;,

ri

o modulo, si calcolerà I + — d, e si otterrà, a seconda che n Ni

si riferisca alla ricerca della mediana o del quartile, il va-lore mediano o il vava-lore del quartile.

§ 4. — Si voglia, ad esempio, rappresentare per mezzo della mediana e dei quartili la distribuzione di un gruppo omogeneo di individui secondo la loro forza muscolare. In occasione delle nostre ricerche antropometriche sui bambini delle scuole di Losanna, abbiamo misurato, per mezzo del

dinamometro, la forza alla mano destra, in gruppi di bam-bini, maschi e femmine, divisi in categorie di sesso, di età (da 7 a 14 anni età per età) e di condizione sociale, allievi delle scuole elementari e secondàrie della città di Losanna; fermandoci qui, soltanto, ai due gruppi di maschi di 13 anni da un lato e di femmine, della medesima età dall'altro, i risultati da noi ottenuti possono presentarsi nelle due distribuzioni della Tabella XXII. E facile vedere che, il quartile inferiore ( 0() per la forza delle bambine, cadrà nella categoria 15-18 chilogrammi, ma su quali chilogrammi esattamente ? Supponendo che nell'àmbito di ogni classe

(che è di tre chili) le frequenze si distribuiscano in modo

T A B E L L A X X I I .

Forza, misurata con il dinamometro, alla mano destra in 110 bambine e 77 bambini di 13 anni. (Bambini delle scuole della città di Losanna, misurati dall'Autore).

N. di bambini che hanno la terza qui a fianco

Forza (i n chilogrammi) Femmine Femmine Maschi d a 9 a m e n o di 1 2 3 d a 1 2 » 1 5 8 3 d a 1 5 » 1 8 2.4 1 6 d a 1 8 » 2 1 3 4 2 3 d a 2 1 » 2 4 1 9 1 7 ' d a 2 4

»

2 7 11 1 0 d a 2 7

»

3 0 7 4 d a 3 0 » 3 3 4 3 d a 3 3 » 3 6 1 T o t a l e dei b a m b i n i 1 1 0 7 7

uniforme, applicando la formula data poco sopra trove-remo Chilog. 17,1 per il primo quartile. La mediana cade nella classe 18-21 Chilog., e il quartile superiore (Q ) nella classe 21-24 Chilog. Applicando le rispettive formule trove-remo : Chilog. 19,8 per la mediana e Chilog. 23,3 per il

quar-tile superiore. Calcolando analogamente per la forza dei ma-schi, si avrà :

Mn a = Chilog. 20,6; 0 , = Chilog. 18,0; Q3 = Chilog. 23,9. Poiché già conosciamo il modo di calcolare la grandezza ti-pica o punto di densità massima di una seriazione, potremo aggiungere anche il calcolo di tale valore ai precedenti. Troveremo che, sì per le femmine che per i maschi, la forza tipica cade nella classe dei 18-21 Chilog., e prenderemo il va-lore centrale di tale classe, e cioè Chilog. 19,5, se ci conten-teremo di tale semplice modo di fissare la grandezza tipica; m a se volessimo, per giungere a più accurato risultato, tener presente il numero di frequenze che cade nella classe imme-diatamente precedente a quella in cui cade la moda, e quello della classe immediatamente susseguente, troveremmo ap-plicando la formula già data nel Capitolo 11, paragrafo 14, un punto di massima densità di Chilog. 19,3 per le femmine e di 19,5 per i maschi. Sicché, le due distribuzioni potrebbero venire già eloquentemente descritte con i soli quattro valori segnaletici or ora calcolati, nel modo che segue:

T A B E L L A X X I I I .

Alcuni valori segnaletici della distribuzione, per forza muscolare,

(in Chilog.) delle bambine e dei bambini (di 13 anni). Forza tipica Q, M„a. Q3 Bambine. Chilog. 19,3 17,1 19,8 23,3 Bambini. Chilog. 19,5 18,0 20,6 23,9 Tale conciso <c segnalamento » mostra in modo evidente che tutti i punti, presi qui in considerazione, esprimono la. frequenza di una maggior forza (e ne dànno misura) nei maschi in confronto con le femmine della medesima età (13 anni). Mostra, anche, la presenza di altre caratteristiche di cui dovremo parlare più lunge (1).

(1) L'esempio ora addotto è di grandezze continue. Ma vi sono casi di seriazioni costruite con grandezze non continue (numero di fiori con 5 petali, con 6, con 7; numero di abitazioni con 1 stanza, con 2, con 3; numero di odi con 5 veTsi, con 6 versi, ecc.) In tali casi, o si

§ 5. — In modo analogo si calcolano, il primo, il se-condo, ecc., decile. La decima misura, cioè, o chil. di forza, o grandezza, a cominciare dalla misura (in chilogrammi) più bassa, e facendo il numero totale delle osservazioni uguale a 100, dà il primo decile; la ventesima dà il secondo decile, ecc. Il che viene a dire che il decimo individuo (fatta la som-ma degli individui uguale a 100) della distribuzione, a comin-ciare da quello che ha la più piccola forza, dà con la forza che esso presenta, il valore del primo decile; e così di se-guito (1).

contenterà, il calcolatore, di indicare come valore mediano o come quartile, la grandezza discontinua su cui cade il numero d'ordine della frequenza, (anche se moltissime altre frequenze cadono su quella me-desima grandezza) e non opererà quindi il calcolo interpolatorio di cui sopra; o, se crederà opportuno eseguire tale ca.'colo, considererà ogni grandezza discontinua come il valore centrale li una classe immagi-naria : se le grandezze discontinue, p. es., formanti la scala delle gran-dezze nella seriazione saranno le seguenti 1, 2, 3, 4 ognuna di quelle grandezze sarà considerata come se fosse 0,5-1,5; 1.5-2,5; 2,5-3,5; 3,5-4,5; .. ecc. Se le grandezze saranno aggruppate in classi, come ad esempio: 1-5; 6-10; 11-15, e c c . — t a l i classi di grandezze saranno conside-rate come se fossero: 0,5-5,5; 5,5-10,5; 10,5-15,5 ecc. Modo arbitrario, ben si comprende, di considerare tali grandezze.

(1) Anche qui, dunque, la formula per trovare, in N osservazioni sca-glionate in seriazione, il numero d'ordine della frequenza su cui cade la grandezza da prendersi come 1 decile, come 20 decile, _ecc., sarà N - L - I / N - I - H S

_ _ per il primo decile, v i per il secondo decile, ecc. fi calcolo 10 10

dei decili è stato particolarmente adoperato, in questi ultimi tempi, da W. C . M I T C H E L L , Business cijeles, Univ. of California Studies. Voi. I l i ,

sept. 1913, p. 109, per lo studio dei prezzi (numeri-indici dei prezzi) e precisamente per mostrare la dispersione o la variabilità dei prezzi durante un lungo periodo di anni. Il calcolo della mediana, fatto per rappresentare con la mediana il valore medio di un fenomeno (anzi che con la media aritmetica) è stato proposto per dare idea della ric-chezza media di una popolazione, e del salario medio di un gruppo di popolazione operaia. E stato anche adoperato per calcolare un valore « medio » di una serie di numeri Indici di prezzi di numerosi prodotti in un anno, invece di calcolare la media aritmetica di essi: W. I. KING

The elements ot statistical method, New York. 191?. p. 182. In

«biome-tria » (o raccolta degli indici misuratori della durata della vita di una po polazione, da non confondersi, come taluni fanno, con la «biometrica» che è, in senso stretto, lo studio della variabilità e delle correlazioni nei vege--tali e negli animali) in « biometria », il valore mediano è adoperato per indicare la «vita probabile» di un gruppo di coetanei; per indicare 1' « età mediana dei morti » e anche 1' « età mediana dei vivi », espressioni,

§ 6. — Mediana, quartili e decili, possono anche corcarsi graficamente. Basta tradurre la distribuzione di frequenze, quale fino a ora è stata presentata, in una distribuzione di altra costruzione, sommando, cioè, le frequenze che ca-dono nella prima classe con quelle della seconda, e poi anche della terza, e via di seguito, in modo da avere, dalla pre-cedente distribuzione (quella delle bambine) la seguente: Bambine con forza inferiore a 12 Chilog. : 3; con forza inferio-re a 15: 11; inferioinferio-re a 18: 35; inferioinferio-re a 21: 69; infe-riore a 24: 88; infeinfe-riore a 27: 99; infeinfe-riore a 30: 106; inferiore a 33: 110. Una seriazione così fatta si chia-ma « ogiva », dalla forchia-ma che prende la sua traduzione grafica, o » seriazione cumulativa » (the ogive, o cumu-lative frequency, degli statistici inglesi). Poi, si

tra-durrà tale nuova distribuzione in un diagramma, portando le grandezze stilla linea delle ascisse, e le frequenze sulla linea delle ordinate. Si otterrà, allora, una spezzata che sarà tagliata, all'altezza del 25 % delle frequenze, del 50 %, del 75 %, da linee orizzontali; e le tre proiezioni del punto di incro-cio di tali orizzontali con la spezzata indicante le frequenze cadranno rispettivamente sui valori o grandezze del quar-tile inferiore, della mediana, e del quarquar-tile superiore (1).

Si vogliano, ad esempio, cercare con metodo grafico i

tutte, da non confondere, come spesso si fa, con la « vita media » (o spe-ranza di vita). Infatti, la vita probabile è il numero di anni che deve tra-scorrere perchè i componenti di una generazione siano ridotti alla metà; è dunque, la mediana della vita di una generazione, detta anche vita media-na. La età mediana dei morti, invece, è quella età al di sopra e al di sotto della quale si trova una cifra uguale di morti, In un anno; era, p. es., in Italia, nel 1872, di 6 anni; nel 1882 di 6 anni e mezzo, nel 1892 ili 15 anni; nel 1902 di 20 anni e mezzo; nel 1911 di 30 anni Circa. Analo-gamente, l ' e t à mediana dei vivi ossia dei censiti, è quell'età al di sopra e al di sotto della quale si trova una cifra uguale di vivi, in una popolazione classificata per età. La vita media, o speranza di vita, infine, è il numero di anni che spetterebbe a vivere a ciascun componente unà generazione, o un gruppo di coetanei in generale, se la somma degli anni che tutta la generazione ha da vivere si ripartisse ugualmente tra tutti 1 componenti la generazione. In quanto all'uso del quartili, si dirà largamente di esso più in là, come, del resto, dell'uso della mediana.

(1) I primi esempi di ricerca e di esposizione grafica della mediana e dei quartili per mezzo della «ogiva» si trovano in F . GALTON, irelght and weight of boys ecc., in « The Journal of the anthropological

PESO

(Ki/g) Q, fla Qs

Fig. 10. — Peso del corpo nei bambini di 10 anni.

Ricerca grafica del quartile inferiore e superiore (Qj e Q3) e della mediana (Q2).

due quartili e la mediana nella distribuzione seguente di 100 bimbi maschi (poveri) di 10 anni, per peso del corpo, da noi studiati a Losanna. Si comporrà dapprima la distri-buzione « cumulativa » che risulterà come segue :

T A B E L L A X X I V .

Peso del corpo in 100 bimbi di 10 anni (Distribuzione cumulativa).

Peso del corpo (Chilogrammi) N. di bambini (distribuzione cumulativa) m e n o di 2 2 ì » 2 4 1 2 » 2 6 3 0 » 2 8 6 2 » 3 0 8 3 » 3 2 9 4 » 3 4 9 8 » 3 6 1 0 0

Poi si costruirà la traduzione grafica di tale distribuzio-ne « cumulativa ». In tale traduziodistribuzio-ne grafica, le lidistribuzio-nee pun-teggiate, corrispondenti al 25 %, al 50 %, e al 75 %, dei sog-getti « cumulati » lungo l'ogiva, indicano che il primo quar-tile cade sui Chilog. 25,4; che la mediana cade sui Chilog. 27,2; che l'ultimo quartile cade sui Chilog. 29,2 (1).

(1) Per questo tema e per i confronti con i bimbi agiati, vedi la no-stra Antropologia delle classi povere, Milano, 1908. Qui Indicheremo che, considerato il peso del corpo nei bimbi maschi di 10 anni, ma agiati, ab-biamo trovato la seguente «ogiva». Con peso minore di 22 chilog., nessun soggetto; —24 chilog., id. ; —26 chilog., 14; —28 cliiiog., 43;—30 chilog., 72;— 32 chilog., 80;—34 chilog., 90; —36 chilog., 98; — 38 chilog., 100. Da cui, disegnando 1' « ogiva » si ottiene, pel quartile inferiore chilog. 26,8; per la mediana chilog. 28,5; per il quartile superiore chilog 30,8 SI noti come per tutti e tre siffatti valori, i quali dànno un « segnala-mento » della -distribuzione dei bimbi a seconda del peso del corpo, i bimbi agiati superino 1 bimbi poveri.

§7. — Come abbiamo avuto già occasione di far no-tare, chi guarda, di una massa, tali valori segnaletici, im-para, a poco a poco, a « guardare » i fenomeni in mo-do diverso da quello generalmente seguito. Solitamente, il modo di « guardare » le manifestazioni di un dato feno-meno, è assai schematico, o incompleto, quando pur non sia assolutamente. errato. Vi sono, in primo luogo, coloro che, rinunciando alla misura pur potendo misurare, se ne stanno paghi di impressioni e di giudizi, per la più parte dettati dal sentimento e da stime grossolane, nè sospettano l'errore che in tal guisa commettono. Vi sono altri, invece, che, colpiti dall'aspetto delle categorie meno dense di fre-quenze e però eccezionali (collocate all'estremità dell'asse delle ascisse) con cui le manifestazioni del fenomeno si presentano, non si peritano di attribuire alla massa intera quei caratteri eccezionali e sporadici che, per contro, sono propri alle categorie laterali. Torna, per costoro, alla me-moria il detto del Montesquieu : « Si vedono le cose in modo eccezionale quando lo spirito, per guardarle, si getta da un solo lato e abbandona gli altri » (1). Anche questo è un modo errato di « guardare », più frequente di quel che non si pensi. Vi sono infine coloro, — meno inesatti, certamente, ma si contentano anche essi di ben poco, — che nella sola media aritmetica, qualche volta fiancheg-giata dai valori estremi da cui risulta (massimo e mini-mo), cercano l'espressione sintetica, se bene assai sche-matica ,del fenomeno, senza pensare che la media, termine unico, occulta, come fu detto, la legge della serie (1).

Difficilmente guardano gli uomini, i fenomeni che si ripetono, in modo che sia diverso da quelli così elencati. Il nostro metodo vuole, invece, come abbiamo visto, che si cerchino ben altri valori segnaletici della massa: tra essi abbiamo indicato la grandezza tipica e i punti di den-sità laterali, i quartili, e la mediana, e anche i decili; e di altri ancora si dirà poi.

( 1 ) M O N T E S Q U I E U , De l'esprit des lois, préface.

( 2 ) A . M E S S E D A G L I A , Il calcolo dei valori rnedii, in « Archivio di

^ 8. — Ma è ovvio che anche la media aritmetica deve essere calcolata, insieme con altri valori medi ancora, e considerata come valore segnaletico.

La media aritmetica è data dalla somma dei termini divisa per il loro numero. Può essere ricavata: a) diretta-mente dai dati originari (termini) che hanno servito a co-struire la distribuzione di frequenze (1); b) o dalla distribu-zione stessa di frequenze, così com'è presentata dal quadro statistico su cui si opera. In quest'ultimo caso la media aritmetica è uguale al quoziente che si ottiene dividendo per N la somma dei prodotti di ogni gruppo di frequenze per la grandezza su cui cade tale gruppo. Si noti che quando ogni classe comprende parecchie grandezze, si sceglie, come grandezza per cui moltiplicare le frequenze di ogni gruppo la grandezza centrale d'ogni classe; risultato soddisfacente si avrà, tuttavia, soltanto se il modulo non sarà troppo ampio (2). È chiaro, infatti, che, considerando il valore cen-trale di una classe come comune a tutte le frequenze che cadono in quella classe, si commetterà, nel calcolo della media, un errore, ma il più delle volte potrà essere tale errore trascurabile. La media calcolata su una seriazione in cui le grandezze siano raccolte in classi, si può chiamare

media seriale.

§ 9. — I valori segnaletici in fino a ora indicati, (« mo-da », principale, e accessorie, mediana, quartili, e media aritmetica), sebbene non siano ancora che una parte di

(1) E cioè M = — — 1 — — , in cui M è la inedia aritme-N

tica; g, g', s"...sono le grandezze, ed N è il numero di esse, il che si può 1

anche scrivere M = 2(X), in cui 2(X) rappresenta la somma di tutte N

le grandezze.

2 (g • f)

(2) E cioè M = — T T — , in cui g rappresenta la grandezza, o ini-N

sura, di ogni classe (se il modulo comprende più grandezze, g è la gran-dezza centrale), / il numero di frequenze che cade su ogni grangran-dezza, N il numero totale delle frequenze, ossia delle osservazioni; il che si può

1

quelli che possono e debbono calcolarsi, già si fanno validi per agevolare i confronti tra le masse : per ridurre, cioè, ciascuna di esse a poche cifre soltanto (le segnaletiche) su cui fermare l'attenzione. E si veda.

Ottengono migliori punti, negli esami universitari, alla facoltà di scienze, i provenienti dall' istruzione classica o quelli che giungono dall'istruzione tecnica ? 11 problema può interessare la trattazione di quistioni d'ordine più gene-rale, e più volte dibattuti, come: predominio dell' istru-zione classica su quella tecnica nell'insegnamento secon-dario; migliore riuscita che farebbero gli ingegneri pro-venienti dall'istruzione classica in confronto con quelli che di tale istruzione furono privi, e così di seguito (1). Nel

Documenti correlati