prq)sp tvuw
Qualcuno sapr`a gi`a, o si sar`a accorto utilizzando la calcolatrice, che si incon-tra un’alincon-tra definizione di varianza (e quindi di deviazione standard), ottenuta dividendo la somma dei quadrati degli scarti per anzich´e per . Ovvero le formule della varianza sono state riscalate per un fattore ÀÛ (e quel-le della deviazione standard per x < ). Lo stesso fattore correttivo viene applicato ovunque ci sono formule con medie di potenze di scarti (mo-mento 3Z e 4Z nel calcolo della skewness e della curtosi) o loro combinazioni (covarianza).
Sulle calcolatrici le deviazioni standard ottenute con ¬ sono chiamate
.
La ragione di questa correzione `e legata ad una interferenza fra statistica descrittiva e statistica inferenziale (una scuola di pensiero di questa, ad essere pi`u precisi). `E chiaro che se vogliamo mantenere una varianza che conservi l’analogia con il momento di inerzia si pu`o solo prendere . Se invece da un piccolo campione si vuole inferire la deviazione standard di una grande popolazione, allora si tratta di un problema ben diverso, che andr`a affrontato con la dovuta cautela.
Quindi la deviazione , indicata pi`u semplicemente con , `e adeguata all’uso che si fa per ora di questa quantit`a.
5.14 Nota sulle cifre significative da utilizzare nei
pro-blemi di statistica descrittiva
Parlando del quaderno di laboratorio `e stato introdotto il problema delle ci-fre significative e sono state suggerite delle raccomandazioni, da usare con una certa flessibilit`a. Il problema si ripropone per il calcolo delle grandezze statistiche.
`
E importante capire come in un ambito di pura statistica descrittiva il pro-blema non ha molto senso in quanto i riassunti statistici servirebbero soltanto a descrivere quantitativamente la distribuzione statistica osservata. Ma, come `e gi`a stato fatto notare precedentemente e nel paragrafo 5.4, `e difficile svincolare la statistica puramente descrittiva da quella inferenziale. In particolare, ogni volta che si presenta un risultato di una misura di una grandezza fisica si sta compiendo un’operazione di statistica inferenziale e allora ha senso parlare di incertezza del risultato e di cifre significative.
Purtroppo `e impossibile astenersi da fare qualsiasi conto prima di aver chiaro come presentare il risultato, cosa che si sapr`a fare correttamente e a ragione soltanto quando saranno chiari diversi concetti di probabilit`a e di sta-tistica inferenziale. Converr`a quindi procedere per gradi tenendo conto che di quanto segue.
8
Se i conti servono come semplice esercizio sui metodi statistici introdotti `e sufficiente calcolare le grandezze di interesse a 2-3 cifre significative, in modo tale da controllare la bont`a delle procedure a qualche parte su cento o su mille.
8
Gli argomenti sulle cifre “dopo la virgola” sono in genere fallaci.
8
Nel caso che i risultati dei conti svolti a questo stadio iniziale possano essere riutilizzati per successive elaborazioni che conducano ad un risul-tato finale con stima quantitativa dell’incertezza converr`a abbondare con le cifre ed effettuare gli arrotondamenti alla fine.
8
Il dilemma fra la pesantezza delle troppe cifre inutili e il rischio di dover rifare tutti i conti `e momentaneo: alla fine del corso si sapr`a perfetta-mente come comportarsi; quindi eventuali “disavventure” iniziali vanno considerate fisiologiche e pertanto formative.
Per quanto concerne invece i conti `e importante utilizzare tutte le cifre della calcolatrice (10, generalmente) e arrotondare solo alla fine. Altrimenti possono sorgere problemi numerici che falsano drammaticamente i risultati. Anche se questo pu`o sembrare in contraddizione con quanto si va ripetendo sulle cifre significative, si rifletta sul fatto che la varianza (e anche covarianza, skewness e curtosi) sono calcolate in pratica da (somme e) differenze di numeri che a volte possono essere molto simili fra di loro. Quindi le ultime cifre (quelle pi`u a destra) giocano un ruolo decisivo ai fini del risultato.
Come esempio convincente prendiamo la distribuzione statistica costituita dai seguenti valori (fra parentesi la loro frequenza): 100.21 (3); 100.22 (8); 100.23 (10); 100.24 (7); 100.25 (2). I valori della media aritmetica e delle media dei quadrati sono (con tutte le cifre della calcolatrice):
2 ' 0445766] A?? 6 2 Y ' 044 =? 57] ; ^:©5
da cui ne segue che la varianza `e calcolata come
N6 ' 044 =? 57] ; &<044 =? 57] ; ^: ' 4544404Ú (5.54)
ovvero il risultato `e deciso dalla 99 e 109 cifra!
Il modo per ovviare a questo problema consiste nell’utilizzare le propriet`a di trasformazione di media e varianza e considerare nei conti solo la parte eccedente 100. In alcuni casi, quando la dispersione `e dell’ordine di una parte su 10000 o meno questo `e l’unico modo di operare (a meno di non disporre di computer a “doppia precisione”) in quanto anche le 10 cifre delle calcolatrici diventano insufficienti.
5.15 Problemi 85
5.15 Problemi
1. Dimostrare che la media degli scarti `e nulla. 2. Valutare moda, mediana e media e deviazione
stan-dard dei seguenti dati statistici: 6, 7, 10, 1, 8, 12, 7, 5, 7, 9, 6, 8.
3. Valutare moda, mediana e media e deviazione stan-dard dei seguenti dati statistici: 0, 6, 7, 10, 1, 8, 0, 12, 7, 5, 7, 9, 6, 8.
4. Valutare moda, mediana e media e deviazione stan-dard dei seguenti dati statistici: 3, 4, 0, 6, 7, 10, 1, 8, 0, 12, 7, 5, 7, 9, 6, 8.
5. Valutare moda, mediana e media e deviazione stan-dard dei seguenti dati statistici: 6, 3, 4, 0, 6, 7, 10, 1, 8, 0, 12, 7, 5, 7, 9, 6, 8.
6. Calcolare moda, mediana, media, deviazione stan-dard e coefficiente di variazione delle distribuzio-ni di conteggi per 6, 12 e 30 della tabella 4.1, riportando anche i valori diyÿ e diyÿ¸ . 7. Trovare moda, mediana, media, deviazione
stan-dard e coefficiente di variazione della distribu-zione di conteggi per 100 secondi della tabella 4.2.
8. Trovare moda, mediana, media, deviazione stan-dard e coefficiente di variazione della distribu-zione di conteggi per 300 secondi della tabella 4.2.
9. Calcolare media e deviazione standard dei seguen-ti valori: 1000000.2, 1000000.3, 1000000.1, 1000000.2, 1000000.4
10. Calcolare media e deviazione standard degli scar-ti fra i valori sscar-timascar-ti e quelli letscar-ti al nonio dello studente L.T. della tabella 2.2. Se quantifichiamo l’errore tipico con la deviazione standard degli scarti e in una misura successiva effettuata nelle stesse condizioni egli affermer`a di leggere 44.76 cm quanto si creder`a a tale valore?
11. Da 100 valori si ottieneÿ C ¿ P
ez CDP_¿ïL
. Al-tri 50 valori danno{|A}~
moh }}Rÿ C ¿åÝI ez COP¿L . Quanto valgono media e deviazione standard rag-gruppando i 150 valori?