Trattamento e Analisi statistica dei dati sperimentali
Modulo II:
Sintesi dei dati sperimentali L1. Introduzione e definizioniProf. Carlo Meneghini
dip. di Scienze Università Roma Tre e-mail: carlo.meneghini@uniroma3.it
La statistica
La statistica è:
la scienza che studia i fenomeni collettivi (suscettibili di misurazione e di descrizione quantitativa) utilizzando
metodi matematici fondati su tecniche di campionamento e calcolo delle probabilità, al fine di ipotizzare modelli
esplicativi e formulare previsioni
da: http://www.treccani.it/vocabolario/statistica/
la disciplina che permette di studiare in modo quantitativo un fenomeno in condizioni di incertezza o di conoscenza
Il metodo sperimentale
Fenomeno
Osservazione e misura
Ipotesi / Modello
Verifica
Legge / Teoria
Il ruolo della Statistica
Sintesi dei dati:
statistica descrittiva
Fenomeno, Popolazione
Osservazione e misura
Ipotesi / Modello
Verifica
Legge / Teoria
a b c a b c a b c a
120 128 293 288 45 248 62 62 347 96
303 295 282 181 198 56 260 210 220 124
50 342 125 275 73 328 90 334 273 300
67 191 3 171 268 185 166 95 335 109
68 139 353 135 270 74 160 302 33 309
63 133 224 312 186 255 145 80 165 77
249 306 129 43 114 240 245 317 15 26
42 318 323 165 18 216 33 44 81 47
206 37 254 229 320 52 268 275 159 80
82 158 80 88 210 196 64 173 179 313
335 75 314 249 236 102 306 273 84 0
320 280 7 148 121 46 54 239 149 354
43 203 295 323 127 187 318 218 14 65
216 57 119 330 15 148 205 138 98 267
359 290 109 150 54 258 259 68 274 133
308 172 169 247 320 100 315 321 333 221
284 251 98 27 176 88 360 79 133 150
153 119 336 238 74 47 173 186 229 84
351 340 286 109 214 193 127 316 330 227
334 218 84 31 352 339 218 221 25 154
292 151 26 155 354 102 200 76 2 77
175 115 132 94 298 292 144 108 170 298
165 181 209 51 226 138 253 204 265 228
107 348 25 23 358 72 242 237 4 82
272 148 265 303 205 36 176 273 127 20
113 143 254 15 106 133 219 143 349 170
328 77 74 274 196 121 118 81 109 253
258 301 50 273 33 269 242 231 148 185
322 227 267 360 198 208 208 213 238 143
254 206 278 314 243 139 335 189 359 355
239 49 165 341 360 116 152 185 342 226
304 288 40 82 102 104 355 49 175 153
314 359 191 204 91 270 130 328 116 360
173 181 283 88 152 217 150 232 204 312
91 215 81 259 356 243 259 206 173 179
236 271 10 229 353 58 279 205 105 165
237 250 169 358 99 96 8 221 13 242
200 228 211 101 165 244 250 255 10 25
327 204 18 293 196 32 240 219 32 332
N 390
Min 23
Max 356
media 177.559 mediana 175
Sintesi
Il ruolo della Statistica
Modellizzazione e inferenza:
Fenomeno, Popolazione
Osservazione e misura
Ipotesi / Modello
Verifica
Legge / Teoria
x ± σ
x=
µ
Il ruolo della Statistica
Verifica e Test
Fenomeno, Popolazione
Osservazione e misura
Ipotesi / Modello
Verifica
Legge / Teoria
Studenti
Eta
M/F
Titolo di studio
Residenza
Fenomeni, popolazioni e caratteri
Insetti X
Ali
natalità
massa
Lunghezza
colore
Rame
Ali
Conducibilità
Capacità termica
Densità
Elasticità
Resistenza elettrica
Temperatura
Tensione
Corrente
Materiale
Effetto Joule
Popolazione
Campione
Popolazioni e campioni
Il campione si riferisce al sottoinsieme degli elementi
effettivamente osservati La popolazione si riferisce
all'insieme di tutti gli elementi oggetti dello studio (le persone,
le piante, i possibili risultati di una misura, etc...)
Oggetti: Popolazione e campioni
La popolazione si riferisce all'insieme di tutti gli elementi oggetti dello studio (le persone, le piante, i possibili risultati di una misura, etc...)
Gli studenti del
corso di laurea I cittadini Italiani
Misure metereologiche
Una popolazione può essere costituita da un insieme finito (più o meno grande) o infinito di elementi
Campioni e Dati
Le osservazioni sperimentali possono produrre tabelle di
dati, anche di grandi
dimensioni, che contengono tutta l’informazione che
abbiamo acquisito.
a b c a b c a b c a
120 128 293 288 45 248 62 62 347 96
303 295 282 181 198 56 260 210 220 124
50 342 125 275 73 328 90 334 273 300
67 191 3 171 268 185 166 95 335 109
68 139 353 135 270 74 160 302 33 309
63 133 224 312 186 255 145 80 165 77
249 306 129 43 114 240 245 317 15 26
42 318 323 165 18 216 33 44 81 47
206 37 254 229 320 52 268 275 159 80
82 158 80 88 210 196 64 173 179 313
335 75 314 249 236 102 306 273 84 0
320 280 7 148 121 46 54 239 149 354
43 203 295 323 127 187 318 218 14 65
216 57 119 330 15 148 205 138 98 267
359 290 109 150 54 258 259 68 274 133
308 172 169 247 320 100 315 321 333 221
284 251 98 27 176 88 360 79 133 150
153 119 336 238 74 47 173 186 229 84
351 340 286 109 214 193 127 316 330 227
334 218 84 31 352 339 218 221 25 154
292 151 26 155 354 102 200 76 2 77
175 115 132 94 298 292 144 108 170 298
165 181 209 51 226 138 253 204 265 228
107 348 25 23 358 72 242 237 4 82
272 148 265 303 205 36 176 273 127 20
113 143 254 15 106 133 219 143 349 170
328 77 74 274 196 121 118 81 109 253
258 301 50 273 33 269 242 231 148 185
322 227 267 360 198 208 208 213 238 143
254 206 278 314 243 139 335 189 359 355
239 49 165 341 360 116 152 185 342 226
304 288 40 82 102 104 355 49 175 153
314 359 191 204 91 270 130 328 116 360
173 181 283 88 152 217 150 232 204 312
91 215 81 259 356 243 259 206 173 179
236 271 10 229 353 58 279 205 105 165
237 250 169 358 99 96 8 221 13 242
200 228 211 101 165 244 250 255 10 25
327 204 18 293 196 32 240 219 32 332
Campioni e Dati
Ma il dettaglio nasconde le informazioni di carattere più
generale che sono invece essenziali per:
• comparare risultati
• confrontare dati e modelli
• Ricavare un andamento
• Riconoscere una correlazione
• Fare previsioni
• etc...
a b c a b c a b c a
120 128 293 288 45 248 62 62 347 96
303 295 282 181 198 56 260 210 220 124
50 342 125 275 73 328 90 334 273 300
67 191 3 171 268 185 166 95 335 109
68 139 353 135 270 74 160 302 33 309
63 133 224 312 186 255 145 80 165 77
249 306 129 43 114 240 245 317 15 26
42 318 323 165 18 216 33 44 81 47
206 37 254 229 320 52 268 275 159 80
82 158 80 88 210 196 64 173 179 313
335 75 314 249 236 102 306 273 84 0
320 280 7 148 121 46 54 239 149 354
43 203 295 323 127 187 318 218 14 65
216 57 119 330 15 148 205 138 98 267
359 290 109 150 54 258 259 68 274 133
308 172 169 247 320 100 315 321 333 221
284 251 98 27 176 88 360 79 133 150
153 119 336 238 74 47 173 186 229 84
351 340 286 109 214 193 127 316 330 227
334 218 84 31 352 339 218 221 25 154
292 151 26 155 354 102 200 76 2 77
175 115 132 94 298 292 144 108 170 298
165 181 209 51 226 138 253 204 265 228
107 348 25 23 358 72 242 237 4 82
272 148 265 303 205 36 176 273 127 20
113 143 254 15 106 133 219 143 349 170
328 77 74 274 196 121 118 81 109 253
258 301 50 273 33 269 242 231 148 185
322 227 267 360 198 208 208 213 238 143
254 206 278 314 243 139 335 189 359 355
239 49 165 341 360 116 152 185 342 226
304 288 40 82 102 104 355 49 175 153
314 359 191 204 91 270 130 328 116 360
173 181 283 88 152 217 150 232 204 312
91 215 81 259 356 243 259 206 173 179
236 271 10 229 353 58 279 205 105 165
237 250 169 358 99 96 8 221 13 242
200 228 211 101 165 244 250 255 10 25
327 204 18 293 196 32 240 219 32 332
a b c a b c a b c a
297 244 234 9 280 339 185 175 32 174
333 46 312 64 2 106 309 34 172 168
70 152 311 243 65 348 278 280 154 331
168 209 92 117 92 42 129 184 295 317
271 94 356 89 220 24 356 206 64 182
232 205 140 336 289 324 36 29 72 141
54 336 96 142 33 344 346 16 286 58
242 222 48 177 220 233 170 333 156 312
154 136 316 234 86 243 190 359 9 338
245 200 214 171 198 111 57 137 83 205
302 51 337 351 145 336 130 67 307 241
330 340 108 206 196 204 315 30 80 117
51 251 264 238 296 30 25 129 199 140
6 92 63 170 286 170 117 316 65 210
183 351 310 338 61 124 222 120 158 228
304 327 152 201 301 17 356 152 247 216
289 52 168 124 340 83 150 222 316 306
190 322 247 208 203 303 339 65 269 230
139 12 243 116 175 209 17 186 332 305
295 13 102 32 319 12 357 129 197 176
55 327 246 158 128 161 195 272 225 222
63 135 233 208 80 192 113 31 233 326
152 38 268 189 46 32 232 133 341 23
142 129 172 66 222 214 329 316 107 138
162 54 225 336 81 283 74 251 126 212
248 331 270 110 94 125 244 135 200 137
146 339 151 306 231 353 64 174 161 293
235 188 11 108 223 353 234 94 154 246
285 294 278 92 287 229 177 14 101 65
14 225 288 63 295 334 321 39 238 126
359 135 207 297 154 227 243 130 339 121
219 111 182 7 280 173 81 185 208 320
26 313 251 81 153 151 248 118 293 20
237 268 286 294 16 262 56 85 171 115
292 206 13 235 94 248 5 1 181 140
334 154 179 285 162 181 78 133 29 353
127 58 133 72 64 177 323 306 104 334
Quali sono le differenze tra i dati delle due
tabelle?
Statistica descrittiva
La statistica descrittiva fornisce gli strumenti per sintetizzare e mettere in evidenza le informazioni rilevanti in un insieme di dati
per consentire una consultazione agevole e un confronto veloce, qualitativo e/o quantitativo
N 390
Min 23
Max 356
media 177.559 mediana 175
Sintesi
N 390
Min -110
Max 339
media 131.1 mediana 127
Sintesi
Statistica descrittiva
La statistica descrittiva:
1. presentazione dei dati ottenuti da un Campione (o dall'intera
popolazione per un censimento) 2. sintesi delle informazioni
rilevanti in un set di dati
Campione
Popolazione
Inferenza Statistica
La inferenza statistica:
estende: i risultati ottenuti da un campione all'intera
popolazione
Valuta: il rischio di errore (probabilità di sbagliare una
previsione)
Campione
Inferenza Statistica
La inferenza statistica:
• Stabilisce i criteri per estendere alla Popolazione i risultati ottenuti dall'analisi di un Campione
utilizzando i metodi del calcolo delle probabilità.
• Permette di trarre indicazioni su fenomeni non osservati direttamente (es. previsioni) e valuta in modo quantitativo il rischio di errore su tali
indicazioni in termini di probabilità di errore.
Tipo di dati
Nominali
Non hanno un ordinamento intrinseco
• Colore degli occhi
• Luogo di nascita
Ordinali
Hanno un ordinamento intrinseco e possono essere espressi con valori numerici
Discreti
Assumono solo valori discreti
• numero di esami sostenuti
• Età
Continui
Assumono valori reali
• Altezza,
• Temperatura
lunghezza dei capelli
In Statistica un carattere è associato ad una
Variabile
che indicheremo con lettere maiuscole: X
indicheremo i valori che una variabile può assumere e/o i risultati di osservazioni (misura)
di una variabile con la corrispondente minuscola: xi
xi : i-esimo valore di X
X={x1, x2, ... xN} :
Insieme dei valori della variabile X
Variabili