Statistica
A.A. 2011/12
Statistica Introduzione
Qualche informazione di carattere organizzativo
Docenti: Alessandra Bianchi e Paolo Dai Pra
Orario di ricevimento (Dai Pra): Marted`ı ore 15:00 e per
appuntamento (saranno possibili cambiamenti (vedi pag. web del corso))
email: daipra@math.unipd.it
Pagina web: www.math.unipd.it/ ∼daipra/didattica/bio12 Ufficio: Torre Archimede, V piano, corridoio CD
Testo: Sheldon M.Ross, Introduzione alla Statistica, Apogeo.
Modalit` a d’esame: Prova scritta.
Introduzione
Cos’` e la Statistica?
Nel linguaggio comune tale termine viene associato a liste di numeri, dati, tabelle, grafici....
In altre parole, ai metodi per organizzare, sintetizzare e presentare i dati provenienti da esperimenti, indagini....
Questi metodi costituiscono la Statistica Descrittiva.
Lo scopo di questo corso `e fornire un’introduzione ad una statistica pi` u moderna e attiva.
FARE STATISTICA
Statistica Introduzione
Consideriamo la seguente osservazione, quasi ovvia: la maggior parte dei dati sperimentali su cui si basano teorie scientifiche, terapie mediche, politiche economiche o ambientali...., sono soggetti ad incertezza ineliminabile. Le cause di tale incertezza sono le pi` u varie, e spesso di difficile identificazione. Alcune di queste cause sono:
�
imprecisione degli strumenti e dei metodi di misura;
�
impossibilit`a di ottenere misure per tutti gli individui di una popolazione numerosa, e pertanto la necessit`a di “scegliere”
un piccolo gruppo rappresentativo (campionamento);
�
il fatto che alcuni fenomeni naturali, come la trasmissione ereditaria dei caratteri o lo sviluppo di una malattia in un determinato individuo, sono intrinsecamente soggetti ad una componente casuale.
Lo scopo della Statistica `e la gestione ottimale dell’incertezza, cio`e
il ricavare da dati soggetti ad incertezza la maggiore informazione
possibile.
Lo scopo ultimo del corso `e di fornire le nozioni essenziali del procedimento statistico di maggior utilizzo nelle Scienze, in particolare nelle Scienze della Vita: la verifica delle ipotesi.
Per avere un’idea di cosa si tratti, usiamo l’analogia con i
procedimenti giudiziari. Gli ingredienti essenziali di un processo sono:
�
un’ipotesi investigativa, cio`e un crimine e un imputato;
�
i dati di un’indagine;
�
il verdetto.
Bench´e l’assoluta certezza viene difficilmente raggiunta anche al termine di accurate indagini, il compito della giuria `e di
“minimizzare” l’impatto di eventuali errori: l’imputato viene dichiarato colpevole se i dati forniti dalle indagini ne mostrano la colpevolezza oltre ogni ragionevole dubbio.
Statistica Introduzione
Una verifica di ipotesi ha una struttura analoga:
�
un’ipotesi statistica; ad esempio: i pesticidi (imputato) favoriscono l’insorgere della leucemia (il crimine);
�
i dati di una serie di esperimenti;
�
la conclusione, cio`e l’accoglimento o il rifiuto dell’ipotesi.
La formulazione precisa di un’ipotesi statistica, cos`ı come la
procedura di interpretazione dei dati che garantisce di “minimizzare
l’impatto di eventuali errori”, richiedono il linguaggio del Calcolo
della Probabilit`a, la teoria matematica che tratta l’incertezza.
Introduzione
Statistica in Biologia?
La disponibilit`a di un enorme numero di dati di natura biologica e biomedica ha reso indispensabile l’uso della statistica nelle Scienze Biologiche.
Le principali applicazioni sono:
�
in ambito medico: epidemiologia, test clinici su farmaci...
�
in Genetica: ed esempio studio delle relazioni tra genotipo e fenotipo, con applicazioni in medicina, agricoltura...
�
nelle Scienze Ambientali ed Ecologia: studio dei fattori che determinano cambiamenti nell’ambiente, ad esempio clima, inquinamento....
�
nello studio delle sequenze di geni nel DNA, in collaborazione con la Bioinformatica.
Statistica
Statistica descrittiva
Statistica descrittiva
Obiettivo: presentare i dati di una, ricerca, indagine... in modo sintetico attraverso grafici, tabelle e altre forme di sintesi.
I dati si possono riferire a una o pi` u quantit`a misurate (variabili). I dati relativi ad una variabile si presentano come una sequenza x
1, x
2, . . . , x
ndi valori della variabile (campione), ottenuti in n
“misurazioni”.
Le variabili vengono divise in due grandi categorie: le variabili
numeriche, che assumono cio`e valori numerici, e le variabili
categoriche (tutte le altre)
Statistica descrittiva per variabili categoriche
I valori possibili di una variabile categorica vengono chiamati categorie. I dati vengono rappresentati tramite tabelle e grafici.
Lo illustro con un esempio, tratto da un’indagine sullo stato
occupazionale dei laureati della Facolt`a di Scienze MM FF NN a 6 mesi dalla laurea.
!"##$%&'(#)%
!"#$%" %*+ ,-./,+ ./-,+0
&'%&"(!"#$%$ .1 ,-*.%* *.-%*0
)*%$&*+*$($(,)"-' %+ ,-,+/% +-/%0
"!)%$ %+ ,-,+/% +-/%0
)$)"!* *%. %-,,,, %,,-,,0
./0120345(56678295 ./0120345(/0859:;5( ./0120345(<0/=0392580
Frequenza assoluta = numero di occorrenze di un dato valore Frequenza relativa = frequenza assoluta
numero di osservazioni
Frequenza percentuale = Frequenza relativa × 100 %
Statistica
Statistica descrittiva
Statistica descrittiva per variabili categoriche
!"##$%
&'(#)%
*+, -*,
., .,
/01230 45340) /01232 673247872)2)
!6095 0/632
Statistica descrittiva
Statistica descrittiva per variabili categoriche
Pi` u variabili categoriche relative ad una medesima popolazione possono venire usate per studi di correlazione.
Ad esempio i laureati di cui sopra provenivano dai Corsi di Laurea in Matematica, Fisica e Biologia
!"##$%&'(#)%
!"!#$%
$#&"'# %* %+ ,% -.
()'(#*$#&"'" * + / ,0
!%'"(%+%"*"*,!#-) , 0 + %1
#$!'" % , 1 .
!"!#$% ,/ 12 02 //
./012/034/ 53634/ 73898:3/