I dati e
le previsioni
ovvero
la Matematica
dell’incertezza
J L.BORGES: La Bibioteca di Babele
“Quando si proclamò che la biblioteca
comprendeva tutti i libri, la prima impressione fu di straordinaria felicità. Tutti gli uomini si
sentirono padroni di un tesoro intatto e segreto.
Non v’era problema personale o mondiale la cui eloquente soluzione non esistesse: in qualche scaffale.”
“Quei ricercatori dimenticavano che la possibilità che un uomo trovi il suo, o qualche perfida variante del suo, è sostanzialmente zero… alla speranza
smodata, com’è naturale, successe un’eccessiva depressione. La certezza che un qualche
scaffale…..celava libri preziosi e che questi libri preziosi erano inaccessibili, parve quasi
intollerabile”
L’abbondanza di informazioni può rovesciarsi nel suo contrario: non basta avere accesso teorico ad una
informazione, occorre anche che tale informazione sia effettivamente fruibile.
Statistica
Rende utilizzabili grandi quantità di informazioni, teoricamente disponibili, ma di fatto difficilmente gestibili, relative agli oggetti della sua indagine
Raccoglie e restituisce in forma organizzata grandi quantità di informazioni
la statistica ha esigenze di tipo:
Descrittivo:corrisponde al bisogno di ogni comunità di raccogliere dati sulle sue caratteristiche e le sue
attività
Predittivo: fornendo una fotografia del
passato e del presente, aiuta a prevedere i
comportamenti futuri e a compiere scelte in
mancanza di certezze assolute.
Incertezza: si azzardano calcoli e proiezioni a partire da dati a volte essi
stessi non esenti da dubbio e comunque incompleti
Il 30% degli italiani preferisce la pastasciutta, il 20% la carne;
il 15% il pesce;
il 10% la frutta;
il 25% il dolce
scetticismo
credulità acritica
Come si svolge il lavoro statistico?
Di quali fasi si compone?
Con quali problemi si scontra?
Lavoro statistico
• Definizione dei caratteri e della popolazione oggetto dell’indagine;
• scelta degli strumenti di rilevazione;
• selezione del campione rappresentativo
• raccolta dati;
• loro elaborazione e rappresentazione.
In ogni fase occorre fare delle scelte
Conseguenze rispetto ai risultati Es. Interviste:
•formulazione delle domande
•modalità di classificazione di risposte anomale
•scelta del campione rappresentativo.
Media aritmetica
• La media aritmetica di n numeri si calcola
sommando gli n numeri e dividendo il risultato per n;
• è un valore di sintesi che riassume un insieme di dati;
• ha un preciso ambito di significatività;
• è una media ponderata cioè i numeri dell’insieme da sintetizzare pesano in misura frequenza con cui ricorrono. proporzionale alla
Altri valori di sintesi
• Moda o valore normale
• è il numero che è presente con maggior frequenza nell’insieme
• Mediana
• corrisponde al valore centrale della sequenza
ottenuta disponendo in ordine crescente i numeri dell’insieme
Ogni valore di sintesi cancella il modo con cui viene a determinarsi
Uno stesso valore può corrispondere a dati articolati in modo diverso.
È importante misurare il grado di rappresentatività di un valore di sintesi prescelto.
Distribuzione normale:
•si trova in tutti i fenomeni casuali Correlazione (positiva o negativa)
•due variabili sono distribuite in modo che al crescere di una cresce anche l’altra
•non conduce necessariamente ad una relazione di causa effetto ( es. Statura- distanza da casa)
Interpolazione
si rilevano dati che misurano una relazione tra grandezze:
Concetti importanti
Interpolazione: ricerca della funzione analitica che approssima i dati nel modo migliore
•Metodo dei minimi quadrati: metodo che rende minima la distanza dei punti della linea che
rappresenta il fenomeno
Retta interpolante
Trend= coefficiente angolare dalla retta
La
funzione interpolatrice
potrebbe non essere lineare•ma essere di 2° grado, un’iperbole, una curva esponenziale
•è il fisico, lo statista, l’economista che seleziona la formula che sembra meglio descrivere il fenomeno.
Probabilità?
•L’incertezza è condizione normale quando occorre prendere decisioni
•siamo guidati quasi sempre da valutazioni di tipo probabilistico
•è un tentativo di matematizzare i processi
inconsapevoli o intuitivi con cui attribuiamo una determinata probabilità ad un evento
•nasce su sollecitazione di giocatori d’azzardo nel 1600
•Probabilità che lanciando un dado venga il numero 2
•…estraendo una carta da un mazzo di 40 carte questa sia un re
•se abbiamo lanciato 10 volte una moneta ottenendo testa, all’undicesimo lancio è più conveniente puntare su croce?
•E’ più facile indovinare l’ordine di arrivo in una gara a cui partecipano 4 atleti o indovinare la seconda lettera della trecentoquarantesima parola del terzo capitolo di un libro di lettura?
Definizione classica
•eventi equiprobabili ( lancio di due monete)
TT TC CT CC
•Probabilità che domani piova
•Probabilità che il primo
• dell’anno a Torino nevichi
Si basa su una stima A POSTERIORI
DIFETTO: la valutazione della probabilità dipende dal numero di prove che si effettuano
Legge dei grandi numeri
Da un baule, contenente 5 paia di scarpe alla rinfusa, si estraggono ,al buio, 3 scarpe.
Qual è la probabilità di trovare un paio di scarpe ben accoppiate ?
1/9 8/9
2/8 6/8