comunicazione e delle relazioni
internazionali - a.a. 2013-2014
I file sono, generalmente, in pdf. Per leggerli, scarica Adobe Acrobat Professional , disponibile gratuitamente sul sito www.adobe.com
Materiale didattico:
Lunedì ore 16-19 aula A
Martedì ore 9-11 aula A
Martedì ore 14-16 aula A
(periodo del Corso):
Martedì ore 11,30-13
Ex Dipartimento di Studi sullo Sviluppo Economico
Piazza Oberdan, 3
(in alternativa)
D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.
S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie
per le scienze economiche e sociali – McGraw-Hill.
(più ne fate, meglio è)
S. Bernstein, R. Bernstein,
Statistica inferenziale, Collana Schaum ’ s, 2003
A. Montanari, P. Agati, D.G. Calò,
Statistica, Collana OPEN, Masson, Milano, 1998 S. Bernstein, R. Bernstein,
Statistica descrittiva, Collana Schaum ’ s, 2003
S. Bernstein, R. Bernstein,
Calcolo delle probabilità, Collana Schaum ’ s, 2003
Concetti matematici di base:
• Richiami di aritmetica e di algebra • Nozioni di analisi matematica:
• Insiemi ed operazioni sugli insiemi
• Nozioni di calcolo combinatorio
“ Se mi rimanesse un’ora sola da vivere vorrei trascorrerla ad una lezione di statistica perché sembrerebbe durare per sempre”
Lamento di uno studente
“ Ci sono tre tipi di menzogne: le bugie, le grandi bugie e le statistiche”
Benjamin Disraeli
” Se si muove è biologia, se cambia colore è chimica, se si rompe è fisica, se ti fa dormire è statistica”
Bob Hogg, Università dello Iowa
” Non mi fido molto delle statistiche, perché un uomo con la testa nel forno acceso e i piedi nel congelatore statisticamente ha una
temperatura media ”
Charles Bukowski
E’ l’insieme delle metodologie per lo studio di fenomeni che hanno l’attitudine a variare.
Comprende la raccolta, l’elaborazione e la definizione di informazioni per agevolare sia l’analisi dei dati che i processi decisionali.
Un dato è una qualsiasi misurazione di un qualsiasi fenomeno.
Un’informazione è un dato, o un insieme di dati, semplici o elaborati, che ci servono per:
Capire
Prevedere
Nel marketing: per valutare la soddisfazione dei propri clienti al fine di migliorare/correggere le proprie politiche commerciali
In Economia: per costruire modelli di
previsione economica per l ’ intervento in Paesi in via di sviluppo
In medicina: Nel sequenziamento del genoma umano e
nella ricerca di patologie genetiche
In campo sociale:
- per la progettazione e gestione di indagini campionarie e sondaggi demoscopici;
- per la programmazione e valutazione dei servizi sociali e sanitari;
- per la rilevazione dei comportamenti e motivazioni soggettive in svariati campi (processi educativi,
espressioni di voto, mobilità sociale e turistica, sport, tempo libero e comunicazione, psicologia).
“ Conoscere per governare” (Luigi Einaudi)
“ Non si può gestire ciò che non si può
misurare” (Kaplan e Norton)
Da un ’ indagine campionaria condotta sulle matricole universitarie è risultato che il 70% ha dato un giudizio buono sui propri docenti.
Questo risultato può essere considerato…
Negativo Perché la percentuale media degli anni precedenti era oltre l’80%.
Positivo Perché è, in assoluto, una % alta;
Ma ciò che è importante
(da un punto di vista statistico)è:
Come è stato scelto il campione?
Come si è determinata la sua numerosità?
Qual è l ’ errore associato a questo risultato e quale il livello di “ fiducia ” che noi riponiamo in esso?
Ogni risultato va interpretato;
Ogni interpretazione può essere giusta o sbagliata, utile o inutile, rilevante o irrilevante rispetto al problema che dobbiamo risolvere;
Ciò su cui si deve essere d’accordo è il processo che ha portato a quel risultato.
Es.:
Ci occuperemo di alcune tecniche e procedure che vengono utilizzate per raccogliere, organizzare, presentare, analizzare e interpretare dati numerici al fine di (far) prendere decisioni efficaci.
Tabelle, Grafici, Indici sintetici
Generalizzazione dei risultati
La statistica descrittiva può essere definita come l ’ insieme dei metodi che concernono la raccolta, il compendio, la presentazione e la definizione di un insieme di dati per descriverne in maniera adeguata le varie caratteristiche.
La statistica inferenziale può essere definita come l ’ insieme dei metodi che, utilizzando lo strumento probabilistico,
permettono la stima di una caratteristica di una popolazione, o
una decisione da prendere riguardo una popolazione, e che
sono basati soltanto sui risultati di un campione
Gli argomenti fondamentali del corso sono:
1. La raccolta dei dati
2. L’organizzazione dei dati: tabelle e grafici
3. Gli indici sintetici: tendenza centrale e variabilità 4. Le statistiche bivariate: analisi della dipendenza e
della interdipendenza
5. Elementi di teoria della probabilità
6. Le variabili casuali: discrete e continue 7. Le distribuzioni campionarie
8. La stima per intervalli
9. La verifica delle ipotesi
Studiare le metodologie
Fare esercizi per la prova scritta
Ripetere gli argomenti per la prova orale
E’ l’insieme delle metodologie per lo studio di fenomeni che hanno l’attitudine a variare.
Comprende la raccolta, l’elaborazione e la definizione di informazioni per agevolare sia l’analisi dei dati che i processi decisionali.
Un dato è una qualsiasi misurazione di un qualsiasi fenomeno.
Un’informazione è un dato, o un insieme di dati, semplici o elaborati, che ci servono per:
Capire
Prevedere
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni Controllo
Interpretazione dei risultati
. Scelta delle unità
(indagine censuaria o campionaria) . Scelta delle variabili
(princìpi di pertinenza,
esaustività, non ridondanza) . Approccio “esplorativo” o “confermativo”
. Uso delle informazioni a priori
. Metodi univariati, bivariati,
multivariati, multidimensionali, …
. Significatività e
rilevanza dei risultati . Coerenza con
il problema posto
Le fasi di un ’ indagine statistica
Riguarda la definizione del problema da analizzare in tutti i suoi aspetti
(scientifici, statistici, organizzativi, economici)
Approccio esplorativo:
Ä non si hanno particolari conoscenze sul fenomeno Approccio confermativo o esplicativo:
Ä si dispone di conoscenze preliminari
La definizione del problema
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Scelta del metodo di rilevazione:
1. Direttamente (questionari)
2. Indirettamente (raccolta di dati statistici prodotti da altri enti)
3. Osservazioni sperimentali
(esperimenti fisici, chimici effettuati in laboratorio)
L ’ indagine statistica
La definizione del problema La raccolta dei
dati
Le unità
Le variabili
(o caratteri statistici)
Unità statistica:
unità elementare su cui vengono osservati i caratteri oggetto di studio (persone o esseri
viventi, oggetti, territori, tempi, ..)
Collettivo statistico o popolazione:
insieme di unità statistiche omogenee su cui si effettua la rilevazione di uno o più caratteri
In corrispondenza di ogni unità statistica
sono osservati alcuni caratteri o
variabili
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ indagine statistica
Il concetto di Popolazione e di Unità statistica
ü
Una Popolazione
può essere: i clienti di un’azienda
Le aziende manifatturiere i Comuni di una Regione
i delitti in un anno Un insieme di soggetti
Un insieme di stabilimenti Un insieme di unità amministrative Un insieme di eventi
L ’ unità statistica è l ’ elemento su cui viene condotta l ’ indagine
L ’ insieme delle variabili misurate sulle diverse unità statistiche viene raccolto in una tabella unitàXvariabili.
L ’ unità statistica ISTAT La Famiglia
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Un insieme di persone legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o da vincoli affettivi, coabitanti e aventi dimora abituale nello stesso comune.
Una famiglia può essere costituita anche da una sola
persona (Censimento 2001).
Quantitative continue
L’ unità statistica
I diversi tipi di variabili
Quantitative discrete Qualitative ordinabili Qualitative sconnesse
Ind Genere Età Titolo
di studio Attività Reddito (€)
Comp.
fam.
I
1M 21 M. inf. Operaio 950 4
I
2M 56 Laurea Impiegato 1700 4
I
3F 33 Laurea Docente 2100 2
: : : : : : :
I
nM 71 M. Sup. Pensionato 1300 3
Le tabelle unità X variabili
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Ind Genere Età Titolo
di studio Attività Reddito (€)
Comp.
fam.
I
1M 21 M. inf. Operaio 950 4
I
2M 56 Laurea Impiegato 1700 4
I
3F 33 Laurea Docente 2100 2
: : : : : : :
I
nM 71 M. Sup. Pensionato 1300 3
Le tabelle unitàxvariabili
Quantitative continue
L’ unità statistica
I diversi tipi di variabili
Quantitative discrete Qualitative ordinabili Qualitative sconnesse
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Ind Genere Età Titolo
di studio Attività Reddito (€)
Comp.
fam.
I
1M 21 M. inf. Operaio 950 4
I
2M 56 Laurea Impiegato 1700 4
I
3F 33 Laurea Docente 2100 2
: : : : : : :
I
nM 71 M. Sup. Pensionato 1300 3
Le tabelle unitàxvariabili
Quantitative continue
L’ unità statistica
I diversi tipi di variabili
Quantitative discrete Qualitative ordinabili Qualitative sconnesse
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Ind Genere Età Titolo
di studio Attività Reddito (€)
Comp.
fam.
I
1M 21 M. inf. Operaio 950 4
I
2M 56 Laurea Impiegato 1700 4
I
3F 33 Laurea Docente 2100 2
: : : : : : :
I
nM 71 M. Sup. Pensionato 1300 3
Le tabelle unitàxvariabili
Quantitative continue
L’ unità statistica
I diversi tipi di variabili
Quantitative discrete Qualitative ordinabili Qualitative sconnesse
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Ind Genere Età Titolo
di studio Attività Reddito (€)
Comp.
fam.
I
1M 21 M. inf. Operaio 950 4
I
2M 56 Laurea Impiegato 1700 4
I
3F 33 Laurea Docente 2100 2
: : : : : : :
I
nM 71 M. Sup. Pensionato 1300 3
Le tabelle unitàxvariabili
Quantitative continue
L’ unità statistica
I diversi tipi di variabili
Quantitative discrete Qualitative ordinabili Qualitative sconnesse
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Caratteri o variabili statistiche:
Un carattere può assumere modalità differenti in corrispondenza delle diverse unità del collettivo. Le modalità del carattere devono
essere esaustive e non sovrapposte.
La presentazione dei dati:
La distribuzione unitaria multipla:
unità età sesso n.auto
1 35 M 1
2 37 M 2
3 59 F 1
4 54 M 0
5 44 F 2
6 38 M 1
7 62 F 1
8 71 F 0
9 56 M 3
10 60 M 2
11 33 M 2
12 46 F 4
13 41 F 3
14 53 M 1
15 38 F 1
16 55 M 2
17 50 M 3
18 63 M 0
19 35 F 1
20 51 M 2
Ä elencazione delle modalità
osservate, unità per unità per più di un carattere
La distribuzione unitaria semplice:
Ä elencazione delle modalità
osservate, unità per unità per un solo carattere
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
Le distribuzioni di frequenza:
Caratteri qualitativi sconnessi
Tipo diploma
Frequenze assolute
(n
i)
Freq.
Relative (f
i)
Freq.
percentuali (p
i)
Liceo classico 10 0,044 4,4
Liceo scientifico 64 0,282 28,2
ITC 141 0,621 62,1
Altro 12 0,053 5,3
Totale 227
1,000
100,0Frequenza assoluta:
numero di volte che una modalità viene
osservata nel collettivo
Distribuzione di frequenza semplice
associa alle modalità che può assumere un carattere le
corrispondenti frequenze assolute
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
Le distribuzioni di frequenza:
Caratteri qualitativi sconnessi
Tipo diploma
Frequenze assolute
(n
i)
Freq.
Relative (f
i)
Freq.
percentuali (p
i)
Liceo classico 10 0,044 4,4
Liceo scientifico 64 0,282 28,2
ITC 141 0,621 62,1
Altro 12 0,053 5,3
Totale 227
1,000
100,0Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
Le distribuzioni di frequenza:
Caratteri qualitativi sconnessi
Tipo diploma
Frequenze assolute
(n
i)
Freq.
Relative (f
i)
Freq.
percentuali (p
i)
Liceo classico 10 0,044 4,4
Liceo scientifico 64 0,282 28,2
ITC 141 0,621 62,1
Altro 12 0,053 5,3
Totale 227
1,000
100,0Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Caratteri qualitativi ordinabili e
Caratteri quantitativi discreti
L ’ analisi dei dati:
Le distribuzioni di frequenza:
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Titolo di studio
Frequenze assolute
(n
i)
Freq.
Relative (f
i)
Freq.
percentuali (p
i)
Freq. ass.
cumulate (N
i)
Freq. rel.
cumulate (F
i)
Freq. % cumulate
(P
i)
Licenza elementare 42 0,185 18,5 42 0,185 18,5
Licenza media 70 0,308 30,8 112 0,493 49,3
Diploma scuola superiore55 0,242 24,2 167 0,736 73,6
Laurea 60 0,264 26,4 227 1,000 100,0
Totale 227 1,000 100,0
Caratteri qualitativi ordinabili e Caratteri quantitativi discreti
L ’ analisi dei dati:
Le distribuzioni di frequenza:
Titolo di studio
Frequenze assolute
(n
i)
Freq.
Relative (f
i)
Freq.
percentuali (p
i)
Freq. ass.
cumulate (N
i)
Freq. rel.
cumulate (F
i)
Freq. % cumulate
(P
i)
Licenza elementare 42 0,185 18,5 42 0,185 18,5
Licenza media 70 0,308 30,8 112 0,493 49,3
Diploma scuola superiore55 0,242 24,2 167 0,736 73,6
Laurea 60 0,264 26,4 227 1,000 100,0
Totale 227 1,000 100,0
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
Le distribuzioni di frequenza:
Variabile x
Frequenze assolute
Frequenze cumulate
Frequenze relative
Frequenze
%
x 1 n 1 n 1 n 1 /N n 1 /N*100
x 2 n 2 n 1 +n 2 n 2 /N n 2 /N*100
… … … … …
x k n k n 1 + ….+n k =N n k /N n k /N*100
totale N 1 100
Caratteri qualitativi ordinabili e Caratteri quantitativi discreti
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Dove e come studiare
Esercizio n. 1 – punto 1
File “esercizi indici sintetici.pdf”
• Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.
Cap. 1, Cap. 2 (escluso paragrafi 2.4, 2.5),
• Libro di testo: S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.
Cap. 1, Cap. 2
ETÀ
1 5.0 5.0
2 10.0 15.0
1 5.0 20.0
2 10.0 30.0
1 5.0 35.0
1 5.0 40.0
1 5.0 45.0
1 5.0 50.0
1 5.0 55.0
1 5.0 60.0
1 5.0 65.0
1 5.0 70.0
1 5.0 75.0
1 5.0 80.0
1 5.0 85.0
1 5.0 90.0
1 5.0 95.0
1 5.0 100.0
20 100.0
33 35 37 38 41 44 46 50 51 53 54 55 56 59 60 62 63 71 Totale
Frequenze % % cumulate
Caratteri quantitativi
L ’ analisi dei dati:
Le distribuzioni di frequenza:
Suddivisione in classi
classe freq. %
% cumulate
33 |- 47 9 45% 45%
47 |- 61 8 40% 85%
61 |- 74 3 15% 100%
totale 20 100%
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Operazione consistente nel suddividere l ’ insieme dei possibili valori in intervalli tra loro disgiunti
Le classi devono essere definite in modo che:
• il loro numero sia abbastanza piccolo da fornire una adeguata sintesi ma abbastanza grande da mantenere l ’ informazione con un livello sufficiente di dettaglio
• siano tra loro disgiunte
• comprendano tutte le possibili modalità del carattere
• abbiano, se possibile, la stessa ampiezza
L ’ analisi dei dati:
Suddivisione in classi di un carattere quantitativo
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
ETÀ
1 5.0 5.0
2 10.0 15.0
1 5.0 20.0
2 10.0 30.0
1 5.0 35.0
1 5.0 40.0
1 5.0 45.0
1 5.0 50.0
1 5.0 55.0
1 5.0 60.0
1 5.0 65.0
1 5.0 70.0
1 5.0 75.0
1 5.0 80.0
1 5.0 85.0
1 5.0 90.0
1 5.0 95.0
1 5.0 100.0
20 100.0
33 35 37 38 41 44 46 50 51 53 54 55 56 59 60 62 63 71 Totale
Frequenze % % cumulate
Classi di uguale ampiezza
L ’ analisi dei dati:
Suddivisione in classi
max min
71 33
12,66
. 3
x x
num classi
− = − =
Ampiezza di ciascuna classe
Freq. % %
cumulata
33 |-| 46 9 45% 45%
46 -| 59 7 35% 80%
59 -| 72 4 20% 100%
20
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
ETÀ
1 5.0 5.0
2 10.0 15.0
1 5.0 20.0
2 10.0 30.0
1 5.0 35.0
1 5.0 40.0
1 5.0 45.0
1 5.0 50.0
1 5.0 55.0
1 5.0 60.0
1 5.0 65.0
1 5.0 70.0
1 5.0 75.0
1 5.0 80.0
1 5.0 85.0
1 5.0 90.0
1 5.0 95.0
1 5.0 100.0
20 100.0
33 35 37 38 41 44 46 50 51 53 54 55 56 59 60 62 63 71 Totale
Frequenze % % cumulate
classe freq. % % cumulate 33 |- 42 7 35% 35%
42 |- 56 7 35% 70%
>=56 6 30% 100%
totale 20 100%
• Numero di classi: 3
• Frequenza assoluta costante in ogni classe:
20/3=6,7
• Frequenza percentuale costante in ogni classe:
100/3=33,3%
Classi di uguale frequenza
L ’ analisi dei dati:
Suddivisione in classi
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
La distribuzione in
classi di uguale ampiezza
Tempo per raggiungere la Facoltà (in min.)
Frequenze assolute
(n
i)
Freq.
Relative (f
i)
Freq.
percentuali (p
i)
Freq. ass.
cumulate (N
i)
Freq. rel.
cumulate (F
i)
Freq. % cumulate
(P
i)
0-|20 84 0,370 37,0 84 0,370 37,0
20-|40 81 0,357 35,7 165 0,727 72,7
40-|60 44 0,194 19,4 209 0,921 92,1
60-|80 8 0,035 3,5 217 0,956 95,6
80-|100 0 0,000 0,0 217 0,956 95,6
100-|120 4 0,018 1,8 221 0,974 97,4
120-|140 6 0,026 2,6 227 1,000 100,0
227 1,000 100,0
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
La distribuzione in
classi di ampiezza diversa le densità di frequenza
Tempo per raggiungere la Facoltà (in min.)
Frequenze assolute
(ni)
Freq.
Relative (fi)
Freq.
percentuali (pi)
Freq. ass.
cumulate (Ni)
Freq. rel.
cumulate (Fi)
Freq. % cumulate
(Pi)
Densità di frequenza
(di)
0-|60 84 0,370 37,0 84 0,370 37,0 1,4
60-|80 81 0,357 35,7 165 0,727 72,7 4,0
80-|120 44 0,194 19,4 209 0,921 92,1 1,1
120 -|140 18 0,079 7,9 227 1,000 100,0 0,9
227 1,000 100,0
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
(Rapporto tra la frequenza e l’ampiezza
della classe)
Dove e come studiare
Esercizio n. 1 – punto 2
File “esercizi indici sintetici.pdf”
• Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.
Cap. 1
• Libro di testo: S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.
Cap. 1, Cap. 2,
L ’ analisi dei dati:
Rappresentazioni grafiche
Illustrare mediante figure, linee o segmenti, aree, solidi, simboli convenzionali una distribuzione di frequenza o
di intensità, in funzione delle modalità, qualitative o quantitative, di uno o più caratteri
Vantaggi:
• confronto tra più distribuzioni
• mette in rilievo casi anomali
• potenza divulgativa
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
I grafici: Caratteri qualitativi e
caratteri quantitativi discreti
Freq.
Relative (fi)
4,4 28,2 62,1 5,3 100,0 Tipo diploma
Frequenze assolute
(ni)
Liceo classico 10
Liceo scientifico 64
ITC 141
Altro 12
Totale 227
Freq.
percentuali (pi)
4,4 28,2 62,1 5,3 100,0 5,3%
62,1%
28,2%
4,4%
Altro
ITC
Liceo scientifico Liceo classico
Altro ITC
Liceo scientifico Liceo classico
% 70
60
50
40
30
20
10 0
• Pie-chart
• Bar chart
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
I grafici: Variabili continue Istogramma
Freq.
min.
Classi di ampiezza diversa Sull’asse ordinate dobbiamo mettere la densità di frequenza
0 10 20 30 40 50 60 70 80 90
20 40 60 80 100 120 140
Tempo per raggiungere la Facoltà (in min.)
Frequenze assolute
(n
i)
Freq.
Relative (f
i)
Freq.
percentuali (p
i)
Freq. ass.
cumulate (N
i)
Freq. rel.
cumulate (F
i)
Freq. % cumulate
(P
i)
0-|20 84 0,370 37,0 84 0,370 37,0
20-|40 81 0,357 35,7 165 0,727 72,7
40-|60 44 0,194 19,4 209 0,921 92,1
60-|80 8 0,035 3,5 217 0,956 95,6
80-|100 0 0,000 0,0 217 0,956 95,6
100-|120 4 0,018 1,8 221 0,974 97,4
120-|140 6 0,026 2,6 227 1,000 100,0
227 1,000 100,0
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
I grafici: Variabili continue Istogramma
Densità
min.
Classi di ampiezza diversa
Tempo per raggiungere la Facoltà (in min.)
Frequenze assolute
(n
i)
Densità di frequenza
(d
i)
0-|60 84 1,4
60-|80 81 4,0
80-|120 44 1,1
120 -|140 18 0,9
227
0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
60 80 120 140
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
I grafici: Variabili continue Istogramma
grafico costituito da barre non distanziate, con basi in generale diverse, dove ogni barra possiede un ’ area proporzionale alla corrispondente frequenza
area di ogni rettangolo = frequenza (densità x ampiezza della classe) Ã
Ä (frequenza/ampiezza della classe)
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Reddito pro capite 1997 (in milioni di lire)
31.0 30.0 29.0 28.0 27.0 26.0 25.0 24.0 23.0 22.0 21.0 20.0 19.0 18.0 17.0 16.0 15.0 14.0 16 14 12 10 8 6 4
2 0
Reddito pro capite 1997 (in milioni di lire)
30.6 28.8 27.0 25.2 23.4 21.6 19.8 18.0 16.2 14.4 30
20
10
0
L ’ analisi dei dati:
I grafici: Variabili continue Istogramma
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
I grafici: Variabili continue e discrete
Rappresentazione a ramo e foglia
unità età
1 35
2 37
3 59
4 54
5 44
6 38
7 62
8 71
9 56
10 60
11 33
12 46
13 41
14 53
15 38
16 55
17 50
18 63
19 35
20 51
• ramo: numeri interi iniziali dei dati
• foglia: numeri interi finali dei dati
Presenta i dati sia in forma tabellare che grafica Frequenza Ramo & Foglia
6 3 . 355788 3 4 . 146
7 5 . 0134569 3 6 . 023
1 7 . 1 Ampiezza ramo: 10
Ogni foglia: 1 caso
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
L ’ analisi dei dati:
Le statistiche univariate
analisi delle distribuzioni di frequenza
Rappresentazioni grafiche
Indici sintetici
Distribuzioni di frequenza
Suddivisioni in classi
Istogrammi, boxplot, steam and leaf
Tendenza centrale Variabilità
Forma
Grafici a barre Grafici a torta
Istogrammi Boxplot
Steam and leaf
Distribuzioni di frequenza
Suddivisioni in classi
Istogrammi, boxplot, steam and leaf
Tendenza centrale Variabilità
Forma
Grafici a barre Grafici a torta
Istogrammi Boxplot
Steam and leaf
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Interpretazione dei risultati
Dove e come studiare
Esercizio n. 1 – punto 3 e punto 4 Esercizio n.3 – punto a, b, c
Esercizio n. 7 – punto a e b Esercizio n. 8 – punto a Esercizio n. 10 – punto a
File “esercizi indici sintetici.pdf”
• Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.
Cap. 1
• Libro di testo: S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.
Cap. 1, Cap. 2,
Ricapitolando…..
• La distribuzione di frequenza è una particolare tipologia di rappresentazione dei dati statistici
• Per illustrare una distribuzione di frequenza è necessario costruire una tabella statistica la quale deriva dalla classificazione dei dati
statistici tale che, ad ogni modalità o classe di
modalità di uno o più caratteri, corrisponde la
rispettiva frequenza assoluta o relativa
Modalità di x
Frequenze
x
1n
1x
2n
2: :
x
in
i: :
x
rn
rTotale n
Età
studenti del corso
Frequenz e
assolute
x n
18 2
19 44
20 55
21 32
22 18
23 13
24 9
25 6
Totale 179
Variabile
Modalità
1° caso : creazione della tabella statistica di un carattere (variabile) con le sue
modalità e le relative frequenze (assolute)
Esercizio n.1
Qual è la proporzione di studenti con meno di 23 anni???
Età studenti del corso
Frequenze assolute
x n
18 2
19 44
20 55
21 32
22 18
23 13
24 9
25 6
Totale 179
Età studenti del corso
Frequenze assolute
x n
18 2
19 44
20 55
21 32
22 18
23 13
24 9
25 6
Totale 179
Frequenze relative
f 0,011 0,246 0,307 0,179 0,101 0,073 0,050 0,034 1,000
Frequenze relative cumulate
F 0,011 0,257 0,564 0,743 0,844 0,916 0,966 1,000
f
2/179
44/179 f 0,246+0,011 F
Rappresentazione Grafica di una Variabile Discreta Una variabile discreta può essere rappresentata con:
Grafico a barre Diagramma a torta
0 10 20 30 40 50 60
18 19 20 21 22 23 24 25
Frequenze assolute
Frequenze assolute
Frequenze assolute
18 19 20 21 22 23 24 25
In ascissa sono rappresentate le modalità della variabile e in
ordinata le frequenze (assolute o relative) di ciascuna modalità
L’area della torta viene divisa per il numero di modalità della variabile.
L’ampiezza dello spicchio è
determinata dalla frequenza della
modalità
Esercizio n.2
Posizione professionale
1 3 4 2 1 4 2 2 3 4 1 3 1 2 2 2 3 1 4 4
n
Posizione profession ale
Frequenze
1 5
2 6
3 4
4 5
Totale 20
f
f 0,25
0,3 0,2 0,25
1
F 0,25 0,55 0,75
1
0 0,1 0,2 0,3 0,4
1 2 3 4
f
f
0 2 4 6 8
1 2 3 4
Frequenze n
Frequenze n
1= apprendista; 2= operaio; 3=impiegato; 4= dirigente
Rappresentare graficamente la distribuzione di frequenza
della variabile POSIZIONE PROFESSIONALE
2°caso: creazione della tabella statistica di una variabile continua (con modalità raggruppate in classi) e le relative frequenze
Classi di modalità di X
Frequenze
x
1˧ x
2n
1x
2˧ x
3n
2:
:
x
i˧ x
i+1n
i: :
x
r˧ x
r+1n
rTotale n
Classi ore di straordinario
Frequenze
50 ˧ 60 2
60 ˧ 65 0
65˧ 80 1
80 ˧ 100 2
100 ˧ 150 6
150 ˧ 175 3
175 ˧ 200 1
200 ˧ 270 5
variabile
Questo simbolo indica
che la classe è aperta a
sinistra, quindi il limite
inferiore è escluso dalla
classe.
Rappresentazione grafica di una Variabile Continua
Classi ore di straordinario
Frequenze
50 ˧ 60 2
60 ˧ 65 0
65˧ 80 1
80 ˧ 100 2
100 ˧ 150 6 150 ˧ 175 3 175 ˧ 200 1 200 ˧ 270 5
L’ampiezza delle classi è diversa, è quindi necessario utilizzare la densità di frequenza
2/(60-50)
d
Densità di frequenza 0,2
0 0,066 0,1 0,12 0,12 0,04 0,07
Esercizio n.3
Dividere la variabile età in 3 classi di uguale ampiezza, rappresentando la variabile ETA’ con i grafici opportuni.
età frequenze
33 1
35 2
37 1
38 2
41 1
44 1
46 1
50 1
51 1
53 1
54 1
55 1
56 1
59 1
60 1
62 1
63 1
71 1
Ampiezza della classe
(71 ‐ 33)/3 ≅ 13
Classi d'età Frequenza
33 ˧ 46 8
46 ˧ 59 7
59˧ 72 5