• Non ci sono risultati.

Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014

N/A
N/A
Protected

Academic year: 2022

Condividi "Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a. 2013-2014"

Copied!
58
0
0

Testo completo

(1)

comunicazione e delle relazioni

internazionali - a.a. 2013-2014

(2)

I file sono, generalmente, in pdf. Per leggerli, scarica Adobe Acrobat Professional , disponibile gratuitamente sul sito www.adobe.com

Materiale didattico:

Lunedì ore 16-19 aula A

Martedì ore 9-11 aula A

Martedì ore 14-16 aula A

(3)

(periodo del Corso):

Martedì ore 11,30-13

Ex Dipartimento di Studi sullo Sviluppo Economico

Piazza Oberdan, 3

(4)

(in alternativa)

D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.

S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie

per le scienze economiche e sociali – McGraw-Hill.

(5)

(più ne fate, meglio è)

S. Bernstein, R. Bernstein,

Statistica inferenziale, Collana Schaums, 2003

A. Montanari, P. Agati, D.G. Calò,

Statistica, Collana OPEN, Masson, Milano, 1998 S. Bernstein, R. Bernstein,

Statistica descrittiva, Collana Schaums, 2003

S. Bernstein, R. Bernstein,

Calcolo delle probabilità, Collana Schaums, 2003

(6)

Concetti matematici di base:

• Richiami di aritmetica e di algebra • Nozioni di analisi matematica:

• Insiemi ed operazioni sugli insiemi

• Nozioni di calcolo combinatorio

(7)

Se mi rimanesse un’ora sola da vivere vorrei trascorrerla ad una lezione di statistica perché sembrerebbe durare per sempre”

Lamento di uno studente

Ci sono tre tipi di menzogne: le bugie, le grandi bugie e le statistiche”

Benjamin Disraeli

Se si muove è biologia, se cambia colore è chimica, se si rompe è fisica, se ti fa dormire è statistica”

Bob Hogg, Università dello Iowa

Non mi fido molto delle statistiche, perché un uomo con la testa nel forno acceso e i piedi nel congelatore statisticamente ha una

temperatura media ”

Charles Bukowski

(8)

E’ l’insieme delle metodologie per lo studio di fenomeni che hanno l’attitudine a variare.

Comprende la raccolta, l’elaborazione e la definizione di informazioni per agevolare sia l’analisi dei dati che i processi decisionali.

Un dato è una qualsiasi misurazione di un qualsiasi fenomeno.

Un’informazione è un dato, o un insieme di dati, semplici o elaborati, che ci servono per:

Capire

Prevedere

(9)

Nel marketing: per valutare la soddisfazione dei propri clienti al fine di migliorare/correggere le proprie politiche commerciali

In Economia: per costruire modelli di

previsione economica per l ’ intervento in Paesi in via di sviluppo

In medicina: Nel sequenziamento del genoma umano e

nella ricerca di patologie genetiche

(10)

In campo sociale:

- per la progettazione e gestione di indagini campionarie e sondaggi demoscopici;

- per la programmazione e valutazione dei servizi sociali e sanitari;

- per la rilevazione dei comportamenti e motivazioni soggettive in svariati campi (processi educativi,

espressioni di voto, mobilità sociale e turistica, sport, tempo libero e comunicazione, psicologia).

Conoscere per governare” (Luigi Einaudi)

Non si può gestire ciò che non si può

misurare” (Kaplan e Norton)

(11)

Da unindagine campionaria condotta sulle matricole universitarie è risultato che il 70% ha dato un giudizio buono sui propri docenti.

Questo risultato può essere considerato…

Negativo Perché la percentuale media degli anni precedenti era oltre l’80%.

Positivo Perché è, in assoluto, una % alta;

Ma ciò che è importante

(da un punto di vista statistico)

è:

Come è stato scelto il campione?

Come si è determinata la sua numerosità?

Qual è lerrore associato a questo risultato e quale il livello di fiduciache noi riponiamo in esso?

Ogni risultato va interpretato;

Ogni interpretazione può essere giusta o sbagliata, utile o inutile, rilevante o irrilevante rispetto al problema che dobbiamo risolvere;

Ciò su cui si deve essere d’accordo è il processo che ha portato a quel risultato.

Es.:

(12)

Ci occuperemo di alcune tecniche e procedure che vengono utilizzate per raccogliere, organizzare, presentare, analizzare e interpretare dati numerici al fine di (far) prendere decisioni efficaci.

Tabelle, Grafici, Indici sintetici

Generalizzazione dei risultati

La statistica descrittiva può essere definita come l ’ insieme dei metodi che concernono la raccolta, il compendio, la presentazione e la definizione di un insieme di dati per descriverne in maniera adeguata le varie caratteristiche.

La statistica inferenziale può essere definita come l ’ insieme dei metodi che, utilizzando lo strumento probabilistico,

permettono la stima di una caratteristica di una popolazione, o

una decisione da prendere riguardo una popolazione, e che

sono basati soltanto sui risultati di un campione

(13)

Gli argomenti fondamentali del corso sono:

1.  La raccolta dei dati

2.  L’organizzazione dei dati: tabelle e grafici

3.  Gli indici sintetici: tendenza centrale e variabilità 4.  Le statistiche bivariate: analisi della dipendenza e

della interdipendenza

5.  Elementi di teoria della probabilità

6.  Le variabili casuali: discrete e continue 7.  Le distribuzioni campionarie

8.  La stima per intervalli

9.  La verifica delle ipotesi

(14)

Studiare le metodologie

Fare esercizi per la prova scritta

Ripetere gli argomenti per la prova orale

(15)

E’ l’insieme delle metodologie per lo studio di fenomeni che hanno l’attitudine a variare.

Comprende la raccolta, l’elaborazione e la definizione di informazioni per agevolare sia l’analisi dei dati che i processi decisionali.

Un dato è una qualsiasi misurazione di un qualsiasi fenomeno.

Un’informazione è un dato, o un insieme di dati, semplici o elaborati, che ci servono per:

Capire

Prevedere

(16)

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni Controllo

Interpretazione dei risultati

. Scelta delle unità

(indagine censuaria o campionaria) . Scelta delle variabili

(princìpi di pertinenza,

esaustività, non ridondanza) . Approccio “esplorativo” o “confermativo”

. Uso delle informazioni a priori

. Metodi univariati, bivariati,

multivariati, multidimensionali, …

. Significatività e

rilevanza dei risultati . Coerenza con

il problema posto

Le fasi di unindagine statistica

(17)

Riguarda la definizione del problema da analizzare in tutti i suoi aspetti

(scientifici, statistici, organizzativi, economici)

Approccio esplorativo:

Ä non si hanno particolari conoscenze sul fenomeno Approccio confermativo o esplicativo:

Ä si dispone di conoscenze preliminari

La definizione del problema

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

Scelta del metodo di rilevazione:

1. Direttamente (questionari)

2. Indirettamente (raccolta di dati statistici prodotti da altri enti)

3. Osservazioni sperimentali

(esperimenti fisici, chimici effettuati in laboratorio)

(18)

Lindagine statistica

La definizione del problema La raccolta dei

dati

Le unità

Le variabili

(o caratteri statistici)

Unità statistica:

unità elementare su cui vengono osservati i caratteri oggetto di studio (persone o esseri

viventi, oggetti, territori, tempi, ..)

Collettivo statistico o popolazione:

insieme di unità statistiche omogenee su cui si effettua la rilevazione di uno o più caratteri

In corrispondenza di ogni unità statistica

sono osservati alcuni caratteri o

variabili

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(19)

Lindagine statistica

Il concetto di Popolazione e di Unità statistica

ü

Una Popolazione

può essere: i clienti di un’azienda

Le aziende manifatturiere i Comuni di una Regione

i delitti in un anno Un insieme di soggetti

Un insieme di stabilimenti Un insieme di unità amministrative Un insieme di eventi

Lunità statistica è lelemento su cui viene condotta lindagine

Linsieme delle variabili misurate sulle diverse unità statistiche viene raccolto in una tabella unitàXvariabili.

Lunità statistica ISTAT La Famiglia

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

Un insieme di persone legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o da vincoli affettivi, coabitanti e aventi dimora abituale nello stesso comune.

Una famiglia può essere costituita anche da una sola

persona (Censimento 2001).

(20)

Quantitative continue

L’ unità statistica

I diversi tipi di variabili

Quantitative discrete Qualitative ordinabili Qualitative sconnesse

Ind Genere Età Titolo

di studio Attività Reddito (€)

Comp.

fam.

I

1

M 21 M. inf. Operaio 950 4

I

2

M 56 Laurea Impiegato 1700 4

I

3

F 33 Laurea Docente 2100 2

: : : : : : :

I

n

M 71 M. Sup. Pensionato 1300 3

Le tabelle unità X variabili

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(21)

Ind Genere Età Titolo

di studio Attività Reddito (€)

Comp.

fam.

I

1

M 21 M. inf. Operaio 950 4

I

2

M 56 Laurea Impiegato 1700 4

I

3

F 33 Laurea Docente 2100 2

: : : : : : :

I

n

M 71 M. Sup. Pensionato 1300 3

Le tabelle unitàxvariabili

Quantitative continue

L’ unità statistica

I diversi tipi di variabili

Quantitative discrete Qualitative ordinabili Qualitative sconnesse

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(22)

Ind Genere Età Titolo

di studio Attività Reddito (€)

Comp.

fam.

I

1

M 21 M. inf. Operaio 950 4

I

2

M 56 Laurea Impiegato 1700 4

I

3

F 33 Laurea Docente 2100 2

: : : : : : :

I

n

M 71 M. Sup. Pensionato 1300 3

Le tabelle unitàxvariabili

Quantitative continue

L’ unità statistica

I diversi tipi di variabili

Quantitative discrete Qualitative ordinabili Qualitative sconnesse

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(23)

Ind Genere Età Titolo

di studio Attività Reddito (€)

Comp.

fam.

I

1

M 21 M. inf. Operaio 950 4

I

2

M 56 Laurea Impiegato 1700 4

I

3

F 33 Laurea Docente 2100 2

: : : : : : :

I

n

M 71 M. Sup. Pensionato 1300 3

Le tabelle unitàxvariabili

Quantitative continue

L’ unità statistica

I diversi tipi di variabili

Quantitative discrete Qualitative ordinabili Qualitative sconnesse

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(24)

Ind Genere Età Titolo

di studio Attività Reddito (€)

Comp.

fam.

I

1

M 21 M. inf. Operaio 950 4

I

2

M 56 Laurea Impiegato 1700 4

I

3

F 33 Laurea Docente 2100 2

: : : : : : :

I

n

M 71 M. Sup. Pensionato 1300 3

Le tabelle unitàxvariabili

Quantitative continue

L’ unità statistica

I diversi tipi di variabili

Quantitative discrete Qualitative ordinabili Qualitative sconnesse

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

Caratteri o variabili statistiche:

Un carattere può assumere modalità differenti in corrispondenza delle diverse unità del collettivo. Le modalità del carattere devono

essere esaustive e non sovrapposte.

(25)

La presentazione dei dati:

La distribuzione unitaria multipla:

unità età sesso n.auto

1 35 M 1

2 37 M 2

3 59 F 1

4 54 M 0

5 44 F 2

6 38 M 1

7 62 F 1

8 71 F 0

9 56 M 3

10 60 M 2

11 33 M 2

12 46 F 4

13 41 F 3

14 53 M 1

15 38 F 1

16 55 M 2

17 50 M 3

18 63 M 0

19 35 F 1

20 51 M 2

Ä elencazione delle modalità

osservate, unità per unità per più di un carattere

La distribuzione unitaria semplice:

Ä elencazione delle modalità

osservate, unità per unità per un solo carattere

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(26)

Lanalisi dei dati:

Le distribuzioni di frequenza:

Caratteri qualitativi sconnessi

Tipo diploma

Frequenze assolute

(n

i

)

Freq.

Relative (f

i

)

Freq.

percentuali (p

i

)

Liceo classico 10 0,044 4,4

Liceo scientifico 64 0,282 28,2

ITC 141 0,621 62,1

Altro 12 0,053 5,3

Totale 227

1,000

100,0

Frequenza assoluta:

numero di volte che una modalità viene

osservata nel collettivo

Distribuzione di frequenza semplice

associa alle modalità che può assumere un carattere le

corrispondenti frequenze assolute

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(27)

Lanalisi dei dati:

Le distribuzioni di frequenza:

Caratteri qualitativi sconnessi

Tipo diploma

Frequenze assolute

(n

i

)

Freq.

Relative (f

i

)

Freq.

percentuali (p

i

)

Liceo classico 10 0,044 4,4

Liceo scientifico 64 0,282 28,2

ITC 141 0,621 62,1

Altro 12 0,053 5,3

Totale 227

1,000

100,0

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(28)

Lanalisi dei dati:

Le distribuzioni di frequenza:

Caratteri qualitativi sconnessi

Tipo diploma

Frequenze assolute

(n

i

)

Freq.

Relative (f

i

)

Freq.

percentuali (p

i

)

Liceo classico 10 0,044 4,4

Liceo scientifico 64 0,282 28,2

ITC 141 0,621 62,1

Altro 12 0,053 5,3

Totale 227

1,000

100,0

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(29)

Caratteri qualitativi ordinabili e

Caratteri quantitativi discreti

Lanalisi dei dati:

Le distribuzioni di frequenza:

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

Titolo di studio

Frequenze assolute

(n

i

)

Freq.

Relative (f

i

)

Freq.

percentuali (p

i

)

Freq. ass.

cumulate (N

i

)

Freq. rel.

cumulate (F

i

)

Freq. % cumulate

(P

i

)

Licenza elementare 42 0,185 18,5 42 0,185 18,5

Licenza media 70 0,308 30,8 112 0,493 49,3

Diploma scuola superiore55 0,242 24,2 167 0,736 73,6

Laurea 60 0,264 26,4 227 1,000 100,0

Totale 227 1,000 100,0

(30)

Caratteri qualitativi ordinabili e Caratteri quantitativi discreti

Lanalisi dei dati:

Le distribuzioni di frequenza:

Titolo di studio

Frequenze assolute

(n

i

)

Freq.

Relative (f

i

)

Freq.

percentuali (p

i

)

Freq. ass.

cumulate (N

i

)

Freq. rel.

cumulate (F

i

)

Freq. % cumulate

(P

i

)

Licenza elementare 42 0,185 18,5 42 0,185 18,5

Licenza media 70 0,308 30,8 112 0,493 49,3

Diploma scuola superiore55 0,242 24,2 167 0,736 73,6

Laurea 60 0,264 26,4 227 1,000 100,0

Totale 227 1,000 100,0

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(31)

Lanalisi dei dati:

Le distribuzioni di frequenza:

Variabile x

Frequenze assolute

Frequenze cumulate

Frequenze relative

Frequenze

%

x 1 n 1 n 1 n 1 /N n 1 /N*100

x 2 n 2 n 1 +n 2 n 2 /N n 2 /N*100

… … … … …

x k n k n 1 + ….+n k =N n k /N n k /N*100

totale N 1 100

Caratteri qualitativi ordinabili e Caratteri quantitativi discreti

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(32)

Dove e come studiare

Esercizio n. 1 – punto 1

File “esercizi indici sintetici.pdf”

•  Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.

Cap. 1, Cap. 2 (escluso paragrafi 2.4, 2.5),

•  Libro di testo: S. Borra, A. Di Ciaccio (2008) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.

Cap. 1, Cap. 2

(33)

ETÀ

1 5.0 5.0

2 10.0 15.0

1 5.0 20.0

2 10.0 30.0

1 5.0 35.0

1 5.0 40.0

1 5.0 45.0

1 5.0 50.0

1 5.0 55.0

1 5.0 60.0

1 5.0 65.0

1 5.0 70.0

1 5.0 75.0

1 5.0 80.0

1 5.0 85.0

1 5.0 90.0

1 5.0 95.0

1 5.0 100.0

20 100.0

33 35 37 38 41 44 46 50 51 53 54 55 56 59 60 62 63 71 Totale

Frequenze % % cumulate

Caratteri quantitativi

Lanalisi dei dati:

Le distribuzioni di frequenza:

Suddivisione in classi

classe freq. %

% cumulate

33 |- 47 9 45% 45%

47 |- 61 8 40% 85%

61 |- 74 3 15% 100%

totale 20 100%

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(34)

Operazione consistente nel suddividere l ’ insieme dei possibili valori in intervalli tra loro disgiunti

Le classi devono essere definite in modo che:

•  il loro numero sia abbastanza piccolo da fornire una adeguata sintesi ma abbastanza grande da mantenere l ’ informazione con un livello sufficiente di dettaglio

•  siano tra loro disgiunte

•  comprendano tutte le possibili modalità del carattere

•  abbiano, se possibile, la stessa ampiezza

Lanalisi dei dati:

Suddivisione in classi di un carattere quantitativo

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(35)

ETÀ

1 5.0 5.0

2 10.0 15.0

1 5.0 20.0

2 10.0 30.0

1 5.0 35.0

1 5.0 40.0

1 5.0 45.0

1 5.0 50.0

1 5.0 55.0

1 5.0 60.0

1 5.0 65.0

1 5.0 70.0

1 5.0 75.0

1 5.0 80.0

1 5.0 85.0

1 5.0 90.0

1 5.0 95.0

1 5.0 100.0

20 100.0

33 35 37 38 41 44 46 50 51 53 54 55 56 59 60 62 63 71 Totale

Frequenze % % cumulate

Classi di uguale ampiezza

Lanalisi dei dati:

Suddivisione in classi

max min

71 33

12,66

. 3

x x

num classi

− = − =

Ampiezza di ciascuna classe

Freq. % %

cumulata

33 |-| 46 9 45% 45%

46 -| 59 7 35% 80%

59 -| 72 4 20% 100%

20

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(36)

ETÀ

1 5.0 5.0

2 10.0 15.0

1 5.0 20.0

2 10.0 30.0

1 5.0 35.0

1 5.0 40.0

1 5.0 45.0

1 5.0 50.0

1 5.0 55.0

1 5.0 60.0

1 5.0 65.0

1 5.0 70.0

1 5.0 75.0

1 5.0 80.0

1 5.0 85.0

1 5.0 90.0

1 5.0 95.0

1 5.0 100.0

20 100.0

33 35 37 38 41 44 46 50 51 53 54 55 56 59 60 62 63 71 Totale

Frequenze % % cumulate

classe freq. % % cumulate 33 |- 42 7 35% 35%

42 |- 56 7 35% 70%

>=56 6 30% 100%

totale 20 100%

•  Numero di classi: 3

•  Frequenza assoluta costante in ogni classe:

20/3=6,7

•  Frequenza percentuale costante in ogni classe:

100/3=33,3%

Classi di uguale frequenza

Lanalisi dei dati:

Suddivisione in classi

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(37)

Lanalisi dei dati:

La distribuzione in

classi di uguale ampiezza

Tempo per raggiungere la Facoltà (in min.)

Frequenze assolute

(n

i

)

Freq.

Relative (f

i

)

Freq.

percentuali (p

i

)

Freq. ass.

cumulate (N

i

)

Freq. rel.

cumulate (F

i

)

Freq. % cumulate

(P

i

)

0-|20 84 0,370 37,0 84 0,370 37,0

20-|40 81 0,357 35,7 165 0,727 72,7

40-|60 44 0,194 19,4 209 0,921 92,1

60-|80 8 0,035 3,5 217 0,956 95,6

80-|100 0 0,000 0,0 217 0,956 95,6

100-|120 4 0,018 1,8 221 0,974 97,4

120-|140 6 0,026 2,6 227 1,000 100,0

227 1,000 100,0

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(38)

Lanalisi dei dati:

La distribuzione in

classi di ampiezza diversa le densità di frequenza

Tempo per raggiungere la Facoltà (in min.)

Frequenze assolute

(ni)

Freq.

Relative (fi)

Freq.

percentuali (pi)

Freq. ass.

cumulate (Ni)

Freq. rel.

cumulate (Fi)

Freq. % cumulate

(Pi)

Densità di frequenza

(di)

0-|60 84 0,370 37,0 84 0,370 37,0 1,4

60-|80 81 0,357 35,7 165 0,727 72,7 4,0

80-|120 44 0,194 19,4 209 0,921 92,1 1,1

120 -|140 18 0,079 7,9 227 1,000 100,0 0,9

227 1,000 100,0

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(Rapporto tra la frequenza e l’ampiezza

della classe)

(39)

Dove e come studiare

Esercizio n. 1 – punto 2

File “esercizi indici sintetici.pdf”

•  Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.

Cap. 1

•  Libro di testo: S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.

Cap. 1, Cap. 2,

(40)

Lanalisi dei dati:

Rappresentazioni grafiche

Illustrare mediante figure, linee o segmenti, aree, solidi, simboli convenzionali una distribuzione di frequenza o

di intensità, in funzione delle modalità, qualitative o quantitative, di uno o più caratteri

Vantaggi:

•  confronto tra più distribuzioni

•  mette in rilievo casi anomali

•  potenza divulgativa

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(41)

Lanalisi dei dati:

I grafici: Caratteri qualitativi e

caratteri quantitativi discreti

Freq.

Relative (fi)

4,4 28,2 62,1 5,3 100,0 Tipo diploma

Frequenze assolute

(ni)

Liceo classico 10

Liceo scientifico 64

ITC 141

Altro 12

Totale 227

Freq.

percentuali (pi)

4,4 28,2 62,1 5,3 100,0 5,3%

62,1%

28,2%

4,4%

Altro

ITC

Liceo scientifico Liceo classico

Altro ITC

Liceo scientifico Liceo classico

% 70

60

50

40

30

20

10 0

•  Pie-chart

•  Bar chart

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(42)

Lanalisi dei dati:

I grafici: Variabili continue Istogramma

Freq.

min.

Classi di ampiezza diversa Sull’asse ordinate dobbiamo mettere la densità di frequenza

0 10 20 30 40 50 60 70 80 90

20 40 60 80 100 120 140

Tempo per raggiungere la Facoltà (in min.)

Frequenze assolute

(n

i

)

Freq.

Relative (f

i

)

Freq.

percentuali (p

i

)

Freq. ass.

cumulate (N

i

)

Freq. rel.

cumulate (F

i

)

Freq. % cumulate

(P

i

)

0-|20 84 0,370 37,0 84 0,370 37,0

20-|40 81 0,357 35,7 165 0,727 72,7

40-|60 44 0,194 19,4 209 0,921 92,1

60-|80 8 0,035 3,5 217 0,956 95,6

80-|100 0 0,000 0,0 217 0,956 95,6

100-|120 4 0,018 1,8 221 0,974 97,4

120-|140 6 0,026 2,6 227 1,000 100,0

227 1,000 100,0

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(43)

Lanalisi dei dati:

I grafici: Variabili continue Istogramma

Densità

min.

Classi di ampiezza diversa

Tempo per raggiungere la Facoltà (in min.)

Frequenze assolute

(n

i

)

Densità di frequenza

(d

i

)

0-|60 84 1,4

60-|80 81 4,0

80-|120 44 1,1

120 -|140 18 0,9

227

0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0

60 80 120 140

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(44)

Lanalisi dei dati:

I grafici: Variabili continue Istogramma

grafico costituito da barre non distanziate, con basi in generale diverse, dove ogni barra possiede un ’ area proporzionale alla corrispondente frequenza

area di ogni rettangolo = frequenza (densità x ampiezza della classe) Ã

Ä (frequenza/ampiezza della classe)

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(45)

Reddito pro capite 1997 (in milioni di lire)

31.0 30.0 29.0 28.0 27.0 26.0 25.0 24.0 23.0 22.0 21.0 20.0 19.0 18.0 17.0 16.0 15.0 14.0 16 14 12 10 8 6 4

2 0

Reddito pro capite 1997 (in milioni di lire)

30.6 28.8 27.0 25.2 23.4 21.6 19.8 18.0 16.2 14.4 30

20

10

0

Lanalisi dei dati:

I grafici: Variabili continue Istogramma

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(46)

Lanalisi dei dati:

I grafici: Variabili continue e discrete

Rappresentazione a ramo e foglia

unità età

1 35

2 37

3 59

4 54

5 44

6 38

7 62

8 71

9 56

10 60

11 33

12 46

13 41

14 53

15 38

16 55

17 50

18 63

19 35

20 51

•  ramo: numeri interi iniziali dei dati

•  foglia: numeri interi finali dei dati

Presenta i dati sia in forma tabellare che grafica Frequenza Ramo & Foglia

6 3 . 355788 3 4 . 146

7 5 . 0134569 3 6 . 023

1 7 . 1 Ampiezza ramo: 10

Ogni foglia: 1 caso

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(47)

Lanalisi dei dati:

Le statistiche univariate

analisi delle distribuzioni di frequenza

Rappresentazioni grafiche

Indici sintetici

Distribuzioni di frequenza

Suddivisioni in classi

Istogrammi, boxplot, steam and leaf

Tendenza centrale Variabilità

Forma

Grafici a barre Grafici a torta

Istogrammi Boxplot

Steam and leaf

Distribuzioni di frequenza

Suddivisioni in classi

Istogrammi, boxplot, steam and leaf

Tendenza centrale Variabilità

Forma

Grafici a barre Grafici a torta

Istogrammi Boxplot

Steam and leaf

Definizione del problema

Raccolta dei dati

Scelta del metodo di analisi Conclusioni

Interpretazione dei risultati

(48)

Dove e come studiare

Esercizio n. 1 – punto 3 e punto 4 Esercizio n.3 – punto a, b, c

Esercizio n. 7 – punto a e b Esercizio n. 8 – punto a Esercizio n. 10 – punto a

File “esercizi indici sintetici.pdf”

•  Libro di testo: D. Piccolo (2004) – Statistica per le decisioni – Il Mulino.

Cap. 1

•  Libro di testo: S. Borra, A. Di Ciaccio (2004) – Statistica – Metodologie per le scienze economiche e sociali – McGraw-Hill.

Cap. 1, Cap. 2,

(49)

Ricapitolando…..

•  La distribuzione di frequenza è una particolare tipologia di rappresentazione dei dati statistici

•  Per illustrare una distribuzione di frequenza è necessario costruire una tabella statistica la quale deriva dalla classificazione dei dati

statistici tale che, ad ogni modalità o classe di

modalità di uno o più caratteri, corrisponde la

rispettiva frequenza assoluta o relativa

(50)

Modalità di x

Frequenze

x

1

n

1

x

2

n

2

: :

x

i

n

i

: :

x

r

n

r

Totale n

Età

studenti del corso

Frequenz e

assolute

x n

18 2

19 44

20 55

21 32

22 18

23 13

24 9

25 6

Totale 179

Variabile

Modalità

1° caso : creazione della tabella statistica di un carattere (variabile) con le sue

modalità e le relative frequenze (assolute)

(51)

Esercizio n.1

Qual è la proporzione di studenti con meno di 23 anni???

Età studenti del corso

Frequenze assolute

x n

18 2

19 44

20 55

21 32

22 18

23 13

24 9

25 6

Totale 179

(52)

Età studenti del corso

Frequenze assolute

x n

18 2

19 44

20 55

21 32

22 18

23 13

24 9

25 6

Totale 179

Frequenze relative

f 0,011 0,246 0,307 0,179 0,101 0,073 0,050 0,034 1,000

Frequenze relative cumulate

F 0,011 0,257 0,564 0,743 0,844 0,916 0,966 1,000

f

2/179

44/179 f 0,246+0,011 F

(53)

Rappresentazione Grafica di una Variabile Discreta Una variabile discreta può essere rappresentata con:

Grafico a barre Diagramma a torta

0 10 20 30 40 50 60

18 19 20 21 22 23 24 25

Frequenze assolute

Frequenze assolute

Frequenze assolute

18 19 20 21 22 23 24 25

In ascissa sono rappresentate le modalità della variabile e in

ordinata le frequenze (assolute o relative) di ciascuna modalità

L’area della torta viene divisa per il numero di modalità della variabile.

L’ampiezza dello spicchio è

determinata dalla frequenza della

modalità

(54)

Esercizio n.2

Posizione professionale

1 3 4 2 1 4 2 2 3 4 1 3 1 2 2 2 3 1 4 4

n

Posizione profession ale

Frequenze

1 5

2 6

3 4

4 5

Totale 20

f

f 0,25

0,3 0,2 0,25

1

F 0,25 0,55 0,75

1

0 0,1 0,2 0,3 0,4

1 2 3 4

f

f

0 2 4 6 8

1 2 3 4

Frequenze n

Frequenze n

1= apprendista; 2= operaio; 3=impiegato; 4= dirigente

Rappresentare graficamente la distribuzione di frequenza

della variabile POSIZIONE PROFESSIONALE

(55)

2°caso: creazione della tabella statistica di una variabile continua (con modalità raggruppate in classi) e le relative frequenze

Classi di modalità di X

Frequenze

x

1

˧ x

2

n

1

x

2

˧ x

3

n

2

:

:

x

i

˧ x

i+1

n

i

: :

x

r

˧ x

r+1

n

r

Totale n

Classi ore di straordinario

Frequenze

50 ˧ 60 2

60 ˧ 65 0

65˧ 80 1

80 ˧ 100 2

100 ˧ 150 6

150 ˧ 175 3

175 ˧ 200 1

200 ˧ 270 5

variabile

Questo simbolo indica

che la classe è aperta a

sinistra, quindi il limite

inferiore è escluso dalla

classe.

(56)

Rappresentazione grafica di una Variabile Continua

Classi ore di straordinario

Frequenze

50 ˧ 60 2

60 ˧ 65 0

65˧ 80 1

80 ˧ 100 2

100 ˧ 150 6 150 ˧ 175 3 175 ˧ 200 1 200 ˧ 270 5

L’ampiezza delle classi è diversa, è quindi necessario utilizzare la densità di frequenza

2/(60-50)

d

Densità di frequenza 0,2

0 0,066 0,1 0,12 0,12 0,04 0,07

(57)

Esercizio n.3

Dividere la variabile età in 3 classi di uguale ampiezza, rappresentando la variabile ETA’ con i grafici opportuni.

età frequenze

33 1

35 2

37 1

38 2

41 1

44 1

46 1

50 1

51 1

53 1

54 1

55 1

56 1

59 1

60 1

62 1

63 1

71 1

Ampiezza della classe

(7133)/3 13

Classi d'età Frequenza

33 ˧ 46 8

46 ˧ 59 7

59˧ 72 5

(58)

La raccolta dei dati

ü  Le fasi di una ricerca quantitativa

ü  Indagini censuarie e indagini campionarie ü  Variabili quantitative e qualitative

Lorganizzazione dei dati: tabelle e grafici ü  Tipi di tabelle

ü  Le distribuzioni statistiche (frequenze assolute, percentuali, cumulate)

ü  Suddivisione in classi di un carattere quantitativo (classi di ampiezza costante e di ampiezza diversa)

ü  Rappresentazione ramo-foglia

ü  Rappresentazioni grafiche per caratteri qualitativi

ü  Istogramma (classi di ampiezza costante e di ampiezza diversa)

Riepilogo

Riferimenti

Documenti correlati

La produzione dell ’ ultima settimana è stata effettuata impiegando un nuovo tipo di materiale sulla cui qualità il responsabile della produzione avanza seri dubbi.

L ’ altezza delle matricole universitarie di sesso maschile può essere considerata una variabile con distribuzione Normale, con media incognita e varianza pari a

La casualità interviene nella selezione delle unità e si ottiene attribuendo ad ogni unità della popolazione una probabilità nota e diversa da zero di essere

Un sistema informativo aziendale deve raccogliere, processare, immagazzinare e distribuire informazione al fine di facilitare i processi di pianificazione, decisione

Il 5% dei pneumatici prodotti dal turno di giorno erano difettosi, mentre la percentuale di prodotti difettosi era pari al 10% di quelli prodotti dal turno di sera e al 20% di

Il corso di laurea magistrale in Scienze delle amministrazioni e delle organizzazioni complesse si propone di fare acquisire agli studenti, poi laureati nella classe,

Giuseppe Liotta (Università degli Studi di Palermo) La responsabilità per danni nello sport.

altresì, di preparare i giovani ad affrontare i problemi e le sfide che pongono la globalizzazione e la necessità della sua gov Oggetto del Corso è lo studio delle differenti