Tipi di variabili e la loro misurazione. Classificazione delle proprietà, classificazione delle variabili: perché è importante?

(1)

Tipi di variabili Tipi di variabili

e la loro misurazione e la loro misurazione

Classificazione delle proprietà, classificazione delle

variabili: perché è importante?

(2)

TIPI DI PROPRIETA’

a seconda della natura della relazione che esiste tra gli stati sulla proprietà è possibile individuare 5 classi di proprietà:

DISCRETE assumono un set fisso di valori discontinui e mutuamente esclusivi.

Si passa da un numero intero al successivo

proprietà categoriali (con categorie)

CONTINUE assumono un numero infinito di valori come in un

continuum; esiste un gran numero di valori potenziali intermedi.

non misurabili;

misurabili.

(3)

Stati della proprietà

Procedura di operativizzazio ne

Tipo di variabile

Caratteristiche

dei valori Operazioni effettuabili sui valori

Non ordinati Classificazione Nominale Nomi = ≠ Ordinati Ordinamento Ordinale Numeri con le

sole propr.

Ordinali

= ≠ > <

Continui Discreti

Misurazione Conteggio

Cardinale Numeri con le

propr. cardinali = ≠ > < + − ×÷

LA MISURAZIONE delle VARIABILI

(4)

1. VARIABILI NOMINALI 1. VARIABILI NOMINALI

La proprietà assume stati discreti non ordinabili Cioè: gli stati sono finiti e non è possibile stabilire

un ordine o una gerarchia

Esempi: genere, religione, nazionalità, ecc.

Gli stati della proprietà sono definiti CATEGORIE, mentre sono VALORI i simboli assegnati alle

categorie operativizzate (le cosiddette

MODALITÀ)

(5)

La procedura di operativizzazione è la CLASSIFICAZIONE

Le CATEGORIE devono essere:

- esaustive

- mutuamente esclusive

Possiamo soltanto dire che i valori sono

= o ≠

(6)

2. VARIABILI ORDINALI 2. VARIABILI ORDINALI

La proprietà assume stati discreti ordinabili Es.: titolo di studio

Vi attribuiamo dei valori che devono rispettare l’ordine crescente (o decrescente) degli stati

1= nessun titolo

2= scuola elementare 3= scuola media

4= scuola superiore 5= laurea

6= post-laurea

(7)

La procedura di operativizzazione delle proprietà è l’ORDINAMENTO

Le proprietà possono essere ordinali per due motivi:

- derivano da proprietà originariamente costituite da stati discreti

- derivano da proprietà continue che derivano da uno

strumento di misurazione creato dal ricercatore (è il caso

delle domande che prevedono risposte graduate: molto,

abbastanza, poco, per niente)

(8)

3. VARIABILI CARDINALI 3. VARIABILI CARDINALI

I numeri che identificano le modalità della variabile non sono etichette,

ma hanno un pieno significato numerico

Es. età, n° di figli, altezza, peso, n° di addetti di

un’azienda

(9)

Possiamo applicare due processi di operativizzazione:

-la misurazione: quando la proprietà è continua e possediamo un’unità di misura

-il conteggio: quando la proprietà è finita (ha stati

finiti, non frazionabili) ed esiste un’unità di conto

Es. altezza, numero di figli

(10)

4. VARIABILI QUASI-CARDINALI 4. VARIABILI QUASI-CARDINALI

Sono “quasi” cardinali, perché per misurare gli atteggiamenti e le opinioni delle

persone non esistono unità di misura

Sono rappresentate da proprietà continue, misurate attraverso la tecnica delle scale

Irraggiungibilità dell’obiettivo di attribuire pieno significato numerico

(11)

TECNICA DELLE SCALE (

TECNICA DELLE SCALE ( scaling scaling ) )

L’applicazione più comune della tecnica delle scale è quella di misurare gli atteggiamenti Esistono 3 tipi di scale:

- Con risposte semanticamente autonome (titolo di studio)

- Con risposte a parziale autonomia semantica

(molto, abbastanza, poco…)

(12)

Scale auto-ancoranti

Come giudicherebbe il suo stato di salute?

Ottimo pessimo

(13)

Variabile in Variabile in

sede di sede di raccolta raccolta

Variabile in Variabile in sede di analisi

sede di analisi Caratteristiche Caratteristiche

Variabili enumerate

Variabili cardinali Es. n. figli

Ordinate; cardinali; mutuamente esclusive

Variabili metriche Variabili cardinali Es. età, reddito

Ordinate; cardinali; mutuamente esclusive

Variabili ottenute da tecniche auto- ancoranti

Variabili quasi-

cardinali Ordinate; mutuamente esclusive, equidistanti

Variabili ottenute

da tecniche di Variabili

categoriali Ordinate, mutuamente esclusive, equidistanti

(14)

Proprietà

Proprietà Definizione Definizione Operativa Operativa

Tipo di variabile

Tipo di variabile Esempi Esempi

Con stati enumerabili

Conteggio Variabile

Enumerata (cardinale)

N° figli…

Continue misurabili

Misurazione Variabile metrica (cardinale)

Peso;

Altezza…

Continue senza

unità di misura Tecniche di scaling Variabili categoriali (ordinate)

Atteggiamenti,opi nioni,

valori…

Discrete Rilevazione Variabili Sesso,

(15)

Occupazione 1. Non occupato 2. Studente

3. Lavoratore autonomo 4. Lavoratore dipendente 5. Casalinga

6. Pensionato Titolo di studio

1. Maturità liceale classica 2. Maturità liceale scientifica

3. Maturità liceo socio-psico-pedagogico 4. Diploma Tecnico/Professionale

5. Diploma Tecnico Commerciale Stato Civile:

(16)

Confessione religiosa 1. cattolico

2. protestante 3. musulmano 4. ateo

5. altro

Titolo di studio

1. Dottorato o specializzazione 2. Laurea

3. Diploma universitario

4. Diploma di scuola media superiore 5. Licenzia di scuola media inferiore 6. Licenza elementare

7. Nessun titolo

(17)

Grado di soddisfazione per il proprio lavoro

1. per niente 2. poco

3. abbastanza 4. molto

Grado di soddisfazione per il luogo in cui si vive (punteggio da 1 minima

soddisfazione a 10 massima soddisfazione)

|_1_||_2_||_3_||_4_||_5_||_6_||_7_||_8_||_9_||_10_|

Numero di abitanti del comune di residenza 1. più di 500.000 abitanti

2. tra 500.000 e 100.000 abitanti 3. tra 100.000 e 50.000 abitanti

(18)

Voto riportato all’esame di maturità !__|__|__|

Reddito mensile individuale 1. Meno di €500

2. €501 - €1000 3. €1001 – €2000 4. €2001– €3000 5. Oltre €3000

Mezzo di trasporto utilizzato maggiormente 1. Auto propria

2. Moto o motorino 3. Mezzi pubblici 4. Taxi

Regione di residenza 1. Piemonte

2. Valle d Aosta 3. Lombardia

4. Trentino-Alto Adige 5. Bolzano

6. Trento 7. Veneto

8. Friuli-Venezia Giulia 9. Liguria

10. Emilia-Romagna 11. Toscana

12. Umbria 13. Marche 14. Lazio 15. Abruzzo 16. Molise 17. Campania 18. Puglia

(19)

Il livello economico-finanziario del suo nucleo familiare le consente di

vivere…

1. Con molte difficoltà 2. Con difficoltà

3. Con qualche difficoltà 4. Abbastanza facilmente 5. Facilmente

6. Molto facilmente

Condizione lavorativa dei genitori 1. Ambedue i genitori occupati

2. Padre occupato, madre casalinga 3. Coppia in altra condizione

4. Un solo genitore

Persone o servizi che si occupano del bambino quando la madre lavora

(20)

Posizione contrattuale

1. contratto a tempo indeterminato 2. contratto a tempo determinato 3. contratto di lavoro interinale 4. contratto di formazione e lavoro 5. contratto di apprendistato

6. nessun contratto specifico

Per migliorare la vita cosa è necessario avere

più reddito

più tempo libero

più possibilità di lavoro più amicizie

più agevolazioni per la creazione di una nuova famiglia

(21)

Definire il campo di osservazione

(22)

Definizione del campo di osservazione

• Il campo d’osservazione di un’inchiesta è

spesso molto ampio e, come tale, può risultare fuori della portata dei ricercatori, per ragioni di carattere pratico, organizzativo, economico, ecc.

• In una situazione del genere, è necessario

delimitare il campo di osservazione sulla base di

criteri adeguati e esplicitati.

(23)

• CAMPIONAMENTO

È il procedimento logico in base al quale

l’insieme delle procedure per la costruzione del campione si salda alla teoria della stima e della verifica delle ipotesi.

• DISEGNO DI CAMPIONAMENTO

È l’insieme delle regole seguite per la

costruzione del campione.

(24)

Struttura del campione:

insieme delle liste che si utilizzano per costruire il campione. La lista comprende l’elenco di tutte le unità che compongono l’universo.

Se la struttura del campione è semplice:

una lista.

Se la struttura del campione è complessa:

più liste.

(25)

La popolazione è intesa come aggregato di unità statistiche.

Le caratteristiche e le proprietà della popolazione che si intendono studiare sono definite variabili o caratteri.

Possiamo ottenere le informazioni sulle variabili attraverso due metodi:

- Rilevazione totale o censuaria (si analizzano tutte le unità che compongono l’universo)

- Rilevazione campionaria (studio per inferenza

(26)

Universo statistico e campionamento

• L’universo statistico di una ricerca è l’insieme dei casi

(unità) coinvolti nel problema oggetto d’indagine, con una numerosità uguale a N;

• Il campione è l’insieme delle n (unità campionarie) selezionate tra le N che compongono la popolazione, detta popolazione di riferimento. Un campione estratto dall’universo è un sottoinsieme di esso, con una

numerosità pari a n, con n < N.

• Ad esso si ricorre quando non è possibile una rilevazione

(27)

Rappresentatività del campione

• Requisito fondamentale di un campione è la sua rappresentatività.

• Un campione è rappresentativo se è tale da riprodurre, con un margine di approssimazione controllabile, le

caratteristiche dell’universo da cui è stato estratto.

• La rappresentatività consente di estendere all’intero universo i risultati ottenuti indagando il campione.

(generalizzazione o inferenza)

(28)

(Rappresentatività del campione, continuazione)

• La rappresentatività di un campione dipende:

- dall’omogeneità/eterogeneità dell’universo;

- dal criterio di campionamento utilizzato;

- dalla numerosità n, che deve essere sufficiente in rapporto alla numerosità N dell’universo.

I campioni probabilistici sono i soli a poter essere

considerati, a rigore, statisticamente rappresentativi.

(29)

1. Eterogeneità: presenza di caratteristiche e qualità diverse nel campione, collegate alla variabilità degli atteggiamenti e dei

comportamenti

2. Rappresentatività: si dice rappresentativo un campione che presenta alcune

caratteristiche dell’universo in proporzioni analoghe

3. Sufficienza: misura l’attendibilità dei dati, ovvero la probabilità che essi siano validi per l’universo entro certi termini

statisticamente determinabili

(30)

Vantaggi del campionamento:

- Riduzione dei costi - Rapidità

- Scopi specifici

- Accuratezza

(31)

Tipi di campione

Campioni probabilistici:

• campione casuale semplice;

• campione casuale stratificato;

• campione casuale sistematico;

• campione a più stadi.

• campione a grappoli

Campioni non probabilistici:

• Campionamento a casaccio

• Campione di esperti

• Campionamento per quota

• Campionamento a scelta ragionata

• Campionamento a valanga o a catena o a palla di neve

• Campionamento telefonico / sistema CATI

• Campionamento di convenienza / di disponibilità

(32)

Dimensioni del campione

Quando si determinano le dimensioni del campione occorre tener conto di alcuni fattori:

•La dimensione della popolazione

•Le risorse disponibili e i limiti di tempo

•L’incisività dell’effetto

•Il numero dei sotto-gruppi da confrontare

•I tassi di rifiuto e di mortalità

(33)

Statistica descrittiva: è l’insieme delle procedure utili per organizzare i dati raccolti in forma conveniente e

comunicabile

Statistica inferenziale: è l’insieme delle

procedure atte a raggiungere conclusioni

più ampie rispetto ai valori raccolti, tali da

poter essere messi in relazione con

(34)

Vogliamo studiare le variabili (proprietà) X, Y, Z, di un certo campione.

Studiarle significa conoscere alcuni valori caratteristici assunti dall’intera

popolazione (cioè la loro

DISTRIBUZIONE) o le relazioni fra le variabili stesse.

Chiamiamo queste conoscenze

PARAMETRI

(35)

Esempi: se l’unità è l’individuo e la variabile X è il reddito e vogliamo conoscere il

reddito medio, il parametro della

popolazione che vogliamo conoscere è la MEDIA

Se la variabile Y è il voto e noi vogliamo

conoscere la proporzione di persone che

hanno votato il partito A, il parametro della

popolazione che vogliamo conoscere è

(36)

Se vogliamo studiare la relazione fra le

variabili X e Z, il parametro che vogliamo conoscere è un coefficiente di

CORRELAZIONE

(37)

Se conoscessimo la popolazione totale, avremmo il valore esatto del parametro

che stiamo studiando, ma questa è

un’ipotesi che non si verifica mai (se non nei casi di censimento)

L’indagine campionaria ci fornisce una

STIMA, un valore approssimato

(38)

È sempre presente un ERRORE nelle stime che calcoliamo

V = v ± e

Parametro della

popolazione Stima del

campione Errore di

campionamento

(39)

Quindi, se effettuiamo una rilevazione totale sul reddito degli italiani, possiamo dire:

“il reddito medio degli italiani è € 1.350”.

Se effettuiamo un rilevazione campionaria, diciamo:

“c’è il 95% di probabilità che il reddito medio

degli italiani sia di € 1.300 ± 50”

(40)

Nel secondo caso, il ricercatore non è certo del suo calcolo, c’è un 5% di probabilità che il reddito sia al di fuori dei valori

indicati.

Il ricercatore calcola un intervallo di fiducia nel quale si colloca il valore della statistica della popolazione.

La stima del campione è sempre affetta da

(41)

Determinazione della NUMEROSITÀ OTTIMALE del campione:

È la numerosità che permette alle stime che compiamo di raggiungere il livello di

attendibilità che ci attendiamo.

(42)

Ampiezza del campione

(43)

5% 5% 2% 2% 1% 1%

N n N n N n

100 80 100 96 100 99

300 170 300 270 300 296

500 220 500 415 500 475

1.000 285 1.000 715 1.000 910

5.000 370 5.000 1.660 5.000 3.330

(44)

Che cosa è possibile ottenere dai dati raccolti?

- Verifica delle ipotesi di contenuto (cioè le ipotesi di rapporti tra le variabili): si rimane nell’ambito dei risultati disponibili e tale

verifica è valida soltanto per le unità di analisi considerate.

valido per campioni NON PROBABILISTICI - Inferenze: si generalizzano i risultati dal

campione all’universo

(45)

CAMPIONI PROBABILISTICI CAMPIONI PROBABILISTICI

Campioni casuali o probabilistici: sono

regolati dalla legge del CASO, cioè della probabilità

Si attribuisce ad ogni unità della

popolazione una probabilità positiva di essere selezionata

Si utilizzano tecniche per la selezione

casuale del campione

(46)

• La probabilità di selezionare i casi è nota

• Per costruire un campione probabilistico è indispensabile la conoscenza

dell’universo; devono essere note e

disponibili le fonti (es. lista completa della popolazione)

• Le fonti possono anche definire universi

“settoriali”

(47)

Si possono costruire diversi tipi di

campioni probabilistici a seconda

del metodo di estrazione

(48)

1. Campione casuale semplice/sistematico

Può essere estratto per sorteggio o per intervallo fisso (scegliendo un nominativo ogni tot da una lista e prevedendo eventuali sostituti), fino a

raggiungere la numerosità desiderata.

Il rapporto tra la numerosità dell’universo e quella del campione dà la misura dell’intervallo fisso da rispettare.(intervallo di campionamento).

È opportuno su popolazioni relativamente piccole,

(49)

2. Campione stratificato

La popolazione viene suddivisa in STRATI.

Si mantiene l’estrazione casuale, ma si

utilizzano una o più variabili stratificanti, tali da controllare meglio la

rappresentatività dei casi selezionati.

Es.: per il reddito, si suddivide la

(50)

stratificazione

(51)

Il campione può essere proporzionale o non proporzionale.

Il campione si dice stratificato proporzionale se riproduce la stessa composizione degli strati della popolazione

Es. se operai, impiegati, lav.autonomi e

professionisti sono rispettiv. il 35, 40, 15 e 10% della popolazione, costruiremo un

campione di 1000 casi composto da 350

(52)

Invece, se sovra o sotto-rappresentiamo alcuni strati, otteniamo un campione

stratificato non proporzionale.

In questo caso, dovremo effettuare

un’operazione di ponderazione.

(53)

3. Campione a stadi

Si utilizza ad es. quando manca la lista completa delle unità della popolazione.

Viene definito sulla base di scelte e

procedure successive, che passano per più stadi o fasi.

Si individuano diverse unità (primarie,

secondarie…) e si procede con estrazioni

(54)

Es. ricerca sui medici di medicina generale Unità primaria: Ausl locale cui afferisce il

medico

Unità secondarie: i medici stessi

Il campionamento si effettua in due stadi, cioè in due estrazioni successive.

Primo: si estrae un campione di unità primarie (ad es. 100 aziende Ausl)

Secondo: si estrae casualmente un numero

(55)

4. Campioni a grappolo

Si utilizza quando la popolazione è naturalmente suddivisa in gruppi di unità contigue

Ad es. le famiglie, le classi scolastiche, i ricoverati in ospedale, ecc.

• L’unità di campionamento (sampling unit) è ora un gruppo o grappolo (cluster ) di unità della popolazione.

• Nel campionamento a grappolo si seleziona un campione casuale di grappoli e, nel caso di ispezione completa, tutte le unità ad esso

appartenenti sono oggetto di rilevazione.

• Questo campionamento sfrutta l’esistenza di raggruppamenti naturali della popolazione, essenzialmente legati alla contiguità spaziale o istituzionale, con un diverso intento rispetto alla

stratificazione: ottenere una convenienza dal punto di vista della

raccolta delle informazioni.

(56)

Schema di popolazione a stadi

(57)

CAMPIONI NON PROBABILISTICI CAMPIONI NON PROBABILISTICI

Seguono l’orientamento di chi li costruisce;

vengono costruiti senza conoscere la probabilità di estrazione dei casi.

Viene a mancare la conoscenza dell’universo

L’inferenza non si può applicare

(58)

 Campione “a casaccio”: costruito in modo accidentale, Campione “a casaccio”:

senza regole.

 A scelta ragionata: le unità sono scelte in modo da A scelta ragionata avvicinarsi nell’insieme alle caratteristiche della

popolazione

 Per quote: l’intervistato sceglie le unità da intervistare, Per quote:

ma deve rispettare le quote di popolazione che rappresentano determinate caratteristiche

 A palla di neve (a valanga) A palla di neve (a valanga)

(59)

Un caso concreto

• Indagine identità e bisogni del volontariato in Toscana

• Rilevazione delle OdV

- Campione teorico: 840 unità di rilevazione distribuite su tutto il territorio toscano (28% tot ODV archivio Cesvot) intervallo d confidenza del 99%

- Tasso di caduta tra il 25-30%

- Ritorno 600-650 odv; intervallo confidenza del 95%

errore campionamento 3,6%;

- 400 odv errore campionamento del 5%

- Rilevazione volontari:

- Unità di rilevazione. ODV campionate

(60)

Lo schema di riferimento ha previsto l’individuazione da parte del Presidente di un massimo di 12 volontari secondo i seguenti criteri:

• una prima dicotomizzazione

riguardante i volontari attivi e quelli meno attivi;

• una seconda dicotomizzazione riguardante maschi e femmine;

• una terza differenziazione riguardante le fasce d’età suddivise in giovani,

adulti, anziani;

(61)

Un ulteriore esemplificazione

• Survey OPS – anziani – giovani - adulti

• Confini anagrafici di ogni singolo target

• 14-24 giovani

• 25-59 adulti

• 60 oltre per gli anziani

• Campionamento stratificato per sesso e

(62)

La raccolta dati:

IL QUESTIONARIO E L’ANALISI DEI DATI

(63)

PROGETTAZIONE DEL QUESTIONARIO

1. Costruzione dello schema concettuale:

definizione degli argomenti da

2. Redazione del questionario:

a. Formulazione delle domande tenendo conto

(64)

LA FORMULAZIONE DI UN QUESTIONARIO è UN’ IMPRESA

COMPLICATA E DIFFICILE CHE RICHIEDE UN LUNGO IMPEGNO

ED UNA GRANDE ATTENZIONE

Si tratta di un lavoro che è difficile formalizzare …..

per il quale non esistono regole

precise ….. al massimo si possono

(65)

In generale per la stesura di un buon questionario sono necessari:

• l’esperienza del ricercatore;

• la conoscenza della popolazione alla quale il questionario viene somministrato;

• la chiarezza delle ipotesi di ricerca

(66)

QUESTIONARIO

Formulazione

strutturata di domande con cui misuriamo quantitativamente i

fenomeni

(67)

LE DOMANDE

traduzione delle IPOTESI DI RICERCA

in INDICATORI EMPIRICI

(68)

CHE LE DOMANDE MISURINO

ADEGUATAMENTE I CONCETTI TEORICI

Il DISEGNO DEL QUESTIONARIO deve riuscire a combinare questi due aspetti

CHE IL CAMPIONE DEGLI

INTERVISTATI RISPONDA

ADEGUATAMENTE ALLE DOMANDE

(69)

Esiste un problema relativo alla definizione dei concetti, del loro uso, della loro struttura interna

È quindi necessità esplorare al loro interno i concetti stessi cercando di:

coglierne il senso definirne la struttura e la

composizione interna Il grande problema nell’analisi dei concetti è la

crescente

Analisi interna

Insieme di caratteri che ne

determinano la fisionomia

generale

Un concetto esiste perché è costituito da parti

componenti

(70)

Dal concetto alla costruzione degli items

Concetti

Struttura del concetto

Elementi che compongono il concetto

Proposizioni che esprimono il concetto Gli items che esprimono

gli elementi Indicatori

(71)

CONCETTI

ITEMS

ELABORAZIONI

(72)

Concetti

Elementi che compongono il concetto

items

Eleborazioni Processo di flessibilizzazione

Analisi del contesto

Definizione di altri concetti

con i quali correlarsi

(73)

Gli “elementi” e le

“proposizioni” in cui si articola il concetto hanno una struttura molto semplice

Gli items possono a loro volta avere una struttura molto

semplice

oppure

Gli “elementi” e le

“proposizioni” in cui si articola il concetto hanno una struttura molto complessa

Indicatori Indici

Gli items possono a loro volta avere una struttura molto

2 Ipotesi

(74)

CONCETTUALIZZAZIONE TEORICA

DEFINIZIONE OPERATIVA

OPERAZIONALIZZAZIONE EMPIRICA

COSTRUZIONE DI UN SISTEMA DI

INDICATORI VARIABILI DEFINIZIONE

NOMINALE

(75)

QUESTIONARIO

GLI INDICATORI VENGONO “tradotti” IN DOMANDE NEL QUESTIONARIO

INDICATORI DOMANDE

(76)

DOMANDE

CLASSIFICAZIONI

Domande fattuali

riguardano i fatti e tutto ciò che è osservabile dall’esterno

Domande relative a proprietà

Domande motivazionali

riguardano opinioni,

atteggiamenti, motivazioni, orientamenti, sentimenti, valutazioni, giudizi, valori

Domande

Domande chiuse

Domande aperte

(77)

LA FORMULAZIONE DELLE DOMANDE

Semplicità di linguaggio

Lunghezza delle domande

Numero delle alternative di

risposta

Espressioni in gergo

Domande sintatticamente complesse (doppia

negazione)

Domande non discriminanti Domande

tendenziose (dette anche viziate o a risposta pilotata)

Domande con risposta non

univoca

Concretezza- astrazione

Desiderabilità sociale delle

risposte

(78)

Il problema delle alternative di scelta

• A due alternative contrapposte: SI/NO VERO/FALSO

• A due alternative con possibilità di fuga: SI/NO/NON SO

• A tre alternative: NESSUNA/POCHE/MOLTE

• A quattro alternative dicotomizzate: NESSUNA/POCA/ABBASTANZA/MOLTA

(79)

SCALE DI MISURAZIONE

La scala è un insieme coerente di domande (o elementi o items) che si propongono di misurare il grado di condivisione che i soggetti hanno di un particolare concetto. Gli elementi sono pertanto considerati indicatori di un

concetto più generale

Lo scopo è di cogliere le diversità fra gli intervistati sulla proprietà che viene rilevata (capacità di discriminare su opinioni diverse)

L’elemento è dunque il singolo componente:

Affermazione Domanda

(80)

MISURA DEGLI ATTEGGIAMENTI

CONCETTO GENERALE ATTEGGIAMENTO

CONCETTI SPECIFICI

OPINIONI

TENDENZA DI FONDO NON DIRETTAMENTE RILEVABILE

MODO ATTRAVERSO CUI LA TENDENZA DI FONDO EMERGE

(81)

Numero delle dimensioni teoriche (parti del conglomerato teorico in cui è possibile scomporre un concetto) che intendiamo far entrare nella scala

Il compito del ricercatore è:

1. Individuare tutti i sottoinsiemi nei quali viene ad articolandosi il concetto;

2. Restringere ad un numero ragionevolmente basso i sottoinsiemi possibili;

3. Isolare i sottoinsiemi più significativi;

4. Trovare una formulazione corretta capace di coinvolgere i soggetti intervistati in ciascun sottosistema in modo da ottenere una risposta significativa.

(82)

La scala Likert consiste in una serie di affermazioni, comunemente chiamate “items”, semanticamente collegate tra loro (chiamiamo questo

collegamento semantico “dimensione concettuale”)

Ognuna delle domande viene sottoposta agli intervistati sulla stessa gamma di possibili giudizi (molto d’accordo, abbastanza d’accordo, né

d’accordo né in disaccordo, in disaccordo, molto in disaccordo)

Il termine scala

indica l’insieme dei giudizi che vengono associati in una

comune dimensione concettuale.

La combinazione degli items in una scala dà luogo ad un indice

Con il termine batteria si intende generalmente l’insieme di più domande (items)

relative a più scale, associate in un unico modello di possibile

risposta

(83)

Punti deboli:

I processi di automatismo nella risposta respon-set ossia serie di risposte identiche

acquiescent respon sets

Indicazioni e suggerimenti

operativi

1. In una batteria di domande cercare di mescolare il più possibile fra loro gli items relativi alle varie scale;

(84)

Trattamento statistico dei dati

CODIFICA E ANALISI DEI

DATI

(85)

La matrice dei dati

La matrice dei dati è una matrice con i casi in riga e le variabili generate dal questionario in colonna:

V ¹ V ² …….

. V ⁿ U ¹ C ¹¹ C ¹² C ¹ⁿ U ² C ²¹ C ²² C ²ⁿ

…..

U C C C

(86)

Definizione del piano di codifica

Il piano di codifica consiste nell’elenco numerato di tutte le variabili generate dal questionario, ciascuna riportata con le rispettive modalità e i valori ad esse associati.

Il rapporto tra il numero di stati di una proprietà che

consideriamo nel piano di codifica e il numero di stati differenti che quella proprietà può effettivamente

assumere determina la sensibilità.

(87)

…il piano di codifica

Il numero delle variabili che compare nel piano di

codifica – e, di conseguenza, nella matrice dei dati - è maggiore di quello delle domande presenti nel

questionario se nel questionario sono contemplate:

• domande che ammettono risposte multiple;

• domande che corrispondono a uno o più insiemi di

indicatori per ciascuno dei quali è possibile costruire

(88)

TIPI DI PROPRIETA’

DISCRETE

•proprietà categoriali (con categorie) non ordinate;

•proprietà categoriali (con categorie) ordinate;

•proprietà cardinali;

CONTINUE

•proprietà continue non misurabili;

•proprietà continue misurabili.

(89)

Proprietà e variabili ordinali

A differenza delle variabili categoriali, nelle ordinali gli stati sono già ordinati nella realtà o si può pensare un criterio intersoggettivo per ordinarli.

Il criterio adottato per ordinare i codici deve essere lo stesso di quello che percepiamo tra gli stati.

Infatti, la serie dei codici deve avere una relazione monotonica diretta con l’ordine degli stati nella realtà.

Solitamente alle categorie si assegnano come codici i numeri

(90)

Proprietà discrete cardinali e variabili cardinali

L’autonomia semantica delle categorie di una variabile cardinale è molto ridotta, generalmente va poco oltre l’aspetto meramente numerico.

Si può individuare la mediana, calcolare la media e alcuni valori caratteristici.

La variabilità, ovvero la dispersione dei dati intorno alla media si rileva con:

-devianza, ovvero la somma degli scarti quadratici dalla media

∑xi²

-varianza, ovvero la devianza rapportata alla numerosità della popolazione o al numero dei casi in esame

s²= ∑xi²/N

-scarto tipo (deviazione standard) , ovvero la radice quadrata della varianza, rende la misura comparabile anche con altre grandezze lineari

s= √∑xi²/N

(91)

Scale ordinali per somma

Items Punteggi

disaccordo accordo

• Item 1 0 1

• Item 2 0 1

• ……. 0 1

• Item N 0 1

Indice di ciascun soggetto =  dei punteggi attribuiti agli items Indice min. = 0 (disaccordo con tutti gli items)

Indice max. = N (accordo con tutti gli items)

(92)

Scale ordinali di Likert

Items Punteggi

max max

disacc. acc.

• Item 1 1 2 3 4 5

• Item 2 1 2 3 4 5

• ……. 1 2 3 4 5

• Item N 1 2 3 4 5

Indice di ciascun soggetto =  dei punteggi attribuiti agli items Indice min. = 1 x N (max disaccordo con tutti gli items)

(93)

Scale a intervalli di Thurstone

• Formulazione di un numero elevato di items, indicatori del concetto associato alla proprietà considerata.

• Un gruppo di “giudici” valuta l’intensità con cui ciascun item indica la proprietà considerata, collocandolo in una posizione tra 11:

A B C D E F G H I J K con A=intensità minima e K=intensità massima

• Eliminazione degli items ciascuno collocato dai diversi “giudici” su posizioni troppo lontane.

• Calcolo, per ciascun item rimasto di:

a. valore associato alla mediana (valore scalare dell’item)

b. differenza interquartilica (indicatore del livello di omogeneità

delle collocazioni di quell’item da parte dei diversi giudici).

(94)

Procedure di analisi dei dati

Descrivere i dati: analisi monovariata

Analizzare i dati: analisi bivariata

(95)

Procedure di analisi dei dati

Sui dati della matrice, trascritta su supporto

informatico e utilizzando il software disponibile per la ricerca sociale, è possibile applicare le procedure di analisi statistica consentite dal tipo di variabili che in essa compaiono:

• analisi delle frequenze;

• analisi della relazione tra coppie di variabili

(96)

ANALISI MONOVARIATA ANALISI MONOVARIATA

Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle

relazioni con le altre variabili

DISTRIBUZIONE DI FREQUENZA: è l’ordinamento tabulare dei dati raccolti e

le frequenze corrispondenti

(97)

Verifiche da fare in sede di analisi monovariata:

- Verifica di PLAUSIBILITÀ: controllo nella matrice dei “valori selvaggi”

- AGGREGAZIONE DELLE MODALITÀ, secondo due criteri:

- equilibrio della distribuzione

- affinità semantica

(98)

CONTROLLI SUI DATI: controlli di

plausibilità; controllo in matrice dei valori selvaggi; controlli di congruenza; valori mancanti; ponderazione

EQUILIBRIO DELLA DISTRIBUZIONE Le modalità si possono raggruppare

secondo:

- I valori che assume la distribuzione

- L’affinità semantica (non si possono

(99)

Valori mancanti

Distinguiamo 4 situazioni di valori mancanti:

Non sa: il soggetto non sa rispondere

Non applicabile: il soggetto non è tenuto a rispondere

Non risponde: il soggetto rifiuta di rispondere

Valore implausibile: si registra un valore

non compreso nel codice

(100)

Valori selvaggi

GENERE

396 48,3 48,3 48,3

423 51,6 51,6 99,9

1 ,1 ,1 100,0

820 100,0 100,0

MASCHILE FEMMINILE 15

Total Valid

Frequency Percent Valid Percent

Cumulative

Percent

(101)

15-17 32%

18-21 16%

22-25 15%

26-29 37%

LICEO CLASSICO 15,6%

LICEO SCIENTIFICO 19,7%

ALTRO LICEO 6,9%

48%

52%

42,2%

AGGREGAZIONE DELLE MODALITA’

(102)

Misure e test applicabili in sede di analisi monovariata

- Media aritmetica: somma dei valori, Media aritmetica:

divisi per il loro numero (solo se la variabile è cardinale)

- Varianza: in una distribuzione, è la Varianza:

distanza dei singoli valori dal valore medio. Se la varianza è alta significa

che i singoli valori sono molto diversi tra

loro

(103)

- Mediana: è il valore di una distribuzione Mediana:

che la divide in due parti

- Moda: è la modalità della distribuzione Moda:

che ha la frequenza maggiore, cioè il

maggior numero di casi (se la variabile

è nominale è l’unica misura di tendenza

centrale calcolabile)

(104)

Media, mediana, moda

X

₁

+ X

₂

+ X

₃

+… X

_n

X =

N

Serie: 18, 20, 20, 20, 21, 23, 60 Media:

Mediana:

Moda:

(105)

ANALISI BIVARIATA ANALISI BIVARIATA

Studia le relazioni che possono esistere tra 2 variabili. Ha come prodotto una tabella di

contingenza.

Se riporto percentuali di riga:

totale marginale di riga = a 100 Se riporto percentuali di colonna:

totali marginali di colonna = a 100

Si scelgono le percentuali da riportare sulla

(106)

Il numero delle categorie non deve essere troppo elevato

FREQUENZA OSSERVATA: è il numero dei dati di una cella effettivamente rilevati

FREQUENZA ATTESA: è la frequenza teorica che si dovrebbe ottenere sulla base dei totali marginali, se tra le due variabili considerate non esistesse alcuna associazione.

FREQ. ATTESA = Prodotto dei totali marginali

Totale dei casi

(107)

Se la frequenza osservata è molto diversa rispetto alla freq. attesa, allora c’è

un’associazione tra le due variabili.

I risultati sono affidabili e statisticamente significativi soltanto se le frequenze

attese sono alte e le freq. osservate basse.

Chi-quadrato: testa la significatività della

(108)

Frequenze attese/Frequenze osservate Frequenze attese/Frequenze osservate

GENERE * TITOLO DI STUDIO (ricod) Crosstabulation

179 139 76 394

166,6 154,5 72,9 394,0

45,4% 35,3% 19,3% 100,0%

21,9% 17,0% 9,3% 48,3%

166 181 75 422

178,4 165,5 78,1 422,0

39,3% 42,9% 17,8% 100,0%

20,3% 22,2% 9,2% 51,7%

345 320 151 816

345,0 320,0 151,0 816,0

Count

Expected Count

% within GENERE

% of Total Count

Expected Count

% within GENERE

% of Total Count

Expected Count

% within GENERE MASCHILE

FEMMINILE GENERE

Total

ELEM.MEDIA DIPLOMA LAUREA TITOLO DI STUDIO (ricod)

Total

(109)

COME VERIFICARE LA RELAZIONE TRA DUE VARIABILI?

Chi-quadrato: testa la significatività della

relazione tra 2 variabili; si basa sulla differenza tra frequenze osservate (f

_o

) e frequenze attese (f

_e

)

( ^f

_o

^{─ f}

_e

⁾

²

χ ^{2 =} Σ

(110)