Tipi di variabili Tipi di variabili
e la loro misurazione e la loro misurazione
Classificazione delle proprietà, classificazione delle
variabili: perché è importante?
TIPI DI PROPRIETA’
a seconda della natura della relazione che esiste tra gli stati sulla proprietà è possibile individuare 5 classi di proprietà:
DISCRETE assumono un set fisso di valori discontinui e mutuamente esclusivi.
Si passa da un numero intero al successivo
proprietà categoriali (con categorie)
CONTINUE assumono un numero infinito di valori come in un
continuum; esiste un gran numero di valori potenziali intermedi.
non misurabili;
misurabili.
Stati della proprietà
Procedura di operativizzazio ne
Tipo di variabile
Caratteristiche
dei valori Operazioni effettuabili sui valori
Non ordinati Classificazione Nominale Nomi = ≠ Ordinati Ordinamento Ordinale Numeri con le
sole propr.
Ordinali
= ≠ > <
Continui Discreti
Misurazione Conteggio
Cardinale Numeri con le
propr. cardinali = ≠ > < + − ×÷
LA MISURAZIONE delle VARIABILI
1. VARIABILI NOMINALI 1. VARIABILI NOMINALI
La proprietà assume stati discreti non ordinabili Cioè: gli stati sono finiti e non è possibile stabilire
un ordine o una gerarchia
Esempi: genere, religione, nazionalità, ecc.
Gli stati della proprietà sono definiti CATEGORIE, mentre sono VALORI i simboli assegnati alle
categorie operativizzate (le cosiddette
MODALITÀ)
La procedura di operativizzazione è la CLASSIFICAZIONE
Le CATEGORIE devono essere:
- esaustive
- mutuamente esclusive
Possiamo soltanto dire che i valori sono
= o ≠
2. VARIABILI ORDINALI 2. VARIABILI ORDINALI
La proprietà assume stati discreti ordinabili Es.: titolo di studio
Vi attribuiamo dei valori che devono rispettare l’ordine crescente (o decrescente) degli stati
1= nessun titolo
2= scuola elementare 3= scuola media
4= scuola superiore 5= laurea
6= post-laurea
La procedura di operativizzazione delle proprietà è l’ORDINAMENTO
Le proprietà possono essere ordinali per due motivi:
- derivano da proprietà originariamente costituite da stati discreti
- derivano da proprietà continue che derivano da uno
strumento di misurazione creato dal ricercatore (è il caso
delle domande che prevedono risposte graduate: molto,
abbastanza, poco, per niente)
3. VARIABILI CARDINALI 3. VARIABILI CARDINALI
I numeri che identificano le modalità della variabile non sono etichette,
ma hanno un pieno significato numerico
Es. età, n° di figli, altezza, peso, n° di addetti di
un’azienda
Possiamo applicare due processi di operativizzazione:
-la misurazione: quando la proprietà è continua e possediamo un’unità di misura
-il conteggio: quando la proprietà è finita (ha stati
finiti, non frazionabili) ed esiste un’unità di conto
Es. altezza, numero di figli
4. VARIABILI QUASI-CARDINALI 4. VARIABILI QUASI-CARDINALI
Sono “quasi” cardinali, perché per misurare gli atteggiamenti e le opinioni delle
persone non esistono unità di misura
Sono rappresentate da proprietà continue, misurate attraverso la tecnica delle scale
Irraggiungibilità dell’obiettivo di attribuire pieno significato numerico
TECNICA DELLE SCALE (
TECNICA DELLE SCALE ( scaling scaling ) )
L’applicazione più comune della tecnica delle scale è quella di misurare gli atteggiamenti Esistono 3 tipi di scale:
- Con risposte semanticamente autonome (titolo di studio)
- Con risposte a parziale autonomia semantica
(molto, abbastanza, poco…)
Scale auto-ancoranti
Come giudicherebbe il suo stato di salute?
Ottimo pessimo
Variabile in Variabile in
sede di sede di raccolta raccolta
Variabile in Variabile in sede di analisi
sede di analisi Caratteristiche Caratteristiche
Variabili enumerate
Variabili cardinali Es. n. figli
Ordinate; cardinali; mutuamente esclusive
Variabili metriche Variabili cardinali Es. età, reddito
Ordinate; cardinali; mutuamente esclusive
Variabili ottenute da tecniche auto- ancoranti
Variabili quasi-
cardinali Ordinate; mutuamente esclusive, equidistanti
Variabili ottenute
da tecniche di Variabili
categoriali Ordinate, mutuamente esclusive, equidistanti
Proprietà
Proprietà Definizione Definizione Operativa Operativa
Tipo di variabile
Tipo di variabile Esempi Esempi
Con stati enumerabili
Conteggio Variabile
Enumerata (cardinale)
N° figli…
Continue misurabili
Misurazione Variabile metrica (cardinale)
Peso;
Altezza…
Continue senza
unità di misura Tecniche di scaling Variabili categoriali (ordinate)
Atteggiamenti,opi nioni,
valori…
Discrete Rilevazione Variabili Sesso,
Occupazione 1. Non occupato 2. Studente
3. Lavoratore autonomo 4. Lavoratore dipendente 5. Casalinga
6. Pensionato Titolo di studio
1. Maturità liceale classica 2. Maturità liceale scientifica
3. Maturità liceo socio-psico-pedagogico 4. Diploma Tecnico/Professionale
5. Diploma Tecnico Commerciale Stato Civile:
Confessione religiosa 1. cattolico
2. protestante 3. musulmano 4. ateo
5. altro
Titolo di studio
1. Dottorato o specializzazione 2. Laurea
3. Diploma universitario
4. Diploma di scuola media superiore 5. Licenzia di scuola media inferiore 6. Licenza elementare
7. Nessun titolo
Grado di soddisfazione per il proprio lavoro
1. per niente 2. poco
3. abbastanza 4. molto
Grado di soddisfazione per il luogo in cui si vive (punteggio da 1 minima
soddisfazione a 10 massima soddisfazione)
|_1_||_2_||_3_||_4_||_5_||_6_||_7_||_8_||_9_||_10_|
Numero di abitanti del comune di residenza 1. più di 500.000 abitanti
2. tra 500.000 e 100.000 abitanti 3. tra 100.000 e 50.000 abitanti
Voto riportato all’esame di maturità !__|__|__|
Reddito mensile individuale 1. Meno di €500
2. €501 - €1000 3. €1001 – €2000 4. €2001– €3000 5. Oltre €3000
Mezzo di trasporto utilizzato maggiormente 1. Auto propria
2. Moto o motorino 3. Mezzi pubblici 4. Taxi
Regione di residenza 1. Piemonte
2. Valle d Aosta 3. Lombardia
4. Trentino-Alto Adige 5. Bolzano
6. Trento 7. Veneto
8. Friuli-Venezia Giulia 9. Liguria
10. Emilia-Romagna 11. Toscana
12. Umbria 13. Marche 14. Lazio 15. Abruzzo 16. Molise 17. Campania 18. Puglia
Il livello economico-finanziario del suo nucleo familiare le consente di
vivere…
1. Con molte difficoltà 2. Con difficoltà
3. Con qualche difficoltà 4. Abbastanza facilmente 5. Facilmente
6. Molto facilmente
Condizione lavorativa dei genitori 1. Ambedue i genitori occupati
2. Padre occupato, madre casalinga 3. Coppia in altra condizione
4. Un solo genitore
Persone o servizi che si occupano del bambino quando la madre lavora
Posizione contrattuale
1. contratto a tempo indeterminato 2. contratto a tempo determinato 3. contratto di lavoro interinale 4. contratto di formazione e lavoro 5. contratto di apprendistato
6. nessun contratto specifico
Per migliorare la vita cosa è necessario avere
più reddito
più tempo libero
più possibilità di lavoro più amicizie
più agevolazioni per la creazione di una nuova famiglia
Definire il campo di osservazione
Definizione del campo di osservazione
• Il campo d’osservazione di un’inchiesta è
spesso molto ampio e, come tale, può risultare fuori della portata dei ricercatori, per ragioni di carattere pratico, organizzativo, economico, ecc.
• In una situazione del genere, è necessario
delimitare il campo di osservazione sulla base di
criteri adeguati e esplicitati.
• CAMPIONAMENTO
È il procedimento logico in base al quale
l’insieme delle procedure per la costruzione del campione si salda alla teoria della stima e della verifica delle ipotesi.
• DISEGNO DI CAMPIONAMENTO
È l’insieme delle regole seguite per la
costruzione del campione.
Struttura del campione:
insieme delle liste che si utilizzano per costruire il campione. La lista comprende l’elenco di tutte le unità che compongono l’universo.
Se la struttura del campione è semplice:
una lista.
Se la struttura del campione è complessa:
più liste.
La popolazione è intesa come aggregato di unità statistiche.
Le caratteristiche e le proprietà della popolazione che si intendono studiare sono definite variabili o caratteri.
Possiamo ottenere le informazioni sulle variabili attraverso due metodi:
- Rilevazione totale o censuaria (si analizzano tutte le unità che compongono l’universo)
- Rilevazione campionaria (studio per inferenza
Universo statistico e campionamento
• L’universo statistico di una ricerca è l’insieme dei casi
(unità) coinvolti nel problema oggetto d’indagine, con una numerosità uguale a N;
• Il campione è l’insieme delle n (unità campionarie) selezionate tra le N che compongono la popolazione, detta popolazione di riferimento. Un campione estratto dall’universo è un sottoinsieme di esso, con una
numerosità pari a n, con n < N.
• Ad esso si ricorre quando non è possibile una rilevazione
Rappresentatività del campione
• Requisito fondamentale di un campione è la sua rappresentatività.
• Un campione è rappresentativo se è tale da riprodurre, con un margine di approssimazione controllabile, le
caratteristiche dell’universo da cui è stato estratto.
• La rappresentatività consente di estendere all’intero universo i risultati ottenuti indagando il campione.
(generalizzazione o inferenza)
(Rappresentatività del campione, continuazione)
• La rappresentatività di un campione dipende:
- dall’omogeneità/eterogeneità dell’universo;
- dal criterio di campionamento utilizzato;
- dalla numerosità n, che deve essere sufficiente in rapporto alla numerosità N dell’universo.
I campioni probabilistici sono i soli a poter essere
considerati, a rigore, statisticamente rappresentativi.
1. Eterogeneità: presenza di caratteristiche e qualità diverse nel campione, collegate alla variabilità degli atteggiamenti e dei
comportamenti
2. Rappresentatività: si dice rappresentativo un campione che presenta alcune
caratteristiche dell’universo in proporzioni analoghe
3. Sufficienza: misura l’attendibilità dei dati, ovvero la probabilità che essi siano validi per l’universo entro certi termini
statisticamente determinabili
Vantaggi del campionamento:
- Riduzione dei costi - Rapidità
- Scopi specifici
- Accuratezza
Tipi di campione
Campioni probabilistici:
• campione casuale semplice;
• campione casuale stratificato;
• campione casuale sistematico;
• campione a più stadi.
• campione a grappoli
Campioni non probabilistici:
• Campionamento a casaccio
• Campione di esperti
• Campionamento per quota
• Campionamento a scelta ragionata
• Campionamento a valanga o a catena o a palla di neve
• Campionamento telefonico / sistema CATI
• Campionamento di convenienza / di disponibilità
Dimensioni del campione
Quando si determinano le dimensioni del campione occorre tener conto di alcuni fattori:
•La dimensione della popolazione
•Le risorse disponibili e i limiti di tempo
•L’incisività dell’effetto
•Il numero dei sotto-gruppi da confrontare
•I tassi di rifiuto e di mortalità
Statistica descrittiva: è l’insieme delle procedure utili per organizzare i dati raccolti in forma conveniente e
comunicabile
Statistica inferenziale: è l’insieme delle
procedure atte a raggiungere conclusioni
più ampie rispetto ai valori raccolti, tali da
poter essere messi in relazione con
Vogliamo studiare le variabili (proprietà) X, Y, Z, di un certo campione.
Studiarle significa conoscere alcuni valori caratteristici assunti dall’intera
popolazione (cioè la loro
DISTRIBUZIONE) o le relazioni fra le variabili stesse.
Chiamiamo queste conoscenze
PARAMETRI
Esempi: se l’unità è l’individuo e la variabile X è il reddito e vogliamo conoscere il
reddito medio, il parametro della
popolazione che vogliamo conoscere è la MEDIA
Se la variabile Y è il voto e noi vogliamo
conoscere la proporzione di persone che
hanno votato il partito A, il parametro della
popolazione che vogliamo conoscere è
Se vogliamo studiare la relazione fra le
variabili X e Z, il parametro che vogliamo conoscere è un coefficiente di
CORRELAZIONE
Se conoscessimo la popolazione totale, avremmo il valore esatto del parametro
che stiamo studiando, ma questa è
un’ipotesi che non si verifica mai (se non nei casi di censimento)
L’indagine campionaria ci fornisce una
STIMA, un valore approssimato
È sempre presente un ERRORE nelle stime che calcoliamo
V = v ± e
Parametro della
popolazione Stima del
campione Errore di
campionamento
Quindi, se effettuiamo una rilevazione totale sul reddito degli italiani, possiamo dire:
“il reddito medio degli italiani è € 1.350”.
Se effettuiamo un rilevazione campionaria, diciamo:
“c’è il 95% di probabilità che il reddito medio
degli italiani sia di € 1.300 ± 50”
Nel secondo caso, il ricercatore non è certo del suo calcolo, c’è un 5% di probabilità che il reddito sia al di fuori dei valori
indicati.
Il ricercatore calcola un intervallo di fiducia nel quale si colloca il valore della statistica della popolazione.
La stima del campione è sempre affetta da
Determinazione della NUMEROSITÀ OTTIMALE del campione:
È la numerosità che permette alle stime che compiamo di raggiungere il livello di
attendibilità che ci attendiamo.
Ampiezza del campione
5% 5% 2% 2% 1% 1%
N n N n N n
100 80 100 96 100 99
300 170 300 270 300 296
500 220 500 415 500 475
1.000 285 1.000 715 1.000 910
5.000 370 5.000 1.660 5.000 3.330
Che cosa è possibile ottenere dai dati raccolti?
- Verifica delle ipotesi di contenuto (cioè le ipotesi di rapporti tra le variabili): si rimane nell’ambito dei risultati disponibili e tale
verifica è valida soltanto per le unità di analisi considerate.
valido per campioni NON PROBABILISTICI - Inferenze: si generalizzano i risultati dal
campione all’universo
CAMPIONI PROBABILISTICI CAMPIONI PROBABILISTICI
Campioni casuali o probabilistici: sono
regolati dalla legge del CASO, cioè della probabilità
Si attribuisce ad ogni unità della
popolazione una probabilità positiva di essere selezionata
Si utilizzano tecniche per la selezione
casuale del campione
• La probabilità di selezionare i casi è nota
• Per costruire un campione probabilistico è indispensabile la conoscenza
dell’universo; devono essere note e
disponibili le fonti (es. lista completa della popolazione)
• Le fonti possono anche definire universi
“settoriali”
Si possono costruire diversi tipi di
campioni probabilistici a seconda
del metodo di estrazione
1. Campione casuale semplice/sistematico
Può essere estratto per sorteggio o per intervallo fisso (scegliendo un nominativo ogni tot da una lista e prevedendo eventuali sostituti), fino a
raggiungere la numerosità desiderata.
Il rapporto tra la numerosità dell’universo e quella del campione dà la misura dell’intervallo fisso da rispettare.(intervallo di campionamento).
È opportuno su popolazioni relativamente piccole,
2. Campione stratificato
La popolazione viene suddivisa in STRATI.
Si mantiene l’estrazione casuale, ma si
utilizzano una o più variabili stratificanti, tali da controllare meglio la
rappresentatività dei casi selezionati.
Es.: per il reddito, si suddivide la
stratificazione
Il campione può essere proporzionale o non proporzionale.
Il campione si dice stratificato proporzionale se riproduce la stessa composizione degli strati della popolazione
Es. se operai, impiegati, lav.autonomi e
professionisti sono rispettiv. il 35, 40, 15 e 10% della popolazione, costruiremo un
campione di 1000 casi composto da 350
Invece, se sovra o sotto-rappresentiamo alcuni strati, otteniamo un campione
stratificato non proporzionale.
In questo caso, dovremo effettuare
un’operazione di ponderazione.
3. Campione a stadi
Si utilizza ad es. quando manca la lista completa delle unità della popolazione.
Viene definito sulla base di scelte e
procedure successive, che passano per più stadi o fasi.
Si individuano diverse unità (primarie,
secondarie…) e si procede con estrazioni
Es. ricerca sui medici di medicina generale Unità primaria: Ausl locale cui afferisce il
medico
Unità secondarie: i medici stessi
Il campionamento si effettua in due stadi, cioè in due estrazioni successive.
Primo: si estrae un campione di unità primarie (ad es. 100 aziende Ausl)
Secondo: si estrae casualmente un numero
4. Campioni a grappolo
Si utilizza quando la popolazione è naturalmente suddivisa in gruppi di unità contigue
Ad es. le famiglie, le classi scolastiche, i ricoverati in ospedale, ecc.
• L’unità di campionamento (sampling unit) è ora un gruppo o grappolo (cluster ) di unità della popolazione.
• Nel campionamento a grappolo si seleziona un campione casuale di grappoli e, nel caso di ispezione completa, tutte le unità ad esso
appartenenti sono oggetto di rilevazione.
• Questo campionamento sfrutta l’esistenza di raggruppamenti naturali della popolazione, essenzialmente legati alla contiguità spaziale o istituzionale, con un diverso intento rispetto alla
stratificazione: ottenere una convenienza dal punto di vista della
raccolta delle informazioni.
Schema di popolazione a stadi
CAMPIONI NON PROBABILISTICI CAMPIONI NON PROBABILISTICI
Seguono l’orientamento di chi li costruisce;
vengono costruiti senza conoscere la probabilità di estrazione dei casi.
Viene a mancare la conoscenza dell’universo
L’inferenza non si può applicare
Campione “a casaccio”: costruito in modo accidentale, Campione “a casaccio”:
senza regole.
A scelta ragionata: le unità sono scelte in modo da A scelta ragionata avvicinarsi nell’insieme alle caratteristiche della
popolazione
Per quote: l’intervistato sceglie le unità da intervistare, Per quote:
ma deve rispettare le quote di popolazione che rappresentano determinate caratteristiche
A palla di neve (a valanga) A palla di neve (a valanga)
Un caso concreto
• Indagine identità e bisogni del volontariato in Toscana
• Rilevazione delle OdV
- Campione teorico: 840 unità di rilevazione distribuite su tutto il territorio toscano (28% tot ODV archivio Cesvot) intervallo d confidenza del 99%
- Tasso di caduta tra il 25-30%
- Ritorno 600-650 odv; intervallo confidenza del 95%
errore campionamento 3,6%;
- 400 odv errore campionamento del 5%
- Rilevazione volontari:
- Unità di rilevazione. ODV campionate
Lo schema di riferimento ha previsto l’individuazione da parte del Presidente di un massimo di 12 volontari secondo i seguenti criteri:
• una prima dicotomizzazione
riguardante i volontari attivi e quelli meno attivi;
• una seconda dicotomizzazione riguardante maschi e femmine;
• una terza differenziazione riguardante le fasce d’età suddivise in giovani,
adulti, anziani;
Un ulteriore esemplificazione
• Survey OPS – anziani – giovani - adulti
• Confini anagrafici di ogni singolo target
• 14-24 giovani
• 25-59 adulti
• 60 oltre per gli anziani
• Campionamento stratificato per sesso e
La raccolta dati:
IL QUESTIONARIO E L’ANALISI DEI DATI
PROGETTAZIONE DEL QUESTIONARIO
1. Costruzione dello schema concettuale:
definizione degli argomenti da
2. Redazione del questionario:
a. Formulazione delle domande tenendo conto
LA FORMULAZIONE DI UN QUESTIONARIO è UN’ IMPRESA
COMPLICATA E DIFFICILE CHE RICHIEDE UN LUNGO IMPEGNO
ED UNA GRANDE ATTENZIONE
Si tratta di un lavoro che è difficile formalizzare …..
per il quale non esistono regole
precise ….. al massimo si possono
In generale per la stesura di un buon questionario sono necessari:
• l’esperienza del ricercatore;
• la conoscenza della popolazione alla quale il questionario viene somministrato;
• la chiarezza delle ipotesi di ricerca
QUESTIONARIO
Formulazione
strutturata di domande con cui misuriamo quantitativamente i
fenomeni
LE DOMANDE
traduzione delle IPOTESI DI RICERCA
in INDICATORI EMPIRICI
CHE LE DOMANDE MISURINO
ADEGUATAMENTE I CONCETTI TEORICI
Il DISEGNO DEL QUESTIONARIO deve riuscire a combinare questi due aspetti
CHE IL CAMPIONE DEGLI
INTERVISTATI RISPONDA
ADEGUATAMENTE ALLE DOMANDE
Esiste un problema relativo alla definizione dei concetti, del loro uso, della loro struttura interna
È quindi necessità esplorare al loro interno i concetti stessi cercando di:
coglierne il senso definirne la struttura e la
composizione interna Il grande problema nell’analisi dei concetti è la
crescente
Analisi interna
Insieme di caratteri che ne
determinano la fisionomia
generale
Un concetto esiste perché è costituito da parti
componenti
Dal concetto alla costruzione degli items
Concetti
Struttura del concetto
Elementi che compongono il concetto
Proposizioni che esprimono il concetto Gli items che esprimono
gli elementi Indicatori
CONCETTI
ITEMS
ELABORAZIONI
Concetti
Elementi che compongono il concetto
items
Eleborazioni Processo di flessibilizzazione
Analisi del contesto
Definizione di altri concetti
con i quali correlarsi
Gli “elementi” e le
“proposizioni” in cui si articola il concetto hanno una struttura molto semplice
Gli items possono a loro volta avere una struttura molto
semplice
oppure
Gli “elementi” e le
“proposizioni” in cui si articola il concetto hanno una struttura molto complessa
Indicatori Indici
Gli items possono a loro volta avere una struttura molto
2 Ipotesi
CONCETTUALIZZAZIONE TEORICA
DEFINIZIONE OPERATIVA
OPERAZIONALIZZAZIONE EMPIRICA
COSTRUZIONE DI UN SISTEMA DI
INDICATORI VARIABILI DEFINIZIONE
NOMINALE
QUESTIONARIO
GLI INDICATORI VENGONO “tradotti” IN DOMANDE NEL QUESTIONARIO
INDICATORI DOMANDE
DOMANDE
CLASSIFICAZIONI
Domande fattuali
riguardano i fatti e tutto ciò che è osservabile dall’esterno
Domande relative a proprietà
Domande motivazionali
riguardano opinioni,
atteggiamenti, motivazioni, orientamenti, sentimenti, valutazioni, giudizi, valori
Domande
Domande chiuse
Domande aperte
LA FORMULAZIONE DELLE DOMANDE
Semplicità di linguaggio
Lunghezza delle domande
Numero delle alternative di
risposta
Espressioni in gergo
Domande sintatticamente complesse (doppia
negazione)
Domande non discriminanti Domande
tendenziose (dette anche viziate o a risposta pilotata)
Domande con risposta non
univoca
Concretezza- astrazione
Desiderabilità sociale delle
risposte
Il problema delle alternative di scelta
• A due alternative contrapposte: SI/NO VERO/FALSO
• A due alternative con possibilità di fuga: SI/NO/NON SO
• A tre alternative: NESSUNA/POCHE/MOLTE
• A quattro alternative dicotomizzate: NESSUNA/POCA/ABBASTANZA/MOLTA
SCALE DI MISURAZIONE
La scala è un insieme coerente di domande (o elementi o items) che si propongono di misurare il grado di condivisione che i soggetti hanno di un particolare concetto. Gli elementi sono pertanto considerati indicatori di un
concetto più generale
Lo scopo è di cogliere le diversità fra gli intervistati sulla proprietà che viene rilevata (capacità di discriminare su opinioni diverse)
L’elemento è dunque il singolo componente:
Affermazione Domanda
MISURA DEGLI ATTEGGIAMENTI
CONCETTO GENERALE ATTEGGIAMENTO
CONCETTI SPECIFICI
OPINIONI
TENDENZA DI FONDO NON DIRETTAMENTE RILEVABILE
MODO ATTRAVERSO CUI LA TENDENZA DI FONDO EMERGE
Numero delle dimensioni teoriche (parti del conglomerato teorico in cui è possibile scomporre un concetto) che intendiamo far entrare nella scala
Il compito del ricercatore è:
1. Individuare tutti i sottoinsiemi nei quali viene ad articolandosi il concetto;
2. Restringere ad un numero ragionevolmente basso i sottoinsiemi possibili;
3. Isolare i sottoinsiemi più significativi;
4. Trovare una formulazione corretta capace di coinvolgere i soggetti intervistati in ciascun sottosistema in modo da ottenere una risposta significativa.
La scala Likert consiste in una serie di affermazioni, comunemente chiamate “items”, semanticamente collegate tra loro (chiamiamo questo
collegamento semantico “dimensione concettuale”)
Ognuna delle domande viene sottoposta agli intervistati sulla stessa gamma di possibili giudizi (molto d’accordo, abbastanza d’accordo, né
d’accordo né in disaccordo, in disaccordo, molto in disaccordo)
Il termine scala
indica l’insieme dei giudizi che vengono associati in una
comune dimensione concettuale.
La combinazione degli items in una scala dà luogo ad un indice
Con il termine batteria si intende generalmente l’insieme di più domande (items)
relative a più scale, associate in un unico modello di possibile
risposta
Punti deboli:
I processi di automatismo nella risposta respon-set ossia serie di risposte identiche
acquiescent respon sets
Indicazioni e suggerimenti
operativi
1. In una batteria di domande cercare di mescolare il più possibile fra loro gli items relativi alle varie scale;
Trattamento statistico dei dati
CODIFICA E ANALISI DEI
DATI
La matrice dei dati
La matrice dei dati è una matrice con i casi in riga e le variabili generate dal questionario in colonna:
V 1 V 2 …….
. V n U 1 C 11 C 12 C 1n U 2 C 21 C 22 C 2n
…..
U C C C
Definizione del piano di codifica
Il piano di codifica consiste nell’elenco numerato di tutte le variabili generate dal questionario, ciascuna riportata con le rispettive modalità e i valori ad esse associati.
Il rapporto tra il numero di stati di una proprietà che
consideriamo nel piano di codifica e il numero di stati differenti che quella proprietà può effettivamente
assumere determina la sensibilità.
…il piano di codifica
Il numero delle variabili che compare nel piano di
codifica – e, di conseguenza, nella matrice dei dati - è maggiore di quello delle domande presenti nel
questionario se nel questionario sono contemplate:
• domande che ammettono risposte multiple;
• domande che corrispondono a uno o più insiemi di
indicatori per ciascuno dei quali è possibile costruire
TIPI DI PROPRIETA’
DISCRETE
•proprietà categoriali (con categorie) non ordinate;
•proprietà categoriali (con categorie) ordinate;
•proprietà cardinali;
CONTINUE
•proprietà continue non misurabili;
•proprietà continue misurabili.
Proprietà e variabili ordinali
A differenza delle variabili categoriali, nelle ordinali gli stati sono già ordinati nella realtà o si può pensare un criterio intersoggettivo per ordinarli.
Il criterio adottato per ordinare i codici deve essere lo stesso di quello che percepiamo tra gli stati.
Infatti, la serie dei codici deve avere una relazione monotonica diretta con l’ordine degli stati nella realtà.
Solitamente alle categorie si assegnano come codici i numeri
Proprietà discrete cardinali e variabili cardinali
L’autonomia semantica delle categorie di una variabile cardinale è molto ridotta, generalmente va poco oltre l’aspetto meramente numerico.
Si può individuare la mediana, calcolare la media e alcuni valori caratteristici.
La variabilità, ovvero la dispersione dei dati intorno alla media si rileva con:
-devianza, ovvero la somma degli scarti quadratici dalla media
∑xi²
-varianza, ovvero la devianza rapportata alla numerosità della popolazione o al numero dei casi in esame
s²= ∑xi²/N
-scarto tipo (deviazione standard) , ovvero la radice quadrata della varianza, rende la misura comparabile anche con altre grandezze lineari
s= √∑xi²/N
Scale ordinali per somma
Items Punteggi
disaccordo accordo
• Item 1 0 1
• Item 2 0 1
• ……. 0 1
• ……. 0 1
• Item N 0 1
Indice di ciascun soggetto = dei punteggi attribuiti agli items Indice min. = 0 (disaccordo con tutti gli items)
Indice max. = N (accordo con tutti gli items)
Scale ordinali di Likert
Items Punteggi
max max
disacc. acc.
• Item 1 1 2 3 4 5
• Item 2 1 2 3 4 5
• ……. 1 2 3 4 5
• ……. 1 2 3 4 5
• Item N 1 2 3 4 5
Indice di ciascun soggetto = dei punteggi attribuiti agli items Indice min. = 1 x N (max disaccordo con tutti gli items)
Scale a intervalli di Thurstone
• Formulazione di un numero elevato di items, indicatori del concetto associato alla proprietà considerata.
• Un gruppo di “giudici” valuta l’intensità con cui ciascun item indica la proprietà considerata, collocandolo in una posizione tra 11:
A B C D E F G H I J K con A=intensità minima e K=intensità massima
• Eliminazione degli items ciascuno collocato dai diversi “giudici” su posizioni troppo lontane.
• Calcolo, per ciascun item rimasto di:
a. valore associato alla mediana (valore scalare dell’item)
b. differenza interquartilica (indicatore del livello di omogeneità
delle collocazioni di quell’item da parte dei diversi giudici).
Procedure di analisi dei dati
Descrivere i dati: analisi monovariata
Analizzare i dati: analisi bivariata
Procedure di analisi dei dati
Sui dati della matrice, trascritta su supporto
informatico e utilizzando il software disponibile per la ricerca sociale, è possibile applicare le procedure di analisi statistica consentite dal tipo di variabili che in essa compaiono:
• analisi delle frequenze;
• analisi della relazione tra coppie di variabili
ANALISI MONOVARIATA ANALISI MONOVARIATA
Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle
relazioni con le altre variabili
DISTRIBUZIONE DI FREQUENZA: è l’ordinamento tabulare dei dati raccolti e
le frequenze corrispondenti
Verifiche da fare in sede di analisi monovariata:
- Verifica di PLAUSIBILITÀ: controllo nella matrice dei “valori selvaggi”
- AGGREGAZIONE DELLE MODALITÀ, secondo due criteri:
- equilibrio della distribuzione
- affinità semantica
CONTROLLI SUI DATI: controlli di
plausibilità; controllo in matrice dei valori selvaggi; controlli di congruenza; valori mancanti; ponderazione
EQUILIBRIO DELLA DISTRIBUZIONE Le modalità si possono raggruppare
secondo:
- I valori che assume la distribuzione
- L’affinità semantica (non si possono
Valori mancanti
Distinguiamo 4 situazioni di valori mancanti:
Non sa: il soggetto non sa rispondere
Non applicabile: il soggetto non è tenuto a rispondere
Non risponde: il soggetto rifiuta di rispondere
Valore implausibile: si registra un valore
non compreso nel codice
Valori selvaggi
GENERE
396 48,3 48,3 48,3
423 51,6 51,6 99,9
1 ,1 ,1 100,0
820 100,0 100,0
MASCHILE FEMMINILE 15
Total Valid
Frequency Percent Valid Percent
Cumulative
Percent
15-17 32%
18-21 16%
22-25 15%
26-29 37%
LICEO CLASSICO 15,6%
LICEO SCIENTIFICO 19,7%
ALTRO LICEO 6,9%
48%
52%
42,2%
AGGREGAZIONE DELLE MODALITA’
Misure e test applicabili in sede di analisi monovariata
- Media aritmetica: somma dei valori, Media aritmetica:
divisi per il loro numero (solo se la variabile è cardinale)
- Varianza: in una distribuzione, è la Varianza:
distanza dei singoli valori dal valore medio. Se la varianza è alta significa
che i singoli valori sono molto diversi tra
loro
- Mediana: è il valore di una distribuzione Mediana:
che la divide in due parti
- Moda: è la modalità della distribuzione Moda:
che ha la frequenza maggiore, cioè il
maggior numero di casi (se la variabile
è nominale è l’unica misura di tendenza
centrale calcolabile)
Media, mediana, moda
X
1+ X
2+ X
3+… X
nX =
N
Serie: 18, 20, 20, 20, 21, 23, 60 Media:
Mediana:
Moda:
ANALISI BIVARIATA ANALISI BIVARIATA
Studia le relazioni che possono esistere tra 2 variabili. Ha come prodotto una tabella di
contingenza.
Se riporto percentuali di riga:
totale marginale di riga = a 100 Se riporto percentuali di colonna:
totali marginali di colonna = a 100
Si scelgono le percentuali da riportare sulla
Il numero delle categorie non deve essere troppo elevato
FREQUENZA OSSERVATA: è il numero dei dati di una cella effettivamente rilevati
FREQUENZA ATTESA: è la frequenza teorica che si dovrebbe ottenere sulla base dei totali marginali, se tra le due variabili considerate non esistesse alcuna associazione.
FREQ. ATTESA = Prodotto dei totali marginali
Totale dei casi
Se la frequenza osservata è molto diversa rispetto alla freq. attesa, allora c’è
un’associazione tra le due variabili.
I risultati sono affidabili e statisticamente significativi soltanto se le frequenze
attese sono alte e le freq. osservate basse.
Chi-quadrato: testa la significatività della
Frequenze attese/Frequenze osservate Frequenze attese/Frequenze osservate
GENERE * TITOLO DI STUDIO (ricod) Crosstabulation
179 139 76 394
166,6 154,5 72,9 394,0
45,4% 35,3% 19,3% 100,0%
21,9% 17,0% 9,3% 48,3%
166 181 75 422
178,4 165,5 78,1 422,0
39,3% 42,9% 17,8% 100,0%
20,3% 22,2% 9,2% 51,7%
345 320 151 816
345,0 320,0 151,0 816,0
Count
Expected Count
% within GENERE
% of Total Count
Expected Count
% within GENERE
% of Total Count
Expected Count
% within GENERE MASCHILE
FEMMINILE GENERE
Total
ELEM.MEDIA DIPLOMA LAUREA TITOLO DI STUDIO (ricod)
Total