• Non ci sono risultati.

Indagini statistiche via Web: autoselezione e propensity score matching

N/A
N/A
Protected

Academic year: 2021

Condividi "Indagini statistiche via Web: autoselezione e propensity score matching"

Copied!
162
0
0

Testo completo

(1)

INDICE

INTRODUZIONE 9

CAPITOLO 1 15

I SONDAGGI D’OPINIONE 15

1.1COS’ÈUNSONDAGGIO 15

1.2AFFIDABILITÀDEISONDAGGI 18

1.3L’IMPORTANZADEISONDAGGI 20

1.4NUOVISVILUPPITECNOLOGICI 21

CAPITOLO 2 25

LA DIFFUSIONE DI INTERNET IN ITALIA 25

2.1CONFRONTODELLASITUAZIONEITALIANACONALCUNIDATI

INTERNAZIONALI 29

2.2INTERNETDACASA 33

2.3“UTENTI”INTERNETPERGRANDIAREEGEOGRAFICHE 35

2.4“UTENTI”INTERNETPERETÀ 36

2.5“UTENTI”INTERNETPERLIVELLOSCOLASTICO 39

2.6“UTENTI”INTERNETINBASEALREDDITO 41

2.7“UTENTI”INTERNETPERTIPODIATTIVITÀ 43

2.8“UTENTI”INTERNETECONOSCENZADELL’INGLESE 44

2.9“UTENTI”INTERNETEPERCENTUALEDIDONNEINRETE 44

2.10“UTENTI”INTERNETE“ANZIANITÀ”NELL’USODELLARETE 46

2.11USODIRISORSEDIINFORMAZIONEECOMUNICAZIONEINITALIA 48

CAPITOLO 3 51

EVOLUZIONE DELLE TECNICHE DI INDAGINE 51

3.1ASPETTIMETODOLOGICIDELLEINDAGINIVIAINTERNET 51

3.2LEPRINCIPALITIPOLOGIEDIINDAGINION-LINE 53

3.2.1 SONDAGGI WEB 54

3.3LEINDAGINIVIAINTERNET 56

(2)

CAPITOLO 4 67

LO STRUMENTO DI ANALISI: 67

IL PROPENSITY SCORE MATCHING 67

4.1ILPROPENSITYSCOREMATCHING 67

4.1.1 PRESUPPOSTI TEORICI DEL METODO 71

4.1.2 COME OTTENERE I DATI SUI NON-INTERVISTATI 72

4.2METODOLOGIEDIMATCHING 73

4.2.1 NEAREST NEIGHBOR MATCHING 73

(“ABBINAMENTO SULL’UNITÀ PIÙ VICINA”) 73

4.2.2 RADIUS MATCHING 75

(“ABBINAMENTO IN UN RAGGIO”) 75

4.2.3 STRATIFICATION MATCHING 76

(“ABBINAMENTO CON STRATIFICAZIONE”) 76

4.2.4 KERNEL MATCHING 78

(“ABBINAMENTO CON LA FUNZIONE KERNEL”) 78

CAPITOLO 5 81

IL PROPENSITY SCORE ADJUSTMENT E LA DISTORSIONE 81

5.1INTRODUZIONE 81

5.2PROPENSITYSCOREADJUSTMENTPERINDAGINIWEBSUPANEL

VOLONTARI 83

5.3SIMULAZIONE 85

5.3.1 COSTRUZIONE DELLA PSEUDO-POPOLAZIONE 85

5.3.2 CAMPIONAMENTO E PONDERAZIONE DEI DATI 87

5.4RISULTATI 88

5.4.1 PERFORMANCE DEL PROPENSITY SCORE ADJUSTMENT 89

5.5CONCLUSIONE 91

CAPITOLO 6 93

IL PROPENSITY SCORE ADJUSTMENT E LA VARIABILITÁ 93

6.1INTRODUZIONE 93

6.2STIMADELLAPOPOLAZIONEDALCAMPIONEWEB 93

6.3PROCEDUREAPPLICATEPERDETERMINAREILPROPENSITYSCORE 94

6.4MODELLOSTATISTICOAPPLICATO 96

6.4.1 IL MODELLO “m1” 96

(3)

6.5PROPRIETÀSTATISTICHEDI yS 97

6.6SIMULAZIONE 98

6.6.1 CREAZIONE DELLA POPOLAZIONE TARGET 98

6.6.2 CAMPIONAMENTO 100

6.6.3 ANALISI DEI RISULTATI 101

6.7CONCLUSIONE 103

CAPITOLO 7 107

IL PROPENSITY SCORE ADJUSTMENT E LA SUA STIMA DAL CAMPIONE 107

7.1INTRODUZIONE 107

7.2SIMULAZIONE 108

7.2.1 PROCEDIMENTO 112

7.2.2 IMPORTANZA DELL’INTERVALLO DI CONFIDENZA 113

7.3RISULTATIECOMMENTO 114 7.4CONCLUSIONE 118 CONCLUSIONE 121 APPENDICI 123 APPENDICE 1 125 IL QUESTIONARIO ON-LINE 125

1.1PROGETTAZIONEDELQUESTIONARIOON-LINE 125

1.2TIPOLOGIEDIQUESTIONARION-LINE 126

1.2.1 INDAGINE ON-LINE CON QUESTIONARIO INTERATTIVO 127

1.2.2 INDAGINE ON-LINE CON QUESTIONARIO STATICO 128

1.3REQUISITINECESSARIPERUNACORRETTAINDAGINE 129

APPENDICE 2 133

IL METODO BOOTSTRAP 133

2.1METODIAPPROSSIMATIDISTIMADELLAVARIANZA 133

2.2CALCOLODELLAVARIANZACONILMETODOBOOTSTRAP 133

2.3ANALISIDELMETODOBOOTSTRAPEDIALTRIMETODIDISTIMADELLA

VARIANZA 135

(4)

ALLEGATO3:“PROCEDURAH-T,MARCONVEX,COV(X,Y)=0,9” X ALLEGATO4:“PROCEDURAH-T+BOOTSTRAP,MARCONVEX,COV(X,Y)=0,1” XIV ALLEGATO5:“PROCEDURAPERLADETERMINAZIONEDELL’INTERVALLODI

CONFIDENZA” XIX

BIBLIOGRAFIA 135

(5)

INDICE DELLE FIGURE

2.1 “UTENTI” INTERNET IN ITALIA 1997-2005 26

(NUMERI IN MIGLIAIA) 26

2.2 “UTENTI” INTERNET IN ITALIA GENNAIO 2001 – LUGLIO 2005 (NUMERI IN

MIGLIAIA) 27

2.3 “UTENTI” INTERNET IN ITALIA APRILE 2004 – AGOSTO 2005 (NUMERI IN

MIGLIAIA) 28

2.4 “UTENTI” INTERNET IN CINQUE PAESI 2003 – 2004 (PERCENTUALI SULLA

POPOLAZIONE, DATI TRIMESTRALI) 29

2.5 ABITAZIONI CON ACCESSO AD INTERNET IN 5 PAESI EUROPEI 2000-2004 30

(PERCENTUALI SUL TOTALE FAMIGLIE) 30

2.6 “UTENTI” INTERNET IN 9 PAESI 30

(PERCENTUALI SULLA POPOLAZIONE) 30

2.7 “UTENTI” INTERNET IN 20 PAESI (PERCENTUALI SULLA POPOLAZIONE) 31 2.8 “UTENTI” INTERNET PER 100 ABITANTI IN 21 PAESI (DI CUI 18 NELL’UNIONE

EUROPEA) 32

2.9 USO DI INTERNET DA CASA (MIGLIAIA DI PERSONE) 33

2.10 USO DI INTERNET DA CASA 1998-2004 (MIGLIAIA DI PERSONE) 34 2.11 “UTENTI” INTERNET PER GRANDI AREE GEOGRAFICHE (PERCENTUALI) 35 2.12 “UTENTI” INTERNET PER GRANDEZZA DI CENTRI (PERCENTUALI) 36

2.13 “UTENTI” INTERNET PER ETÀ (PERCENTUALI) 37

2.14 “UTENTI” INTERNET PER ETÀ (PERCENTUALI) 38

2.15 “UTENTI” INTERNET PER ETÀ (PERCENTUALI SULLA POPOLAZIONE) 38

2.16 “UTENTI” INTERNET PER LIVELLO SCOLASTICO (PERCENTUALI) 39

2.17 “UTENTI” INTERNET PER LIVELLO SCOLASTICO 1999-2005 (PERCENTUALI) 40

2.18 “UTENTI” INTERNET PER LIVELLO SCOLASTICO (PERCENTUALI) 40

2.19 “UTENTI” INTERNET IN BASE AL REDDITO (PERCENTUALI) 41

2.20 “UTENTI” INTERNET IN BASE AL REDDITO 1999-2005 (PERCENTUALI) 41

2.21 “UTENTI” INTERNET IN BASE AL REDDITO (PERCENTUALI) 42

2.22 “UTENTI” INTERNET PER TIPO DI ATTIVITÀ (PERCENTUALI) 43

2.23 CONOSCENZA DELL’INGLESE (PERCENTUALI) 44

2.24 PERCENTUALE DI DONNE IN RETE (PERCENTUALE SUL TOTALE “UTENTI

(6)

2.26 QUANDO HANNO COMINCIATO A COLLEGARSI (PERCENTUALI SUL TOTALE

DI “UTENTI INTERNET”) 47

2.27 QUANDO HANNO COMINCIATO A COLLEGARSI (PERCENTUALI SUL TOTALE

IN CIASCUNA CATEGORIA) 47

2.28 USO DI RISORSE DI INFORMAZIONE E COMUNICAZIONE IN ITALIA

(PERCENTUALI SU TOTALE POPOLAZIONE) 48

5.1: “PROCESSO DELLE INTERVISTE WEB SU PANEL VOLONTARI” 82

6.1 DISTRIBUZIONE DI FREQUENZA DELLA DISTORSIONE RELATIVA 102

6.2 DISTRIBUZIONE DI FREQUENZA DEL RAPPORTO TRA VARIANZE 102

7.1: IPOTESI “MAR-LINEAR” 109

(7)

INDICE DELLE TABELLE

TABELLA 5.1: “DISTRIBUTION OF AGE, GENDER, EDUCATION AND RACE BY

DIFFERENT DATA SOURCES” 86

(“PROPENSITY SCORE ADJUSTMENT AS A WEIGHTING SCHEME FOR VOLUNTEER

PANEL WEB SURVEYS”, SUNGHEE LEE) 86

TABELLA 5.2: “P-VALUES OF THE AUXILIARY VARIABLES FROM LOGIT MODELS PREDICTING yblks(WARM FEELINGS TOWARDS BLACKS) AND yvote(VOTING

PARTICIPATION IN 2000 ELECTION)A 88

(“PROPENSITY SCORE ADJUSTMENT AS A WEIGHTING SCHEME FOR VOLUNTEER

PANEL WEB SURVEYS”, SUNGHEE LEE) 88

TABELLA 5.3: “SIMULATION MEAN OF ESTIMATE BY DIFFERENT SAMPLES

BEFORE ADJUSTMENT” 89

(“PROPENSITY SCORE ADJUSTMENT AS A WEIGHTING SCHEME FOR VOLUNTEER

PANEL WEB SURVEYS”, SUNGHEE LEE) 89

TABELLA 5.4: “UNADJUSTED AND ADJUSTED WEB SAMPLE ESTIMATES” (“PROPENSITY SCORE ADJUSTMENT AS A WEIGHTING SCHEME FOR

VOLUNTEER PANEL WEB SURVEYS”, SUNGHEE LEE) 90

TABELLA 6.1: DIVISIONE IN CLASSI 99

TABELLA 7.1: “MEDIE RICAVATE DAL SECONDO CASO SIMULATO” 115

TABELLA 7.2: “INTERVALLI DI CONFIDENZA DEL SECONDO CASO SIMULATO” 116 TABELLA 7.3: “INCLUSIONE DELLA MEDIA DELLA POPOLAZIONE

NELL’INTERVALLO DI CONFIDENZA” 116

TABELLA 7.4: “DISTORSIONE E VARIABILITÀ NELLE MIGLIORI IPOTESI DI MAR

(8)
(9)

INTRODUZIONE

Quando leggiamo un quotidiano, guardiamo il telegiornale o ascoltiamo la radio, riceviamo delle informazioni su temi che possono colpirci e farci riflettere, inducendoci a prendere posizione sul tema in questione. L’opinione del singolo contribuisce a formare l’opinione comune, quella della gente. Conoscere l’opinione comune è cruciale in molte situazioni. Pensiamo all’importanza dell’opinione degli elettori per i politici, ma anche al rilievo dell’opinione dei consumatori di un prodotto per le aziende produttrici. Ma come si fa a sapere “che cosa pensa la gente?”.

Lo strumento che ci permette di rilevare i diversi pareri della gente e di conoscere l’opinione comune è il sondaggio d’opinione statistico.

Il sondaggio è il metodo più diffuso per raccogliere delle informazioni su una “popolazione”, attraverso una serie di domande poste direttamente ad un gruppo di persone scelte “in rappresentanza” di questa stessa popolazione.

Il sondaggio permette di conoscere l’opinione della gente. Oggi, però, assistiamo ad un veloce processo di rinnovamento e di trasformazione dei mezzi di comunicazione e quindi dei modi con cui intervistare, porre domande alle persone. In particolare, la diffusione di Internet tra le famiglie e le imprese offre nuove potenzialità per organizzare sondaggi di opinione, ma al tempo stesso può essere causa di problemi nell’individuazione dei soggetti che “rappresentino” la popolazione comportando una distorsione dei risultati.

Questo lavoro ha per oggetto proprio i sondaggi di opinione via Web, i loro limiti e le loro potenzialità.

Il lavoro inizia con un’introduzione ai sondaggi d’opinione (primo capitolo) cercando di capire quanto la formulazione della domanda e la veridicità della risposta siano importanti per renderli affidabili. È noto infatti che se i sondaggi

(10)

Segue un primo accenno all’importanza che riveste Internet nella società d’oggi ed un’analisi dell’influenza che questo nuovo mezzo di comunicazione ha nella diffusione di mezzi di rilevazione dati più evoluti. Fare sondaggi tramite Internet ha sempre più senso, dato che il numero di coloro che si collegano alla rete è in forte crescita. Utilizzando Internet, siamo in grado di intervistare un numero molto maggiore di “consumatori” o di “elettori” rispetto a quanti ne avremmo potuti contattare tramite telefono o posta; questo ci consente di ottenere risultati affidabili in tempi molto più rapidi. Siamo in grado di eseguire indagini in più luoghi e in diverse lingue e di utilizzare video e immagini, cosa che non sarebbe possibile per telefono. Inoltre, la maggior parte delle persone ritiene che partecipare ad un sondaggio in linea sia molto più divertente che non ricevere una telefonata da un intervistatore mentre si sta cenando!

Proseguendo, nel secondo capitolo, l’attenzione si sposta sull’analisi della sempre più rapida espansione della rete Internet. Secondo alcuni dati pubblicati da Eurisko nel 2005 il numero totale di persone che accedono alla rete in Italia, anche occasionalmente, sarebbe salito a quasi 16 milioni su una popolazione residente di circa 58 milioni di abitanti; tuttavia possiamo affermare che l’evoluzione della rete è in continua e reale crescita ma non con un “moto uniformemente accelerato”. Ci sono rallentamenti, oscillazioni e discontinuità determinate dal quadro culturale, dalle scelte e dal comportamento delle persone. Comunque, si può affermare che l’Italia ormai è entrata nel mondo delle reti, non più con un nucleo relativamente piccolo di persone particolarmente interessate, ma con una diffusione in strati sociali e culturali sempre più ampia, anche se a livelli ancora modesti rispetto a quelli dei paesi più avanzati.

Nel terzo capitolo si passa poi ad analizzare più nel dettaglio l’evoluzione nella tecnologia dell'informazione, intesa nei suoi aspetti fondamentali di raccolta,

archiviazione, elaborazione e trasmissione dei dati, aspetti che negli ultimi anni hanno avuto notevoli riflessi sul modo di condurre le indagini statistiche.

(11)

Nel capitolo si propone una classificazione delle indagini statistiche via Internet (dette anche indagini on-line) di cui i sondaggi Web, o meglio le indagini statistiche via web, costituiscono un sottoinsieme.

Per capire a fondo le possibilità ed i limiti dei sondaggi Web si è passati ad analizzarne i loro punti di forza e di debolezza. Tra gli aspetti più attraenti delle indagini on-line emergono i loro bassi costi e tempi di realizzazione. Tuttavia nei sondaggi web emerge un problema: essi si basano su risposte di un campione statisticamente non rappresentativo della popolazione, trattandosi di “volontari” autoselezionati. Quindi i sondaggi on-line presenti nei vari siti Web possono avere un valore statistico puramente indicativo, in quanto il campione non viene selezionato secondo criteri probabilistici. Comunque se inseriamo questo tipo di sondaggi in contesti di ricerca più ampi, il loro contributo può diventare prezioso. La cosiddetta distorsione da autoselezione è il principale problema dei sondaggi Web. Con la loro diffusione è indispensabile sviluppare nuovi studi per proporre metodi per correggerla; in questo lavoro utilizzeremo le tecniche del Propensity

Score Matching (PSM) e del Propensity Score Adjustment (PSA).

Nel quarto capitolo presenteremo brevemente il contesto originario nel quale la tecnica del PSM ha preso forma e i suoi successivi sviluppi.

Gli ultimi tre capitoli (V, VI e VII) riportano infine i risultati della parte più operativa del lavoro.

Nel quinto capitolo vengono presentati i principali risultati emersi da un recente studio dell’Università del Maryland (USA); tale studio si basa sulla ponderazione con il “propensity score” come metodo per risolvere il problema usando i pesi derivati dai propensity come aggiustamento (PSA).

Nel sesto capitolo, tramite l’analisi di un recente studio dell’Università di Linköping (Svezia), si analizzano le stime della varianza degli stimatori che si ottengono applicando, ai risultati di un sondaggio Web, un PSA con il supporto di un campione estratto telefonicamente, ipotizzando noti i propensity scores da

(12)

Applicando il PSA si vede che ridurre la distorsione da autoselezione è possibile. Il prezzo da pagare è un aumento della variabilità degli stimatori.

Nel settimo capitolo presentiamo lo stimatore di “tipo” Horvitz e Thompson (H-T) come strumento per applicare il PSA qualora si abbiano informazioni sull’intera popolazione proveniente da un registro amministrativo; in tal caso, stimando la probabilità di partecipare al sondaggio Web, la si usa come base per il PSM e il conseguente PSA. La variabilità di tale stimatore viene studiata sia analiticamente sia per via empirica. Analizziamo, inoltre, il metodo “Bootstrap” per stimare la variabilità dello stimatore “H-T”.

Presentiamo una simulazione e dallo studio dei dati ottenuti si vede che è possibile superare il limite del PSA già evidenziato precedentemente. Vedremo che non sempre la riduzione della distorsione comporta un aumento di variabilità degli stimatori.

Le procedure applicate per la simulazione analizzata in questo capitolo sono create secondo il linguaggio di programmazione statistica “R”; alcuni esempi di tali procedure verranno allegati alla presente tesi.

In appendice viene riportato un testo nel quale si è cercato di identificare alcuni validi accorgimenti per un’accurata progettazione e costruzione del questionario Web. Questa fase dell’indagine rappresenta, infatti, uno dei momenti più delicati e impegnativi per il ricercatore poiché può condizionare il buon esito di tutta la rilevazione.

L’appendice comprende, inoltre, un breve cenno teorico relativo al metodo bootstrap per la stima della varianza degli stimatori.

(13)
(14)
(15)

Capitolo 1

I SONDAGGI D’OPINIONE

“… Affidabili o imprecisi, scientifici o improvvisati, i sondaggi fanno parte della

nostra vita. Attraverso di essi, i media ci presentano gli atteggiamenti dell’”opinione pubblica” su questioni di rilievo; le aziende se ne servono per lanciare prodotti o per registrarne il gradimento, e a essi ricorrono i partiti politici per conoscere – o influenzare – gli orientamenti dei cittadini. Ma come è possibile stabilire la diffusione di un’opinione senza interpellare tutti coloro di cui si vuole riportare il parere? Come si imposta un “campione” di persone che sia realmente rappresentativo? E soprattutto: che cosa possono o non possono dirci i sondaggi?...”1

1.1 COS’È UN SONDAGGIO

Quando leggiamo un quotidiano, guardiamo il telegiornale o ascoltiamo la radio, riceviamo delle informazioni su temi che possono colpirci e farci riflettere, inducendoci a prendere posizione sul tema in questione, e a formarci quindi un’opinione. L’opinione del singolo contribuisce a formare l’opinione comune, quella della gente. Come si fa a sapere “che cosa pensa la gente al riguardo?”. Il sondaggio d’opinione è lo strumento che ci permette di procurarci le diverse informazioni necessarie a soddisfare il nostro interesse.

Si tratta di domande rivolte a singoli individui, allo scopo di ottenere delle informazioni non su di essi personalmente, ma sul gruppo o sulla popolazione di cui essi stessi fanno parte.

(16)

Il sondaggio è dunque un metodo per raccogliere delle informazioni su una “popolazione”, attraverso una serie di domande poste direttamente a un gruppo di persone scelte “in rappresentanza” di questa stessa popolazione.

In linea di principio la popolazione di un sondaggio può essere una qualunque categoria di persone, di dimensioni più o meno grandi: i militari, gli studenti di una determinata scuola media, …

I sondaggi utilizzano una tecnica particolare per raccogliere le informazioni: l’intervista, condotta attraverso questionari standardizzati, cioè identici per tutti gli intervistati.

Le interviste possono essere realizzate con vari metodi. Il metodo più diffuso è ormai quello dell’intervista telefonica, ma per certi tipi di sondaggio restano più frequenti le interviste faccia a faccia, con l’intervistatore che si reca a casa della persona da intervistare, e quelle auto-somministrate, in cui i questionari stampati vengono compilati dagli intervistati stessi; una variante recente ma sempre più diffusa di intervista auto-somministrata è quella effettuata per via telematica, in questo caso, l’intervistato riceve il questionario a casa su un apposito computer e risponde alle varie domande che appaiono sullo schermo. Le risposte vengono poi trasmesse automaticamente all’istituto di ricerca, che può subito analizzarle attraverso l’uso di programmi specifici, in grado anche di verificare in tempo reale il numero di rispondenti effettivi e di fornire altre informazioni statistiche sulle caratteristiche e sull’affidabilità del sondaggio; sulla stessa linea si sta attualmente diffondendo l’intervista web, con la quale il questionario viene incontrato dal possibile rispondente navigando su internet. Questo tipo di intervista richiede meno tempo ed è meno costosa.

La selezione dei soggetti su cui effettuare il sondaggio è fatta attraverso la tecnica statistica del “campionamento”. È proprio grazie al campionamento che i risultati ottenuti sul campione potranno essere estesi all’intera popolazione esaminata.

(17)

Il primo segue lo stesso principio dell’estrazione a sorte, quello della

casualità assoluta. Secondo questo principio, garantendo a ogni membro di una popolazione una probabilità nota di essere introdotto nel campione, si garantisce che il campione sarà rappresentativo della popolazione stessa, e cioè che ne rifletterà le caratteristiche.

Il secondo prevede la scelta deliberata (e quindi non casuale) di un certo

numero di persone da una popolazione in base alle loro caratteristiche, in modo che l’insieme di queste caratteristiche sia equivalente nella popolazione e nel campione.

L’utilità dei sondaggi di opinione è oggi indiscussa. Per conoscere un atteggiamento che non può essere immediatamente osservato, e che non può neppure essere rilevato in modo diretto presso tutti i membri di una popolazione, è necessario ricorrere alla tecnica del sondaggio d’opinione. I sondaggi d’opinione permettono di fornire una conoscenza delle opinioni e degli atteggiamenti dei cittadini, principalmente da tre punti di vista:

1. la qualità delle persone che hanno una determinata opinione;

2. la tipologia di tali persone;

3. l’intensità con cui esse sostengono questa opinione.

La specificità dei sondaggi d’opinione è dunque di indagare sulle opinioni e sugli

atteggiamenti della gente.

I committenti dei sondaggi possono essere i più diversi. Se si parla di sondaggi in generale, bisogna sapere che quelli commerciali condotti sui consumatori costituiscono di gran lunga il tipo di sondaggio più diffuso. Aziende operanti in qualunque settore, infatti, possono avere interesse a far eseguire un’indagine di mercato che sondi le aspettative dei consumatori, in modo da mirare i propri investimenti in modo più efficace.

(18)

Specialmente in periodi preelettorali, i partiti politici, ma anche singoli candidati a titolo individuale, né commissionano un gran numero.

Di solito i sondaggi sono condotti da appositi istituti privati, talvolta specializzati in sondaggi d’opinione, più spesso abituati a dividere le proprie attività fra studio dell’opinione pubblica e ricerche di mercato. Altri tipi di sondaggi, che per la complessità e la completezza dei loro questionari devono spesso essere considerati come dei veri e propri studi d’opinione, sono generalmente condotti da istituti universitari, con finalità di ricerca scientifica.

Come già accennato, un esempio ormai frequente è quello dei “sondaggi” condotti via internet. Su una grande quantità di pagine web è facile trovare una “domanda del giorno”, alla quale il “visitatore” è invitato a rispondere semplicemente cliccando sulla risposta che corrisponde alla propria opinione. In questo caso alle distorsioni che caratterizzano gli pseudo-polls televisivi se ne aggiunge un’altra: gli utenti di internet sono ancora molto diversi per fascia di età, categoria professionale, livello di istruzione, … dalla media della popolazione nazionale, e certo più diversi di quanto non lo siano gli utenti della televisione; è dunque ancora più improbabile che l’opinione dei visitatori di una pagina web coincida con l’opinione media della gente.

La distorsione dei risultati potrebbe però essere corretta. Esistono tecniche statistiche che possono tentare di ridurre la distorsione nei risultati e aiutare a superare il problema.

L’obiettivo di questo elaborato è proprio quello di presentare tali tecniche statistiche e di vedere se con l’utilizzo di una metodologia corretta è possibile eliminare il problema

1.2 AFFIDABILITÀ DEI SONDAGGI

Sino a che punto sono affidabili i sondaggi d'opinione e altre forme di test? Quanto dipende dal modo in cui viene formulata la domanda e, soprattutto, dalla

(19)

veridicità della risposta? Il primo aspetto è in gran parte metodologico, dipende cioè dalla struttura "implicita" delle domande di un sondaggio: sul secondo punto bisogna essere sempre dubbiosi in quanto la menzogna è sempre in agguato. Quando si parla dei risultati di uno dei tanti sondaggi d'opinione, dobbiamo sempre chiederci che tipo di domande sono state formulate e quali opzioni sono state contemplate: le risposte, infatti, possono essere di segno contrario a seconda di ciò che viene chiesto e delle opzioni date.

Uno degli aspetti più noti in proposito riguarda la diversità delle risposte a seconda che la domanda contempli due o più soluzioni, come indica uno studio ormai classico che risale ai tempi della guerra del Vietnam, quando negli USA venne fatto un sondaggio in cui si chiedeva se il ritiro delle truppe americane dovesse procedere a un ritmo più veloce o più lento.

La maggior parte delle persone si manifestò in favore del "ritmo più veloce" cosicché nel luglio del 1969 i giornali indicarono con grande evidenza che l'opinione pubblica chiedeva una rapida ritirata. Ma se il sondaggio comporta una terza alternativa, ad esempio "le truppe devono ritirarsi al ritmo con cui si stanno ritirando ora", la maggioranza opterà per questa opzione e i giornali titoleranno, come fecero qualche settimana dopo il primo sondaggio, "Inversione di rotta nell'opinione pubblica, gli americani sono a favore della politica attuale". Gli psicologi sociali conoscono bene questo "trucco" e sanno che l'aggiunta di una terza possibilità a due opzioni in contrasto tra di loro, fa sì che dal 10 al 40% degli interrogati cambi opinione in favore della "terza via", soprattutto se è più sicura e tradizionale... Un'inversione della scelta avviene anche quando si manipolano alcuni termini come "consentire" o "proibire". In un classico studio di psicologia sociale si chiese a un gruppo di persone di rispondere a queste due domande: "Ritieni che la legge dovrebbe consentire che vengano tenuti dei discorsi in pubblico contro la democrazia?"; "Ritieni che la legge dovrebbe

proibire che vengano tenuti dei discorsi in pubblico contro la democrazia?" Benché queste due domande abbiano lo stesso significato, si vide che quando

(20)

si dimostrava d'accordo con l'atteggiamento "repressivo". Esiste quindi un metodo che va rispettato se si vuole che i risultati delle "inchieste" rispecchino la realtà e non si prestino ai fini di chi li utilizza, come spesso avviene in tanti tele-sondaggi. Ma esiste anche un altro aspetto non meno importante: quanto possiamo fidarci delle affermazioni che vengono fatte? La gente dice la verità oppure ci inganna? Un recente studio compiuto alla Johns Hopkins University di Baltimora indica che in numerosi test le persone tendono a mentire, anche in quei casi in cui la menzogna potrebbe avere conseguenze negative come il non seguire i consigli del medico.

Nello studio clinico dell'Università di Baltimora più di 5000 persone sofferenti d'asma dovevano inalare uno spray contro l'asma in base a orari e dosi concordate col medico. Le persone coinvolte ignoravano che alle bombolette era connesso un chip che registrava quando e come esse venivano utilizzate: ebbene, il 30% del campione le svuotava in aria ma assicurava di averne fatto un uso corretto mentre i pazienti che erano stati informati dell'esistenza del chip non baravano coi medici. Le persone, perciò, possono mentire anche quando un test riguarda la loro salute, anche quando affermano di curarsi secondo le "regole" concordate col loro medico: figuriamoci quando si chiedono loro notizie connesse ad argomenti "caldi" quali la loro sessualità o altri temi "privati". Se non sono eseguiti da esperti (e in buona fede), i sondaggi possono quindi essere doppiamente viziati: dal modo in cui viene posta la domanda e dalla tendenza a mentire o a dissimulare di una parte del campione.

1.3 L’IMPORTANZA DEI SONDAGGI

I sondaggi costituiscono il modo in cui i punti di vista, le preoccupazioni e le opinioni della gente vengono comunicati a persone autorevoli responsabili delle decisioni, indipendentemente dal fatto che siano leader politici, dirigenti di organizzazioni no-profit, o di società pubbliche o private. Dopo tutto, non ci è

(21)

concesso di votare sulle nuove leggi, sull'invio o meno di truppe in guerra, o su un nuovo gusto di gelato. In qualità di cittadini e di consumatori, dobbiamo fidarci delle persone responsabili delle decisioni migliori per noi.

Ed è in questo ambito che servono i sondaggi. I sondaggi sono diventati un mezzo importante per le amministrazioni pubbliche e per i dirigenti d'impresa. I leader si avvalgono delle informazioni fornite agli intervistatori per operare le opportune scelte che possono riguardare noi tutti.

Perché i leader si servono dei sondaggi? Perché le opinioni dei cittadini sono importanti. I capi di governo e i dirigenti d'impresa sono consapevoli del fatto di non potersi permettere di perdere il contatto con l'opinione pubblica. Se lo facessero, correrebbero il rischio di non essere eletti, o le loro aziende rischierebbero di fallire. Il loro potere deriva dalla loro capacità di rappresentare fedelmente i punti di vista, le idee e le preferenze dei cittadini. Essi fanno affidamento sui sondaggi per comprendere le opinioni delle persone.

1.4 NUOVI SVILUPPI TECNOLOGICI

Man mano che il nostro mondo ha conosciuto nuovi sviluppi tecnologici, anche le metodiche utilizzate per condurre sondaggi e ricerche si sono fortemente evolute.

Una volta la maggior parte dei sondaggi veniva svolta con il metodo "porta a porta". Questo funzionava in un'epoca in cui le persone trascorrevano a casa la maggior parte del loro tempo. Successivamente, gli intervistatori utilizzarono i servizi postali (come ancora oggi fanno in molti) per eseguire i sondaggi. Il problema è che oggigiorno la gente riceve molta posta inutile, e solamente una persona su dieci risponde ad un sondaggio inviato tramite posta.

(22)

economiche; inoltre la maggior parte delle persone non desidera essere contattata per un sondaggio mentre sta cenando o guardando la televisione.

Ma oggi è possibile sperimentare un servizio avvincente e innovativo. Fare sondaggi tramite Internet ha sempre più senso, dato che molta gente si collega a Internet, e il numero di tali persone è in forte crescita, come vedremo nel capitolo 2. Utilizzando Internet, siamo in grado di intervistare un numero molto maggiore di consumatori rispetto a quanti ne avremmo potuti contattare tramite telefono o posta; questo ci consente di ottenere risultati affidabili in tempi molto più rapidi. Inoltre fare sondaggi o indagini tramite Internet risulta più economico e veloce. Siamo così in grado di eseguire indagini in più luoghi e in diverse lingue e di utilizzare video e immagini, cosa che non sarebbe possibile per telefono. Inoltre, la maggior parte delle persone ritiene che partecipare a un sondaggio in linea sia molto più divertente che non ricevere una telefonata da un intervistatore mentre si sta cenando!

Grazie alla sua velocità, precisione ed efficacia, l'indagine tramite Internet potrà rendere obsolete tutte le precedenti tecnologie d'indagine. Infatti, navigando nei più svariati siti presenti attualmente in rete si incontra un elevato numero di sondaggi su ogni tipo di argomento; questo perché il sondaggio on line è un puntuale osservatorio politico, sociale ma anche economico, che si sta sempre più diffondendo; esso fornisce analisi statistiche atte a misurare l'opinione di una popolazione, di un gruppo, detto target (o community) su questioni di attualità. E', inoltre, molto più agile e meno costoso di una ricerca di mercato classica, ed è ideale quando si intende concentrarsi su una fotografia del presente (un esempio classico sono i sondaggi elettorali).

I sondaggi di opinione vengono effettuati presso campioni statisticamente rappresentativi e possono riguardare le tematiche più diverse. I sondaggi on-line soffrono però di un problema: essi si basano su risposte di un campione statisticamente non rappresentativo di soggetti in quanto autoselezionati. Quindi, bisogna tener presente che i sondaggi on line presenti nei vari siti sono sicuramente validi in linea di massima ma, per il momento, statisticamente hanno

(23)

valore puramente indicativo, in quanto il campione non viene selezionato secondo criteri socio-demografici, né si sono potute esercitare le consuete verifiche sulle risposte. Ma, se inseriti nel contesto di ricerche più ampie, anche i sondaggi on line possono diventare preziosi.

(24)
(25)

Capitolo 2

LA DIFFUSIONE DI INTERNET IN ITALIA

"Internet diventa sempre più centrale nella quotidianità delle persone e diventa sempre più penetrato su fasce allargate della popolazione"2.

In tutte le ricerche “demoscopiche” ci sono problemi di interpretazione e di significatività dei dati, che derivano principalmente dalla validità statistica del “campione”; è infatti ragionevole supporre che i dati sul numero di “utenti” di internet, in tutto il mondo, siano imprecisi, poco attendibili e quasi sempre esagerati. Non è irrealistico affermare che più di venti milioni di persone in Italia “possono disporre” di un collegamento ad internet ma, ciò non significa che lo usino.

Più rilevante dei “numeri assoluti” è l’analisi per categorie demografiche. Da tre o quattro anni la situazione è sostanzialmente cambiata. Internet in Italia non è ancora “per tutti” ma non è più “per pochi”; esiste una tendenza non sempre veloce, ma solida e durevole, ad un uso sempre più diffuso della rete.

Ma l’evoluzione non è costante né omogenea. Per esempio nel 2001 (non solo in Italia) c’è stato un rallentamento; nel 2002-2003 si sono rilevati periodi di stasi, o anche di diminuzione, dei collegamenti alla rete, che non sono sempre riconducibili alle abituali oscillazioni stagionali. Sembra che dalla seconda metà del 2003 ci sia una nuova fase di crescita, ma meno veloce che nel 1998-2000. Secondo alcuni dati pubblicati da Eurisko nel 2005 il numero totale di persone che accedono alla rete in Italia, anche occasionalmente, sarebbe salito a quasi 16 milioni, che si riducono a meno di 14 se si escludono gli accessi in situazioni esterne, come corsi di formazione, presso amici, in biblioteca o “bar” e a poco

(26)

meno di 10 se si considerano le persone che dicono di collegarsi “almeno una volta alla settimana”. Sono fra i 4 e i 5 milioni le persone che dicono di usare internet tutti i giorni (fonte: Eurisko).

Eurisko ritiene che il “potenziale di sviluppo” sia poco oltre i 26 milioni di persone (e che quindi l’attuale “penetrazione” sia circa il 50 %). Ma, se questa è un’ipotesi ragionevole nelle prospettive attuali di utilizzo della rete, la situazione nei prossimi anni potrebbe essere diversa in base a evoluzioni delle risorse disponibili e dei modi di utilizzo che è difficile prevedere. L’andamento di internet in generale, e particolarmente nei paesi più evoluti, indica che siamo lontani da un’ipotetica “soglia di saturazione” (fonte: Eurisko).

Se la tendenza continuasse con il ritmo che si è rilevato in periodi recenti si potrebbe arrivare a un raddoppio in cinque anni. Tuttavia non sono da escludere nuovi e imprevedibili rallentamenti, oppure un “salto di qualità” nei contenuti e dei servizi e la diffusione di una più seria e concreta cultura della rete che potrebbero innescare sviluppi capaci di andare molto oltre le dimensioni oggi prevedibili.

Nel seguente grafico basato sulle rilevazioni di Eurisko si riassume l’evoluzione, su base semestrale, dal dicembre 1997 al giugno 2005 degli “Utenti” internet in Italia 1997-2005:

2.1 “UTENTI” INTERNET IN ITALIA 1997-2005

(27)

In questo grafico la definizione di “utente” è molto estesa. Si riferisce a persone che “dicono di essersi collegate almeno una volta negli ultimi tre mesi”.

Si nota una forte differenza fra l’uso “domestico” e quello “dal lavoro”. In passato la rete in Italia si era sviluppata soprattutto negli uffici (fino al 1998 anche l’uso “da scuola” era superiore a quello “da casa”). Dall’inizio del 2000 si è esteso di più nelle famiglie ma sembra che da due anni sia in atto una tendenza diversa, con una nuova crescita dei collegamenti dall’ufficio.

Le furibonde campagne promozionali delle compagnie telefoniche e dei provider internet per vendere “connessioni veloci” hanno avuto un notevole, quanto immeritato, successo. Il numero di persone in Italia che usano connessioni adsl è quasi raddoppiato in un anno (da 3,3 milioni nel luglio 2004 a 6,5 milioni nel luglio 2005). Il totale (comprese adsl, isdn e fibra ottica) è circa 7 milioni, cioè il 40% delle persone che hanno un collegamento ad internet.

Il grafico che segue indica linee di tendenza basate sulle rilevazioni di Eurisko dal gennaio 2001 al luglio 2005. I dati si riferiscono a “utenti” relativamente “abituali” (cioè persone che dicono di essersi collegate ad internet “almeno una volta negli ultimi 7 giorni”):

2.2 “UTENTI” INTERNET IN ITALIA GENNAIO 2001 – LUGLIO 2005

(28)

Nonostante le oscillazioni, non solo stagionali si conferma una tendenza in crescita. Per la prima volta nell’aprile 2005 il numero totale di persone che dicono di essersi collegate “negli ultimi sette giorni” ha superato i dieci milioni. L’uso della rete dal luogo di lavoro, dopo alcune diminuzioni e una lunga fase statica, sembra in ripresa dall’autunno 2003. I dati da marzo a giugno 2005 segnano un “massimo storico”, che supera del 21 % il precedente livello più alto (maggio 2004). Nel luglio 2005 rispetto a un anno prima la crescita dei collegamenti è del 18%, uguale dal luogo di lavoro e da casa. Quest’anno (come l’anno scorso) l’aumento è maggiore negli uffici rispetto all’uso “domestico”. Si conferma, comunque, che continua a crescere la diffusione della rete in Italia Un quadro diverso risulta da un’altra fonte. Secondo Nielsen NetRatings questo sarebbe l’andamento dall’aprile 2004 all’agosto 2005:

2.3 “UTENTI” INTERNET IN ITALIA APRILE 2004 – AGOSTO 2005

(NUMERI IN MIGLIAIA)

In questo caso la definizione di “utenti” è molto estesa e il metodo di rilevazione tende a sopravvalutare le quantità (perciò l’attendibilità dei dati è discutibile). In base a questa ricerca si era rilevato uno sviluppo notevole dal settembre 2003 al gennaio 2004, mentre sembra che l’andamento sia meno dinamico nei periodi successivi. Tuttavia la crescita c’è e non si può definire “lenta”. Secondo questa fonte l’aumento in un anno (prima della diminuzione stagionale, cioè dal giugno 2004 al giugno 2005) è dell’11% in totale, del 9% nell’uso “domestico”.

(29)

2.1 CONFRONTO DELLA SITUAZIONE ITALIANA CON

ALCUNI DATI INTERNAZIONALI

Risulta una situazione di scarsa crescita nel resto dell’Europa. Vediamo, per esempio, un confronto fra i cinque paesi europei con il maggior numero di persone on-line:

2.4 “UTENTI” INTERNET IN CINQUE PAESI 2003 – 2004

(PERCENTUALI SULLA POPOLAZIONE, DATI TRIMESTRALI)

I dati, anche in questo caso, sono sopravvalutati per una definizione molto estesa di “utente”. In un quadro che appare generalmente statico, è curioso il cambiamento in Italia (secondo questa fonte) fra il terzo trimestre 2003 e il primo 2004. Anche da altre fonti si rileva un recente sviluppo in Francia (finora non sono disponibili aggiornamenti per il 2005; è ipotizzabile che attualmente la percentuale di “utenti” internet qui analizzata in riferimento alla Gran Bretagna e alla Germania sia già satura).

Continuano a esserci, anche su scala internazionale, valutazioni poco attendibili per quanto riguarda il numero di persone che usano internet. Per esempio circolano da dieci anni affermazioni a proposito di “un miliardo di persone” collegate nel mondo, quando solo oggi le valutazioni più esagerate si avvicinano ai 900 milioni. È vero che la situazione è molto cambiata rispetto al passato, ma nove decimi dell’umanità sono ancora esclusi dall’uso della rete.

(30)

Il prossimo grafico mostra l’evoluzione, secondo Nielsen NetRatings, del numero di famiglie con accesso ad internet negli ultimi cinque anni nei cinque più “grandi” paesi dell’Europa occidentale.

2.5 ABITAZIONI CON ACCESSO AD INTERNET IN 5 PAESI EUROPEI 2000-2004

(PERCENTUALI SUL TOTALE FAMIGLIE)

La progressione è a distanza semestrale dal quarto trimestre 2000 al quarto 2004. La valutazione dei dati relativi ci dice che l’Italia si è avvicinata al livello della Gran Bretagna e della Germania. Per quanto riguarda il numero di “utenti”, secondo la stessa fonte, questa è la situazione in nove paesi alla fine del 2004.

2.6 “UTENTI” INTERNET IN 9 PAESI

(31)

La parte bianca delle barre indica le persone che hanno la disponibilità di una connessione, ma non l’hanno mai usata. Poiché questa fonte considera “utente” anche chi fa un uso molto sporadico della rete, qui è sottovalutata la quota di persone che “possono disporre” di un collegamento, ma non lo usano.

Da un’altra fonte questa risulta essere la densità rispetto alla popolazione nei primi 20 paesi del mondo per numero totale di persone on-line.

2.7 “UTENTI” INTERNET IN 20 PAESI

(PERCENTUALI SULLA POPOLAZIONE)

Anche in questo caso i numeri sono “sovrastimati” e una valutazione realistica è pensabile fra la metà e due terzi.

Da altre fonti la posizione dell’Italia risulta meno evoluta. Per esempio un comunicato diffuso da Eurostat (il servizio statistico dell’Unione Europea) il 13 maggio 2005 presenta una serie di dati riguardanti il primo trimestre del 2004.

(32)

la Francia, l’Irlanda e l’Olanda) mentre ci sono per tre che non fanno parte dell’Unione (Islanda, Norvegia e Turchia).

2.8 “UTENTI” INTERNET PER 100 ABITANTI IN 21 PAESI (DI CUI 18 NELL’UNIONE EUROPEA)

La situazione dell’Italia appare più arretrata di ciò che risulta da altre fonti in generale, e ancor più fra le donne. In due paesi (Finlandia ed Estonia) secondo questo studio si sarebbe raggiunta la parità.

(33)

2.2 INTERNET DA CASA

In Italia, come in altri paesi, c’è un ampio spazio potenziale ancora inutilizzato anche in termini di risorse tecniche che le famiglie (e gli uffici) hanno ma non usano. Il fatto è confermato da diverse fonti.

Circa metà delle persone in Italia che usano abitualmente un computer ha altrettanta “confidenza” con internet. Anche questo dato conferma che ampi spazi di possibile diffusione della rete dipendono da fattori umani e culturali più che dalle risorse e competenze tecniche.

Vediamo un aggiornamento di questa situazione in base ai dati Eurisko fino all’inizio del 2005.

2.9 USO DI INTERNET DA CASA

(MIGLIAIA DI PERSONE)

La parte più chiara delle barre indica il cambiamento in un anno (dalla fine del 2003 all’inizio del 2005)

Rimane alto il numero delle persone che hanno un personal computer ma non un collegamento alla rete, come di quelle che hanno un collegamento ma non lo usano. Meno della metà delle persone che hanno un computer in casa si collega, sia pure occasionalmente, ad internet. Il 57% delle persone che hanno un

(34)

Può essere interessante vedere come si è evoluta la situazione negli ultimi sette anni.

2.10 USO DI INTERNET DA CASA 1998-2004

(MIGLIAIA DI PERSONE)

Le definizioni “PC in casa” e “collegamento ad internet” non significano numero di macchine o di collegamenti installati, ma numero di persone che hanno in casa un computer o un collegamento alla rete

La diffusione di personal computer nelle case ha avuto una crescita costante, con un andamento quasi “lineare”, fino a quando nel 2004 si è registrato un rallentamento di tutti i valori. La percentuale di computer provvisti di un collegamento ad internet è aumentata velocemente dal 12% nel 1998 al 62% nel 2001, ma poi è rallentata ed ora sembra che si stia “assestando” un po’ sopra il 70%. Il numero di persone che dispongono di un collegamento, ma non lo usano, è continuamente aumentato dal 2001 al 2004.

I grafici che seguono sono basati sul rapporto semestrale di Eurisko del marzo 2005 (dati aggiornati fino a gennaio). In base a questi criteri non ci sono cambiamenti molto rilevanti rispetto al 2003.

(35)

2.3 “UTENTI” INTERNET PER GRANDI AREE

GEOGRAFICHE

Si tratta di un quadro che da tre o quattro anni rimane quasi invariato.

2.11 “UTENTI” INTERNET PER GRANDI AREE GEOGRAFICHE

(PERCENTUALI)

L’etichetta “% degli “utenti” internet” fa riferimento alla percentuale di utenti sulla popolazione dell’area, mentre con “% della popolazione” si intende indicare la distribuzione percentuale della popolazione italiana per grandi aree geografiche.

La situazione risulta cambiata rispetto a cinque o sei anni fa, ma rimane ancora una maggiore concentrazione nell’Italia settentrionale. I dati del 2004-2005 confermano che si sta consolidando uno stato di equilibrio nelle regioni centrali mentre nell’Italia meridionale e insulare, dopo un rilevante miglioramento tre o quattro anni fa, ora la situazione sembra stazionaria.

(36)

centro-sud. Ma ora sembra che queste differenze si stiano attenuando fino a diventare poco rilevanti.

Il prossimo grafico riguarda la suddivisione per grandezza di centri.

2.12 “UTENTI” INTERNET PER GRANDEZZA DI CENTRI

(PERCENTUALI)

Negli anni scorsi le differenze si erano molto attenuate, ma nell’ultimo periodo sembra che si manifesti di nuovo uno squilibro a favore dei centri più grandi. Comunque, ormai da parecchio tempo, non c’è più una concentrazione dominante nelle grandi aree urbane. L’uso della rete è distribuito su tutto il territorio. Il quadro non cambia se si considera l’uso “frequente” della rete. L’uso dal lavoro è, ovviamente, un po’ più concentrato nei “grandi centri”, ma anche da questo punto di vista le differenze si sono molto attenuate.

2.4 “UTENTI” INTERNET PER ETÀ

(37)

2.13 “UTENTI” INTERNET PER ETÀ

(PERCENTUALI)

C’era stato, a partire dal 2000-2001, un afflusso di giovani ma fra le persone che rimangono attive in rete sta di nuovo aumentando la presenza di adulti.

Secondo questa analisi il segmento tradizionalmente più forte (25-44 anni) sarebbe ora poco più della metà delle persone on-line. Una fascia più estesa di adulti, dai 25 ai 54 anni, è il 65% del totale (87% nel caso dei collegamenti dal luogo di lavoro).

Rimane ancora molto debole la diffusione della rete fra gli anziani, ma si cominciano a notare piccoli segni di miglioramento; naturalmente non è facile capire quanto ciò dipenda dall’afflusso di persone anziane che decidono di collegarsi o dall’invecchiamento di chi era già in rete anni fa ma, anche se non numerose, ci sono persone con più di settant’anni che imparano per la prima volta a usare internet e dimostrano di saperlo fare con abilità non inferiore a quella dei giovani.

Anche in questo caso si notano alcune differenze fra l’uso “domestico” e quello “dal lavoro”.

(38)

2.14 “UTENTI” INTERNET PER ETÀ

(PERCENTUALI)

Mentre i giovani si collegano più spesso da casa, l’uso dal luogo di lavoro è prevalentemente di persone “adulte”. Nell’uso “da scuola” sono ovviamente meno numerose, ma non assenti, le persone di età post-scolastica (probabilmente questo è dovuto alla partecipazione a corsi di formazione e aggiornamento oltre che alla presenza di insegnanti).

Un quadro analogo risulta dai nuovi dati del Censis (2004).

2.15 “UTENTI” INTERNET PER ETÀ

(39)

La parte più scura delle barre rappresenta l’uso “frequente” (“tutti i giorni o quasi”).

2.5 “UTENTI” INTERNET PER LIVELLO SCOLASTICO

L’analisi per “titolo di studio”conferma le tendenze già rilevate negli anni scorsi.

2.16 “UTENTI” INTERNET PER LIVELLO SCOLASTICO

(PERCENTUALI)

Un notevole cambiamento era avvenuto fra il 1998 e il 1999, con una maggiore diffusione della rete nei livelli “medi”. Ma in periodi più recenti sembra che la situazione si stia stabilizzando. Da un anno o due non si rilevano cambiamenti significativi. Due terzi delle persone on-line (il 72% nel caso dell’uso “frequente”) hanno un livello scolastico medio-superiore o universitario.

(40)

2.17 “UTENTI” INTERNET PER LIVELLO SCOLASTICO 1999-2005

(PERCENTUALI)

C’è stato un allargamento verso titoli di studio più bassi, ma rimane la concentrazione verso i livelli scolastici più alti.

Le differenze fra l’uso domestico e quello dal luogo di lavoro sono facilmente spiegabili.

2.18 “UTENTI” INTERNET PER LIVELLO SCOLASTICO

(PERCENTUALI)

Le persone con un livello educativo più basso svolgono più spesso attività di lavoro in cui non è necessario o rilevante l’uso della rete. Inoltre l’uso “domestico” è diffuso fra i giovani che non hanno ancora completato il loro percorso scolastico.

(41)

2.6 “UTENTI” INTERNET IN BASE AL REDDITO

2.19 “UTENTI” INTERNET IN BASE AL REDDITO

(PERCENTUALI)

Il grafico 2.19 si basa su una suddivisione della popolazione in cinque classi determinate in base all’entità del reddito percepito. I dati del 2004 non indicano variazioni significative rispetto al 2003. Ma nel medio-lungo periodo la situazione tende a equilibrarsi. Ormai non c’è più un distacco rilevante nella penetrazione della rete fra i livelli “medi” e “alti”. Benché anche questa differenza si sia attenuata si nota ancora un uso più frequente di internet nelle fasce di reddito più alto.

2.20 “UTENTI” INTERNET IN BASE AL REDDITO 1999-2005

(42)

È aumentata la diffusione nei redditi “medi”. Queste sono le differenze fra l’uso da casa e dal lavoro:

2.21 “UTENTI” INTERNET IN BASE AL REDDITO

(PERCENTUALI)

Come per il livello scolastico, è comprensibile una maggiore concentrazione nei redditi più alti dell’uso della rete dal luogo di lavoro.

(43)

2.7 “UTENTI” INTERNET PER TIPO DI ATTIVITÀ

2.22 “UTENTI” INTERNET PER TIPO DI ATTIVITÀ

(PERCENTUALI)

Non ci sono novità significative nel 2003-2004, ma si conferma un allargamento nell’uso della rete a categorie più ampie, con una notevole diffusione fra gli impiegati e gli insegnanti.

Non si rileva un’ulteriore crescita nella categoria “studenti” dopo gli aumenti registrati negli anni precedenti. La forte presenza di studenti on-line, mentre non aumentano i collegamenti “da scuola”, si spiega con la maggiore diffusione delle “utenze domestiche”, particolarmente fra i giovani. Ma è un sintomo di usi della rete che poco hanno a che fare con lo studio e con l’approfondimento culturale. Le differenze fra l’uso da casa e dall’ufficio sono ovvie, con un maggior uso della rete per motivi di lavoro da parte di imprenditori, dirigenti, professionisti, impiegati e insegnanti. Non si rileva alcuno sviluppo nella presenza on-line delle “casalinghe”.

(44)

2.8 “UTENTI” INTERNET E CONOSCENZA

DELL’INGLESE

2.23 CONOSCENZA DELL’INGLESE

(PERCENTUALI)

Con l’allargamento a categorie culturali ed economiche più ampie è ovvio che diminuisca la percentuale di persone on-line che pensano di “sapere bene” l’inglese (ma non si rileva una diminuzione di quelle che dicono di capirlo “così così”). Comunque la conoscenza della lingua internazionale rimane molto più alta fra gli “utenti” di internet che nella popolazione in generale.

Intanto è molto aumentata la disponibilità di materiale in italiano in internet.

2.9 “UTENTI” INTERNET E PERCENTUALE DI DONNE

IN RETE

(45)

2.24 PERCENTUALE DI DONNE IN RETE

(PERCENTUALE SUL TOTALE “UTENTI INTERNET” IN CIASCUNA CATEGORIA)

Alla fine del 2003 le donne risultavano essere il 41% delle persone che si collegano ad internet in Italia. Un anno più tardi sembra che (per la prima volta) la percentuale non sia aumentata. Mentre in periodi precedenti si era rilevato un 50% di donne fra le “nuove” persone on-line, ora sembra che siano il 46% (che, comunque, non è un livello “basso”, specialmente se confrontato alla situazione di alcuni anni fa). Nell’uso “frequente” (ultimi sette giorni) la presenza femminile è un pò più bassa (39%). Evoluzioni come questa sono valutabili solo su periodi più lunghi. È probabile che la tendenza continui ad avvicinarsi alla “parità”.

La percentuale di donne on-line è in continuo aumento anche in altri paesi. La tendenza si conferma nei paesi più evoluti anche fuori dall’Europa (ad esempio negli Stati Uniti) ed è probabile che gli sviluppi internazionali contribuiscano a un’ulteriore evoluzione in Italia.

Tre o quattro anni fa sembrava che in Italia fosse più alta la percentuale di donne fra le persone che si collegano dal posto di lavoro; poi è aumentato l’uso di internet da casa.

(46)

Da uno studio del Censis pubblicato nel marzo 2005 (dati del 2004) risulta una situazione un po’ meno incoraggiante: le donne sono il 38% delle persone che usano internet in Italia.

Nel grafico vediamo le percentuali rispetto alla popolazione.

2.25 UOMINI E DONNE CHE USANO L’INTERNET

(PERCENTUALI SULLA POPOLAZIONE)

La parte più scura delle barre rappresenta l’uso “frequente” (“tutti i giorni o quasi”).

Secondo questa fonte la presenza femminile (comunque migliorata rispetto al passato) è ancora relativamente debole, soprattutto nell’uso “frequente”.

2.10 “UTENTI” INTERNET E “ANZIANITÀ” NELL’USO

DELLA RETE

Il prossimo grafico mostra come si suddividono le persone oggi collegate ad internet in Italia per “anzianità” nell’uso della rete.

(47)

2.26 QUANDO HANNO COMINCIATO A COLLEGARSI

(PERCENTUALI SUL TOTALE DI “UTENTI INTERNET”)

Il dato non definisce il numero di persone che erano collegate, ma il livello di “anzianità” on-line di dette persone oggi.

Sta diminuendo la percentuale di persone “inesperte” e comunque non è molto ragionevole pensare che i “nuovi utenti” siano impreparati e facilmente manipolabili. Molte persone imparano in fretta (specialmente quelle che usano internet più spesso). Oltre l’80% dei nuovi arrivati dice di basarsi, per orientarsi nella rete, soprattutto sull’esperienza di persone che sono da più tempo on-line. Ci sono differenze, abbastanza ovvie di “anzianità” fra chi usa internet da casa e chi si collega dal luogo di lavoro.

2.27 QUANDO HANNO COMINCIATO A COLLEGARSI

(48)

L’uso dal lavoro era prevalente fino al 1999. Poi è cresciuto di più l’uso da casa e nel 2002-2004 sembra che la situazione si stia equilibrando.

Due terzi delle persone che usano la rete per lavoro hanno quattro o più anni di esperienza.

2.11 USO DI RISORSE DI INFORMAZIONE E

COMUNICAZIONE IN ITALIA

Il prossimo grafico, basato sul nuovo rapporto del Censis (dati del 2004), riguarda la diffusione dei sistemi e delle risorse di informazione e di comunicazione in Italia.

2.28 USO DI RISORSE DI INFORMAZIONE E COMUNICAZIONE IN ITALIA

(PERCENTUALI SU TOTALE POPOLAZIONE)

Anche questo studio conferma che internet ha una presenza ancora modesta, ma non più “marginale”, nel patrimonio di informazione e comunicazione degli italiani. Conferma inoltre che l’uso della rete non è sostitutivo, ma convive con l’utilizzo di altri strumenti. Le persone attive on-line sono quelle che leggono di più e usano più spesso altre risorse. C’è una forte divisione fra i “meno abbienti”

(49)

di informazione e comunicazione (la cui risorsa dominante, se non unica, è la televisione) e chi ha un ambito culturale “più ricco” con una gamma estesa di strumenti.

In conclusione possiamo affermare che l’evoluzione della rete è in continua e reale crescita ma non con un “moto uniformemente accelerato”. Ci sono rallentamenti, oscillazioni e discontinuità determinate dal quadro culturale e dalle scelte e dal comportamento delle persone.

L’Italia ormai è entrata nel mondo delle reti, non più con un nucleo relativamente piccolo di persone particolarmente interessate, ma con una diffusione in strati sociali e culturali sempre più ampi, anche se a livelli ancora modesti rispetto a quelli dei paesi più avanzati.

(50)
(51)

Capitolo 3

EVOLUZIONE DELLE TECNICHE DI INDAGINE

3.1 ASPETTI METODOLOGICI DELLE INDAGINI VIA

INTERNET

Tra i contributi più recenti relativi allo sviluppo delle metodologie di indagine è da sottolineare che molti studi sono stati originati dall’evoluzione delle tecnologie di telecomunicazione, altri sono iniziati per l’esigenza di fare indagini su popolazioni di natura speciale.

Per quanto riguarda il primo filone, le tecnologie di telecomunicazione (dal telefono a Internet) hanno aperto nuove possibilità per l’individuazione della popolazione delle famiglie e delle imprese. Fino dagli anni settanta la diffusione del telefono tra le famiglie e le imprese ha risvegliato l’interesse sulle tecniche di generazione casuale dei numeri di telefono (Random Digit Dialing, RDD) come strumento per la selezione del campione di soggetti da intervistare. Attualmente, le indagini telefoniche rappresentano gran parte delle indagini di opinione e di mercato ed anche i produttori di statistiche ufficiali si avvalgono di questo strumento per la selezione ed il contatto con i rispondenti. Il recente sviluppo di Internet rende poi appetibile anche questo strumento per il contatto e l’intervista di campioni di famiglie, ma soprattutto di imprese, presso le quali la penetrazione di Internet è, al momento e in Italia, maggiore.3

L’evoluzione nella tecnologia dell'informazione, intesa nei suoi aspetti

fondamentali di raccolta, archiviazione, elaborazione e trasmissione dei dati, ha avuto, negli ultimi anni, notevoli riflessi sul modo di condurre le indagini statistiche.

(52)

L’interscambio elettronico dei dati (EDI, Electronic Data Interchange) ha permesso di rivoluzionare la procedura di indagine, eliminando la figura dell’intervistatore e scaricando i dati necessari direttamente dal sistema informativo del rispondente, previo il suo consenso informato.

Il futuro vedrà un sempre maggior ricorso ad Internet per la rilevazione dei dati sulle famiglie e sulle imprese. La diffusione di Internet è crescente nel nostro paese. Si parla di almeno 12 milioni di utenze ad ottobre del 2000.4 La rilevazione Computer Assisted Web Interviewing (CAWI) è già un dato di fatto per alcune indagini di mercato e sono in corso sperimentazioni del sistema anche per le indagini sulle imprese.5

Internet non sostituirà i già tradizionali metodi di intervista telefonica e faccia a faccia, ma di sicuro li integrerà richiedendo al contempo nuovi sviluppi metodologici. Infatti lo schema di estrazione dall’urna, che è il fondamento dell’inferenza per campioni da popolazioni finite, attualmente mal si adatta all’indagine Internet per la mancanza di liste complete ed aggiornate di utenti della rete. Allo stato attuale, l’auto-intervista via rete è il frutto spesso dell’auto-selezione di gruppi di popolazione invitati on-line a partecipare all’indagine. Dalla massiccia diffusione delle reti telematiche si è arrivati alla definizione di metodologie di rilevazione sempre più evolute dal punto di vista informatico. Tra queste ricordiamo la sopra citata tecnica CAWI che, con il supporto della rete Internet, consente la creazione di questionari elettronici interattivi posizionabili all’interno di pagine web6 e compilabili direttamente on-line.

Attraverso la Rete il costo unitario di contatto può diventare talmente basso da permettere al ricercatore di raggiungere un’intera popolazione a costi che prima erano sufficienti a raggiungere solo le unità di un singolo campione.

Pur essendo tanti i punti di forza di tali indagini, non mancano gli ostacoli da affrontare per una loro valida applicazione in ambito scientifico.

4 Between ICT Brokers, 2000 5 Biffignandi e Pratesi, 2000 6 Kent e Lee, 1999

(53)

Questi ed altri argomenti sono il tema portante discusso nei seguenti paragrafi; le potenzialità ed i limiti di Internet nell’ambito delle indagini statistiche costituiscono un tema di ricerca aperto, attuale e complesso. In particolare, lo studio del profilo dell’errore dell’indagine richiede ancora molte verifiche applicative.

3.2 LE PRINCIPALI TIPOLOGIE DI INDAGINI ON-LINE

Un’indagine on-line, realizzata attraverso la rete Internet, rientra nella classe più generale delle indagini auto-amministrate: non necessita della presenza di un rilevatore al momento della compilazione del questionario. Indagini di questo tipo, generalmente più convenienti in termini economici, comportano talvolta una maggiore difficoltà per l’utente sottoposto a rilevazione; difficoltà che potrebbe manifestarsi per il fatto che il rispondente, durante la compilazione del questionario, non ha la possibilità di richiedere spiegazioni o chiarimenti ad alcun intervistatore.

Tale aspetto, solo apparentemente banale, può minare il buon esito di tutta l’indagine7.

Entrando più nel dettaglio delle indagini on-line si possono distinguere almeno tre diverse tecniche di rilevazione:

1. indagini tramite posta elettronica, per le quali ci si avvale di questionari

spediti attraverso e-mail;

2. indagini sul web che si basano sul posizionamento di questionari

elettronici all’interno di pagine web;

(54)

3. ed infine indagini on-line integrate, cioè tecniche di rilevazione che

scaturiscono dalla combinazione delle due precedenti tecniche o di altri strumenti di comunicazione e selezione delle unità oggetto di indagine. La nostra analisi si baserà sulla seconda tecnica di rilevazione sopra elencata.

3.2.1 SONDAGGI WEB

Generalmente, con il termine “web surveys” si definiscono diverse tecniche di rilevazione che utilizzano la rete Internet, talvolta in modo passivo, come supporto informatico per il posizionamento del questionario elettronico on-line. Rilevazioni di questo tipo sono state pensate per raggiungere un insieme di potenziali rispondenti che per particolari esigenze arrivano all’interno del sito o alla pagina web su cui è stato posizionato il modulo di sondaggio.

Nella maggior parte dei casi, il questionario on-line non è immediatamente visibile sulla homepage del sito interessato, ma è contenuto all’interno di una sezione o pagina interna alla quale è possibile accedere attraverso un collegamento ipertestuale o comunque senza troppa difficoltà.

Gli utenti che accedono al sito web potrebbero inizialmente non essere a conoscenza dell’indagine, e quindi accorgersene solo in un secondo momento analizzando il contenuto del sito.

Detto questo, si capisce che, quello che interviene in questi casi è un doppio meccanismo di autoselezione dei rispondenti: prima si verifica una sorta di auto-selezione involontaria dei potenziali partecipanti, in quanto non tutti gli utenti che entrano a visionare il contenuto del sito si accorgeranno dell’esistenza del questionario; poi, tra i “consapevoli” interviene anche una selezione volontaria, perché non tutti saranno disponibili a partecipare alla ricerca.

Il vero vantaggio di questa tecnica sta nel fatto che la compilazione del questionario, può essere fatta direttamente sul web e la spedizione dei dati è

(55)

pressoché automatica così come la registrazione degli stessi in un apposito database. Creare un modulo di sondaggio “sul web” è abbastanza semplice e consente al ricercatore di utilizzare particolari accorgimenti informatici che, oltre a guidare gli utenti nella compilazione del questionario ne limitano anche possibili errori.

La rilevazione tramite web con posizionamento di questionario elettronico su pagina Html è più adatta allo studio di popolazioni aperte, per le quali non si dispone di informazioni a priori sulle unità che le compongono. Questo significa che in questo ambito l’applicazione delle tradizionali tecniche di campionamento statistico risulta impossibile.

Le principali tipologie di indagini on-line attraverso il web, seguendo l’impostazione di Bradley (1999), sono:

WEB “APERTO”

Il questionario è posto su un sito internet aperto a qualsiasi navigatore della rete, quindi un sito senza alcun tipo di controllo all’accesso. Tutti potrebbero partecipare all’indagine senza essere preventivamente informati o incentivati a farlo. Il contatto con le unità potenzialmente rispondenti potrebbe avvenire, ad esempio, attraverso annunci sul web, banners pubblicitari o altre pubblicazioni fatte su canali di comunicazione tradizionali. Per la compilazione, l’utente non dovrà fare altro che rispondere alle domande direttamente sulla pagina Html in cui è posizionato il questionario e confermare i dati inseriti attraverso un apposito pulsante di “INVIO” dati.

WEB “NASCOSTO”

Si identificano con questo termine indagini sul web per le quali il modulo di sondaggio è posizionato su una determinata pagina web, ma è in realtà “nascosto”, cioè appare al visitatore solo al verificarsi di opportune condizioni come ad esempio una certa data, un certo numero di visitatori o l’accesso ad una

(56)

quelle realizzate attraverso tecniche pop-up, cioè finestre galleggianti a scomparsa che si aprono a video solo al verificarsi di particolari condizioni predefinite da chi realizza e coordina l’indagine. La compilazione anche in questo caso è molto agevole come nel precedente.

3.3 LE INDAGINI VIA INTERNET

3.3.1 ASPETTI POSITIVI

In questo paragrafo cerchiamo di tracciare una mappa riassuntiva dei principali vantaggi acquisibili attraverso l’implementazione di tecniche di rilevazioni on-line.

A. RIDUZIONE DEI COSTI

Dal confronto con altre tipologie di indagine auto-amministrate, come i sondaggi postali, si vede chiaramente come i costi per carta, stampa e spedizioni vengano completamente abbattuti. In generale, se confrontate con una qualsiasi rilevazione “cartacea”, i vantaggi in termini di costo sono immediatamente palpabili, venendo meno sia la fase di data entry che le relative procedure di editing8. Inoltre rimane il fatto che essendo queste indagini di tipo auto-amministrato, la figura dell’intervistatore scompare e con essa anche i relativi costi, che rappresentano una delle voci di spesa più consistenti sul bilancio dell’intera indagine.

8 Quest’ultimo, però, è un vantaggio che il ricercatore era già riuscito ad acquisire passando da rilevazioni

Figura

Tabella 5.1: “Distribution of Age, Gender, Education and Race by  Different Data Sources”
Tabella 5.2: “P-values of the Auxiliary Variables from Logit Models  Predicting  y blks (warm feelings towards Blacks) and  y vote (voting
Tabella 5.4: “Unadjusted and Adjusted Web Sample Estimates”  (“Propensity Score Adjustment As A Weighting Scheme For Volunteer Panel Web Surveys”,
Tabella 6.1: Divisione in classi
+3

Riferimenti

Documenti correlati

• La frequenza relativa di un dato statistico è il rapporto tra la frequenza assoluta di quel dato e il numero totale dei dati: nel nostro problema per il calcio la frequenza

No significant difference between 27-gauge and 25-gauge trans- conjunctival sutureless vitrectomy for the repair of primary rhegmatogenous retinal detachment was recorded in terms

In particular, in this work we concentrate on the dating process used by archaeologists to assign one or more time intervals to a finding in order to define its lifespan on the

Tuttavia, la popolazione attiva (Forze di lavoro), che comprende gli occupati e i disoccupati che cercano attivamente lavoro è cresciuta in modo cospicuo, soprattutto tra le donne

Correspondence: Massimiliano Polastri, Medical Dept of Continuity Care and Disability, Physical Medicine and Rehabilitation, St Orsola University Hospital, Via G.. E-mail:

However, while the number of accelerators proliferated over time attracting the interest of media and policy makers thanks to the success of well-known

Nell’ambito delle vittime degli incendi, occorre anche inserire la scia dolorosa e numerosa delle morti di bambini, troppo spesso Rom, provocate dal fuoco, a volte