• Non ci sono risultati.

L’analisi del cambiamento cognitivo attraverso l’approccio AMD

Capitolo 6 – L’analisi del cambiamento cognitivo

6.1 L’analisi del cambiamento cognitivo attraverso l’approccio AMD

Si è deciso di analizzare il cambiamento cognitivo attraverso una serie numerosa di tecniche e modelli in un’ottica di triangolazione dei risultati. Al fine di rendere il più omogenea e organica possibile l’intera analisi, ogni approccio verrà inquadrato nella prospettiva dell’Analisi Multidimensionale dei Dati (AMD) come sistema composto di più fasi rintracciabili nello studio statistico di qualsiasi realtà sociale complessa. In passato l’applicazione di una tecnica statistica multivariata consisteva sinteticamente in una tabella dei dati – contenente implicitamente le ipotesi di modello – nell’applicazione della tecnica statistica multivariata e infine nell’output dei risultati. Oggi l’ampliarsi dei campi di applicazione dei metodi di analisi dei dati sia nelle scienze sociali che naturali, la varietà e complessità delle situazioni specifiche di ricerca, hanno portato a dare rilievo sia dal punto di vista metodologico, sia dal punto di vista informatico una serie di aspetti trascurati in passato, ossia la formalizzazione del problema, le codifiche a priori e a posteriori.

L’Analisi Multidimensionale dei Dati18 riguarda analisi statistiche a diversi livelli di complessità, costituite da più elaborazioni tra loro concatenate. Al fine di poter esaminare sistematicamente, in modo unitario e articolato tali aspetti, è utile considerare l’AMD come un ‘sistema’ composto di più fasi tutte ugualmente importanti ed interdipendenti ed aventi ciascuna aspetti statistici e informatici (cfr. Fraire, 1994, p. 6). Molto schematicamente è possibile individuare 7 fasi principali:

18

L’analisi dei dati (analyse des données) o analisi multidimensionale dei dati (AMD), affermatasi come branca autonoma della statistica negli anni Ottanta, riguarda un gruppo numeroso di tecniche statistiche multivariate che consentono, a seconda degli scopi della ricerca, di analizzare realtà sociali o fenomeni complessi. Essa ha origine dal connubio tra i metodi di analisi statistica multivariata e il trattamento automatico dei dati, indispensabile per effettuare questo tipo di analisi.

117 Figura 6.1.1 – Le 7 Fasi di un’analisi multidimensionale dei dati

Fonte: Fraire, 1994, p. 6

«In tale schema le diverse fasi sono poste in successione logica (indicata dal senso delle frecce), per ciascuna occorre operare delle scelte per le quali non sempre esistono regole fisse o criteri unici ed effettuare delle operazioni, sia dal punto di vista statistico che informatico» (ibidem, p. 6). In tale schema figura inoltre un feedback tra i tanti possibili: dall’output di un’AMD alla tabella dei dati, nel caso in cui da un’analisi dei dati vengano utilizzati come nuova tabella dei dati da sottoporre ad ulteriore analisi (paragrafo 6.8). Nel corso reale di un’analisi dei dati, alcune fasi possono mancare o sovrapporsi; tuttavia, questa successione schematizzata di stadi risulta molto utile per comprendere la logica che sottende ad un percorso di analisi dei dati.

Dopo aver compiuto le operazioni preliminari di stipulazione della definizione teorica di cambiamento cognitivo, di scelta degli aspetti costitutivi del concetto e di selezione degli indicatori sociali per le dimensioni considerate (capitoli 4 e 5) la documentazione statistica di partenza (prima fase di AMD) riguarda tutte le operazioni preliminari indispensabili a qualsiasi indagine statistica. In essa si definiscono:

- l’oggetto della ricerca: come già più volte espresso, consiste nello studio del cambiamento cognitivo (in tema di radiazioni ionizzanti) inteso come concetto complesso costituito da più aspetti (o dimensioni) traducibili in indicatori e quindi operazionalizzabili;

118 - lo scopo della ricerca: anche questo punto è stato già esplicitato più volte, e consente di pervenire ad una serie di risultati relativi al cambiamento delle conoscenze attraverso l’utilizzo di molteplici tecniche in un’ottica di triangolazione dei risultati;

- il metodo di rilevazione è stato diretto in quanto i dati sono stati acquisiti attraverso la conduzione di una survey con questionario;

- il piano della rilevazione consiste nello stabilire il campo di indagine, ossia la popolazione statistica P definita dall’insieme N delle unità statistiche (u.s.) e l’insieme K dei caratteri definito a priori. Nella presente trattazione, esso è costituito da N= 1.757 u.s., rappresentati dai ragazzi dai 14 ai 19 anni e da K= caratteri statistici, rappresentati dalle informazioni contenute nel questionario;

- il periodo di riferimento è relativo all’intervallo temporale di realizzazione della ricerca nelle sue fasi organizzate lungo l’arco dei 12 mesi del 2010;

- gli strumenti informatici utilizzati: le elaborazioni vengono effettuate attraverso diversi software: Microsoft Excel 2010 (del pacchetto Microsoft Office 2010), SPSS (Statistical Package for the Social Sciences) per Windows 15.0, SPAD (Systeme portable pour l’analyse des données) per Windows 4.5, e RUMM (Rasch Unidimensional Measurement Models) per Windows 2020.

La seconda fase AMD riguarda la codifica a priori e la matrice dei dati iniziali. I dati rilevati sono stati acquisiti e caricati in SPSS per la creazione della matrice Xn,k dei dati iniziali o grezzi. Essa è

composta da n righe e k colonne; n è la generica u. s. che può essere rappresentata dai 1.757 ragazzi; k sono i caratteri statistici di tipo misto. Ogni riga fornisce la descrizione completa dell’u.s. considerata nei k caratteri considerati, mentre ogni colonna rappresenta la distribuzione del carattere k considerato nella popolazione P considerata. Più in particolare, va notato che ogni vettore-riga della matrice rappresenta il profilo, ossia la descrizione completa delle informazioni rilevate con il questionario dell’i-esimo caso considerato; ogni vettore-colonna non è altro che la distribuzione della j-esima variabile nei 1.757 casi considerati.

La matrice che ha costituito il presente caso di studio è la matrice Xn,k di dati misti, detta anche

tabella inventario. Essa non ha alcuna struttura per cui, essendo composta da caratteri misti (mutabili e variabili), eterogenei e contenenti dati grezzi, sarà opportuno procedere di volta in volta ad opportune codifiche a posteriori sia sulle variabili, sia come trasformazione dell’intera matrice di dati affinché la tabella dei dati sia statisticamente trattabile ai fini della tecnica

119 prescelta. Per ogni analisi che sarà effettuata la matrice cambierà il suo ordine (dimensione) perché verrà utilizzato un numero diverso di variabili.

La terza fase dell’AMD riguarda le codifiche a posteriori come trasformazioni di variabili in quanto vengono effettuate sulle colonne della matrice dei dati iniziali. Tali codifiche sono riconducibili a due categorie: quelle che operano una modifica nella struttura del carattere originario e quelle che non effettuano tale cambiamento. Nella prima rientrano: la divisione in classi di una variabile, la trasformazione per ranghi (graduatorie) di una variabile, ecc.; fanno invece parte delle trasformazioni del secondo tipo: la trasformazione di una variabile xj in una variabile scarto dalla

media sj e la matrice degli scarti dalla media Sn,k, la trasformazione di una variabile xj in una

variabile scarto standardizzato zj e la matrice degli scarti standardizzati Zn,k, le trasformazioni

aritmetiche, algebriche, funzionali (cfr. ibidem, p. 44). In base alla tecnica utilizzata si procederà, ove richiesto, alle opportune codifiche che di volta in volta verranno esplicitate. È bene ricordare che non esistono regole fisse e criteri unici di scelta delle codifiche a posteriori e ciascuna di esse influirà sui risultati finali.

Le codifiche a posteriori possono essere effettuate per diversi scopi: a) requisiti statistici oggettivi cui devono rispondere i dati per essere statisticamente trattabili; b) scelta della tabella dei dati “migliore” o più significativa rispetto al problema da analizzare; c) compatibilità della tabella dei dati con la tecnica di AMD che su di essa si pensa di applicare.

In questa fase vengono incluse le analisi univariate, bivariate e trivariate adatte a studiare il cambiamento cognitivo.

Le codifiche a posteriori come trasformazioni dell’intera matrice dei dati sono proprie della quarta fase dell’AMD. Esse hanno lo scopo di approntare quella che viene definita la tabella dei dati, cioè la tabella su cui viene eseguito il metodo di AMD prescelto. Nelle concrete applicazioni una delle due fasi di codifica a posteriori (terza e quarta) può non essere necessaria. Le codifiche a posteriori come trasformazione dell’intera matrice sono di diverso tipo e scopi. Tra le più importanti si ricordano: la tabella sotto forma disgiuntiva completa, le tabelle dei profili-riga, le tabelle dei profili-colona, la tabella di contingenza generalizzata o di Burt, la tabella con variabili a correlazione nulla, la tabella di contingenza normalizzata, ecc. (cfr. ibidem).

La quinta fase di AMD riguarda la scelta di una metrica, o misura di:

- rassomiglianza/dissomiglianza tra le tutte le coppie possibili di unità statistiche rispetto ai k caratteri contemporaneamente considerati. La scelta tra le diverse misure è legata alla struttura S posseduta dalla tabella dei dati considerata e le misure con essa compatibili.

120 Una prima grande distinzione tra le diverse misure di rassomiglianza/dissomiglianza tra u.s. è quella tra distanze per le variabili (matrici Dn,n) e similarità per le mutabili (matrici

Sn,n). La matrice delle distanze indicata con Dn,n è una matrice quadrata, di dimensione nxn,

simmetrica, positiva perché per le proprietà stesse di una distanza qualunque essa sia è sempre positiva o nulla, avente un numero di utili pari a n(n-1)/2. Tra le più impiegate distanze si ricordano: le distanze di Minkowsky, di Mahalanobis, di Hamming, la distanza del chi-quadrato.

- relazione tra caratteri, riguarda la scelta di una misura o indice di interdipendenza o connessione o correlazione tra i k caratteri (mutabili o variabili) considerati. Considerando tutte le possibili coppie di caratteri per ciascuna delle quali sono calcolati gli indici si hanno le corrispondenti matrici di dimensione kxk. Tra i diversi tipi di matrici si ricordano: la matrice di varianze e covarianze Σk,k, la matrice di correlazione Rk,k, le matrici di devianze

e codevianze Devk,k,adatte con i caratteri quantitativi.

La sesta fase riguarda la scelta del metodo di analisi multidimensionale dei dati che si intende utilizzare dopo aver predisposto e reso compatibile la tabella dei dati attraverso le opportune trasformazioni delle fasi precedenti.

Infine, la settima ed ultima fase, è relativa agli output dei risultati sia numerici che grafici forniti dal software impiegato, nonché alle relative interpretazioni.

Documenti correlati