• Non ci sono risultati.

Applicazione della

6.2 Analisi esplorativa dei dati sulla Prossimità

La fase di analisi esplorativa ha come obiettivo quello di analizzare e correlare i dati raccolti in modo da far emergere pattern e relazioni in grado di fungere da struttura di una narrazione visuale basata sui dati.

La fase di analisi esplorativa è stata condotta seguendo due diverse modalità: 1- Analisi delle correlazioni di tipo semantico sui dati relativi ai dibattiti della rassegna “Ri-Innovare la Città: Osservatorio Emergenza Coronavirus”

2-Analisi delle correlazioni tra i dati delle definizioni del concetto di Prossimità, i dati dei documenti relativi al Piano Innovazione Urbana e relativi al questionario aperto alla cittadinanza.

La fase 1 dell’analisi esplorativa aveva due obiettivi principali: verificare quanto fosse centrale il tema della prossimità, misurato attraverso il numero di volte in cui veniva ripetuto il termine “prossimità” o “proximity”, e verificare quali fossero le altre tematiche emergenti rappresentate dalle parole più ripetute.

A questo proposito è necessario fare una nota metodologica: i 15 dibattiti erano equamente suddivisi tra italiano e inglese, ma ai fini dell’analisi le trascrizioni sono state considerate o tradotte in lingua inglese. Questa scelta è derivata dal fatto che scegliere un’unica lingua avrebbe permesso di confrontare più accuratamente i diversi dataset e tra i due è stato scelto di utilizzare l’inglese perché i modelli di traduzione automatica funzionano generalmente meglio nella traduzione italiano-inglese invece che inglese-italiano e inoltre gli strumenti di

text analysis utilizzati (Word Counter e SameDiff del pacchetto databasic.io e

Nineteen, use19.com) presentano algoritmi di eliminazione delle parole e formule di congiunzione funzionanti solamente per la lingua inglese. L’eliminazione di tali parole, indicate in lingua inglese con il termine “stopwords”, è necessaria perché esse sono inutili ai fini dell’analisi semantica in quanto non presentano, nella loro singolarità, un significato o un concetto e sono anzi problematiche perché presentano, numericamente parlando, un numero di ripetizioni molto più elevato rispetto a termini che presentano un significato intrinseco, come sostantivi, verbi e in misura minore anche avverbi. I principali risultati dell’analisi poi sono stati successivamente ri-tradotti in italiano ai fini della costruzione della visualizzazione e di una diffusione più inclusiva, considerando che il pubblico a cui si rivolge il progetto parla generalmente l’italiano come prima o seconda lingua.

Le sotto-fasi della prima fase di analisi esplorativa, nello specifico, sono state: -quantificazione e classificazione delle parole più utilizzate (numero di parole totali ordinate dalla più alla meno utilizzata per ogni dibattito);

-misurazione della ricchezza linguistica (numero di parole uniche su numero di parole totali per ogni dibattito);

-quantificazione del termine prossimità (numero ripetizioni di “proximity” per ogni dibattito);

-quantificazione e classificazione delle parole più utilizzate in tutti i dibattiti (numero di parole totali dalla più alla meno utilizzata per l’insieme dei dibattiti). Nella [Fig. 6.2.1] è mostrato il dataset costruito a seguito dell’analisi esplorativa fase 1, da cui sono poi scaturite le visualizzazioni draft che hanno permesso di analizzare anche visivamente quali fossero le tendenze emergenti dai dati: un esempio di esse sono riportate nella [Fig. 6.2.2].

La fase 2 dell’analisi esplorativa aveva invece l’obiettivo di confrontare tre principali interpretazioni del concetto di prossimità: quello espresso dalle istituzioni della lingua italiana, quello espresso dalle istituzioni che lavorano quotidianamente con il tema della prossimità (in questo caso la Fondazione per l’Innovazione Urbana) e infine quello espresso da un campione di cittadini o frequentatori abituali della città di Bologna. Il confronto è stato utile per individuare quali fossero i principali punti di relazione tra cittadini e istituzioni all’interno del dibattito legato al tema della prossimità.

L’analisi si è costituita in particolare di:

- Classificazione dei dati estratti dai documenti di sviluppo del Piano per l’Innovazione Urbana e visualizzazioni draft (FIU, 2016; FIU 2019);

- Esplorazione visuale dei risultati del questionario rivolto alla cittadinanza, utilizzando alcune forme di visualizzazione draft;

- Confronto dei risultati emersi con le principali definizioni del termine prossimità. Le tecniche utilizzate sono state quella dell’analisi semantica, precedentemente descritta, e della classificazione di diverse variabili per permettere l’uso dei software per le visualizzazioni draft. I software utilizzati in questa fase sono stati RawGraphs e Adobe Illustrator.

L’esito di questa fase è stato quello di ottenere diverse forme attraverso cui restituire il concetto di Prossimità. I risultati ottenuti sono poi stati centrali per lo sviluppo della fase successiva, la fase di analisi collaborativa, che verrà descritta nel capitolo 6.3.

Le tecniche di analisi esplorativa utilizzate per il caso applicativo sono state scelte in quanto finalizzate a mostrare quanto fosse centrale il tema della prossimità all’interno di un’iniziativa svolta a distanza, tuttavia l’analisi a partire da una video-registrazione può essere svolta in modalità diverse a seconda della tipologia di narrazione che si intende costruire, scegliendo variabili che, correlate tra loro,

mostrano relazioni diverse. Se in questo caso le variabili di confronto principali sono state quelle legate ad aspetti semantici, come il numero di parole o la ricchezza lessicale, è possibile analizzare altri aspetti, prendendo per esempio come variabili la durata dei vari appuntamenti della rassegna oppure i luoghi da cui si sono svolte le registrazioni, in modo da arricchire il racconto di ulteriori aspetti.

Per quanto riguarda la scelta degli strumenti oggi sono disponibili un gran numero di strumenti per l’analisi dei dati che possono essere suddivisi per le modalità di distribuzione (open source o commerciale) e per le competenze richieste al loro utilizzo. Per questa fase di analisi sono stati utilizzati solo software open source, ad esclusione di Microsoft Excel, che può però essere sostituito completamente dalle versioni gratuite di Google Sheets o dalle versioni Open Source di OpenOffice e LibreOffice; e sono stati utilizzati strumenti che presentano un alto grado di accessibilità a livello di competenze richieste, a dimostrazione del fatto che non è necessario presentare competenze di alto livello per impostare e compiere una fase di analisi esplorativa di una raccolta di dati.

Fig. 6.2.1: Dataset costruito a seguito dell’analisi esplorativa fase 1

Fig. 6.2.2: Esempio di visualizzazione draft ottenuta a partire dall’analisi semantica di una video-registrazione, ottenuta attraverso il tool Word Counter del toolkit databasic.io

6.3 Analisi collaborativa: Workshop con Fondazione