• Non ci sono risultati.

3. Il database degli studenti dell’Università degli Studi di Cagliari

3.3. Importazione del database nella piattaforma

Una volta concluso l’inserimento dei dati nel foglio Excel, l’informatico Alessandro Capra ha iniziato il lavoro di importazione e di restituzione delle informazioni nel sito.

L’applicativo scelto è Drupal (versione iniziale 8.x in corso di aggiornamento alla 9.x).

In un primo momento, si era pensato di creare due database distinti: uno per gli studenti e uno per i docenti, arrivati in questa fase ci si è però resi conto che i due strumenti avrebbero avuto un potenziale maggiore se uniti insieme. Unirli significava, per l’utente, avere maggiori informazioni sulla persona ricercata in un’unica scheda senza doversi spostare da uno strumento all’altro, rischiando di entrare in confusione e sicuramente aumentando i tempi di ricerca.

Dunque, l’esigenza principale era rappresentata dalla necessità di poter gestire, attraverso un’interfaccia web, i dati relativi alle persone che sono state studenti, docenti e rettori. Bisognava dare massimo risalto alle persone, permettendo la loro cercabilità, sia attraverso una ricerca all’interno del sito, ma anche favorendo la loro cercabilità sui motori di ricerca.

La prima fase del lavoro di analisi ha pertanto riguardato il controllo dei fogli Excel di entrambi i database, si è proceduto alla verifica delle date, delle omonimie e all’eliminazione delle doppie carriere; i nomi delle facoltà e dei corsi sono stati uniformati allo scopo di normalizzare i campi inizialmente individuati ed eventualmente anche semplificando e riutilizzando campi già identificati.

141 Il file excel studenti comprende i campi:

studente id foto primo_cognome secondo_cognome primo_nome secondo_nome terzo_nome sesso data_di_nascita luogo_di_nascita facoltà corso anno_immatricolazione data inizio (date field) data_licenza

titolo_tesi_licenza

segnatura_archivistica_tesi_licenza data_laurea

data fine (date field) titolo_tesi_laurea valutazione_laurea segnatura_archivistica_tesi_laurea carriera file_tesi_laurea autore revisore

142 Il file Excel dei docenti comprende i campi:

Docente id foto primo_cognome secondo_cognome primo_nome secondo_nome terzo_nome sesso data_di_nascita luogo_di_nascita data_di_morte luogo_di_morte facolta corso insegnamenti inizio_carriera_accademica data inizio (date field) fine_carriera_accademica data fine (date field)

data durata (date field multiple) biografia ambiti_di_ricerca carriera_extra_acc riferimenti_bibliografici riferimenti_archivistici autore revisore

143

Questo controllo ha portato all’individuazione dei campi comuni ai due

database, alla conformità dei campi “data di immatricolazione” e “data di laurea”

del database studenti e i campi “inizio carriera accademica” e “fine carriera accademica” del database docenti in “data inizio carriera” e “data fine carriera” e infine alla seguente partizione:

Ambito anagrafico Ambito carriera studente Ambito carriera docente Area controllo

Id Facoltà Facoltà Autore

Foto Corso Corso Revisore

Primo cognome Data inizio carriera

Insegnamenti

Secondo cognome Data fine carriera Data inizio carriera

Terzo cognome Data licenza Data fine carriera Primo nome Titolo tesi licenza Biografia

Secondo nome Segnatura

archivistica tesi di licenza

Ambiti di ricerca

Terzo nome Titolo tesi laurea Carriera extra accademica

Sesso Valtazione Riferimenti

bibliografici Data di nascita Segnatura

archivistica tesi di laurea

Riferimenti archivistici

Luogo di nascita Carriera

Data di morte File tesi di laurea Luogo di morte

144

Da questo schema è derivata la struttura logica dei dati ovvero:

1. L’entità persona, che rappresenta la principale attorno alla quale tutte le altre devono riferirsi. È l’entità che deve essere esposta su internet ed essere correttamente indicizzata sui motori di ricerca. L’entità persona è univoca e pertanto deve essere possibile gestire gli omonimi.

2. L’entità carriera, che, invece, rappresenta l’entità che definisce lo status della persona all’interno dell’ateneo; per ciascuna persona può essere multipla ed è caratterizzata dalle seguenti tipologie:

a. Tipologia studente: è definita dai campi studente; b. Tipologia docente: è definita dai capi docente; c. Tipologia rettore: è definita dai campi rettore.

Figura 23 Schema delle entità242

242 Nell’entità docente viene specificato se illustre o meno perché il database è servito come base

per la mostra di ateneo allestita per la celebrazione 400 anni dalla fondazione, in cui sono state realizzate le biografie dei docenti più illustri che hanno insegnato presso l’Università di Cagliari.

145

Rispetto alle principali, esistono anche entità secondarie gestite in Drupal con le tassonomie. La scelta di gestire questi dati con entità separate consente una maggiore flessibilità nella manipolazione delle interfacce grafiche:

- Facoltà, che gestisce le facoltà connesse alla carriera docente e studente. - Corsi, che gestisce i corsi connessi alla carriera docente e studente.

Dunque, le entità definite in Drupal sono: - Persona: gestisce i dati della persona. - Carriera: gestisce i dati della carriera.

- Pagina base: gestisce i dati di una generica pagina descrittiva del sito.

Figura 24 Schema entità definite in Drupal

L’importazione dei dati è stata eseguita tramite l’utilizzo del modulo “migrate” per il quale è stato sviluppato uno specifico importer per ciascuna entità.

146

Durante la fase di importazione è stato necessario convertire il dato testuale del campo su Excel in un valore che esprime le coordinate geografiche. Per fare ciò è stato utilizzato un componente che, durante la fase di impostazione, invia alle API di Google Maps la stringa testuale e riceve indietro il valore in coordinate geografiche. L’operazione è stata fatta in batch durante l’importazione di tutti i dati: non tutte le località sono state geolocalizzate correttamente da Google Maps, per esempio, alcune, che non esistono più, sono state geolocalizzate in modo errato e sono state corrette manualmente243.

243 Per esempio, Iglesias è stata geolocalizzata Independence negli Stati Uniti, Bosa Phoenix sempre

negli Stati Uniti. Altri paesi come Orani, Teulada e Gairo, apparentemente geolocalizzati correttamente, in realtà sono stati geolocalizzati in località omonime nelle Filippine, in Spagna e Tanzania.

147

Figura 25 Schema dell’operazione di geolocalizzazione

La concatenazione dei campi id, cognome e nome, ha comportato l’unione delle carriere intraprese dallo stesso studente in unica scheda evitando così che una persona sia inserita tante volte quante sono le carriere che ha intrapreso, per questa ragione il numero delle persone e delle carriere non coincide e le prime risultano in numero inferiore rispetto alle seconde; allo stesso tempo la concatenazione ha comportato l’unione di carriere appartenenti a persone omonime. Questo fatto ha implicato che, una volta conclusa la fase di importazione nella piattaforma, è iniziata quella di controllo di tutti i dati contenuti nel database in modo che venissero separate tutte le carriere legate erroneamente a uno studente.

La piattaforma, accessibile in backend solo a chi è in possesso delle credenziali di accesso, consente di aggiungere nuove entità e la gestione delle persone e delle carriere già presenti.

148

Per la verifica delle carriere si è lavorato nella sezione gestione persone, ed è stato necessario rivedere tutte le fonti della Sezione I e delle Serie omogenee consultate presso l’archivio; si è proceduto nel modo seguente:

1. cercando nella piattaforma lo studente;

2. separando le carriere nel caso in cui, durante l’importazione, fossero state agganciate erroneamente a studenti omonimi, in questo caso è stata creata una nuova entità persona a cui è stata legata la carriera sganciata dallo studente sbagliato244;

244 Per esempio, le carriere dei due omonimi Manca Giuseppe di Orroli e Manca Giuseppe di

Cuglieri sono state unite, ma il primo si immatricolò in Teologia nell’anno accademico 1850- 1851 e il secondo, iscritto alla Scuola di Chirurgia conseguì il titolo il 1797-11-28, quindi è stato

149

3. verificando la correttezza dei dati e modificandoli in caso di errore;

4. controllando il titolo della tesi di licenza e di laurea e l’indicazione della posizione archivistica;

5. selezionando nel vecchio file Excel lo studente verificato in modo che, al termine del controllo, fosse evidente quale studente non era stato verificato. Il procedimento per la creazione di nuove entità è molto semplice, dal back office appena si accede alla sezione “crea contenuti” è possibile scegliere quale entità si vuole creare se la persona o la carriera, se si sceglie di creare la persona i campi che potranno essere compilati sono quelli individuati per l’ambito anagrafico.

Una volta creata l’entità persona è necessario creare la carriera, in questo caso nella sezione “crea contenuti” si sceglierà il “crea carriera”, in cui bisogna

necessario creare una nuova entità persona e agganciare la carriera erroneamente agganciata alla persona sbagliata.

150

selezionare quale tipologia di carriera si sta creando se studente o se docente. Oltre ai dati relativi alla carriera studente è possibile allegare la digitalizzazione della tesi di laurea.245.

Il file pdf è stato realizzato con lo ScanRobot, strumento ad alta tecnologia presente nel Dipartimento di Lettere, Lingue e Beni Culturali che permette di realizzare anche file in OCR che consente il passaggio dall’immagine al testo riconoscendo i caratteri alfanumerici, in questo modo, il testo viene indicizzato ed è interamente interrogabile246.

245 Purtroppo, attualmente sono molto poche quelle disponibili in quanto a causa dell’emergenza

sanitaria il lavoro di digitalizzazione è stato sospeso.

246 Lo ScanRobot consente di digitalizzare qualsiasi tipo di volume, registro e libro. La procedura

prevede diverse fasi, nella prima si procede con la pulizia interna del prisma per mezzo della pistola ad aria compressa, per eseguire questo tipo di pulizia è necessario rimuovere ogni tipo di gioiello o qualunque cosa possa graffiare e danneggiare il prisma. La seconda fase prevede la pulizia esterna del prisma per mezzo di un panno in microfibra; nella terza fase si pulisce il piatto in vetro sempre con un panno in microfibra, prestando la massima attenzione. Una volta concluse le fasi di pulizia che non è necessario eseguire per ogni scansione ma solo all’occorrenza, iniziano le fasi di preparazione alla digitalizzazione: per prima cosa attraverso il software si allinea la camera e si selezionano i bianchi; successivamente si prepara il libro o il volume che si intende digitalizzare, si verifica che non siano presenti al suo interno pezzi di carta, post-it o graffette, si pulisce con la pistola ad aria che elimina la polvere depositata e si verifica lo spessore dei margini. Conclusa questa fase si posiziona il libro sulle ali dello scanner che vanno regolate rispettando l’apertura naturale del libro in modo che non si eserciti alcun tipo di pressione; segue il set up che consente di fare la prova della scansione, se questa è considerata soddisfacente si può procedere con la scansione dell’intero libro. Il software consente di visionare contemporaneamente alla digitalizzazione la pagina scansionata in tal modo ci si può rendere subito conto del risultato. Cfr. https://www.treventus.com/ (ultimo accesso: 30 agosto 2020).

151

Una volta compilati tutti i campi di cui si hanno i dati, si lega l’entità persona attraverso selectentities che consente di cercare attraverso i filtri la persona già creata e, in caso di omonimia, può essere individuata grazie alle informazioni riportate, quali data e luogo di nascita; consente inoltre di creare una nuova persona. A questo punto la compilazione del campo “tipologia di carriera” diventa fondamentale per tre motivi: primo perché colloca l’entità tra gli studenti o i docenti e in questo modo è possibile filtrare l’informazione; in secondo luogo, perché automaticamente collega alla carriera un’icona rappresentativa, sia della carriera sia del genere maschile o femminile dell’entità persona247.

Tale icona può essere:

studente di genere maschile o femminile che non ha concluso la carriera accademica;

studente di genere maschile o femminile che ha concluso la carriera accademica con la laurea;

docente di genere maschile o femminile;

rettore di genere maschile o femminile.

In terzo luogo, è importante perché nel momento in cui l’utente cerca una persona già prima di aprire la scheda sa se chi sta cercando ha concluso gli studi, se è diventato docente e anche rettore.

152

Figura 29 Schermata per la creazione della carriera studente

153