• Non ci sono risultati.

Caso di studio: Il progetto Clavius on The Web

L’approccio metodologico di progettazione software per lo studio e il trattamento (anche automatico) del testo letterario, descritto precedentemente, è stato adottato nel progetto “Clavius on the Web”, inaugurato nel 2012 e finanziato da Registro.it. Il progetto vede coinvolti l’Istituto di Linguistica Computazionale “A. Zampolli” (ILC) e l’Istituto di Informatica e Telematica (IIT), entrambi del CNR di Pisa, in collaborazione con l’Archivio Storico della Pontificia Università Gregoriana (APUG) di Roma (Abrate et al. 2014).

Lo scopo di questa iniziativa è quello di preservare, valorizzare e promuovere la corrispondenza di Cristoforo Clavio (1537-1612) intercorsa tra il Gesuita ed importanti scienziati coevi (tra cui Galileo Galilei e Tycho Brahe). Clavius è stato un noto matematico e astronomo, conosciuto soprattutto per il suo contributo nella riforma del calendario gregoriano, per il lavoro editoriale sugli Elementi di Euclide e per il commentario all’opera De sphaera mundi di Giovanni Sacrobosco. I manoscritti analizzati nel progetto, contenenti la corrispondenza di Clavius (in lingua latina e in lingua italiana), sono conservati presso l’APUG.

Durante le attività del progetto sono stati sviluppati strumenti Web di analisi ed elaborazione automatica del testo. Queste applicazioni permettono agli studiosi di trascrivere il contenuto testuale dei manoscritti acquisiti digitalmente, di trattarne automaticamente la lingua e, infine, di annotarne lessicalmente e semanticamente porzioni di interesse (Figura 2).

Figura 2. Esempio di trascrizione e annotazione semantica di una lettera a Cristoforo Clavio

In virtù dell’approccio modulare e flessibile utilizzato nelle fasi di progettazione dell’ambiente è stato possibile adattare le componenti software anche per una iniziativa collaterale: Clavius@School (Marchetti et al. 2015). Questa attività ha visto il coinvolgimento di studenti liceali impegnati nell’uso degli strumenti sviluppati nel progetto, consentendo loro di approfondire la consapevolezza delle potenzialità e dei rischi connaturati al paradigma educativo digitale. Sintetizzando, il lavoro di ricerca e sviluppo condotto nel progetto ha portato alla realizzazione di diverse componenti che saranno integrate nell’ambiente Omega sfruttandone l’architettura a microkernel già descritta.

1 L’iniziativa OAC è adesso confluito nel progetto W3C del Web Annotation Data Model

183

Figura 3. Annotarium: sistema di interrogazione full-text e ricerca semantica.

Di seguito si elencano i principali strumenti accompagnati da alcune immagini dell’interfaccia grafica (Figura 3, Figura 4 e Figura 5) che riassumono i principali casi d’uso del progetto (Piccini et al. 2016, Valsecchi et al. 2016):

● l’archivio digitale: claviusontheweb.it/

● il Text Encoder and Annotator (TEA): wafi.iit.cnr.it/webvis/tea/

● lo strumento di ricerca Annotarium: wafi.iit.cnr.it/webvis/annotarium/

● l’annotazione linguistica: claviusontheweb.it/annotations/annotations.php?letter_id=147

● l’interfaccia di interrogazione in linguaggio controllato: http://licodemo.ilc.cnr.it:8080/clavius

● il lessico specialistico e l’ontologia: https://goo.gl/MXtFdy

184

Figura 5. L’interfaccia per l’interrogazione della risorsa termino-ontologica diacronica di Clavius on the Web.

Conclusioni

In questo contributo sono descritti i progressi effettuati nella progettazione e nello sviluppo di Omega, una piattaforma per lo studio scientifico del testo. Sono stati illustrati alcuni risultati ottenuti nell’ambito del progetto Clavius on the Web che dimostrano quanto l’adozione di approcci robusti e flessibili nella realizzazione di strumenti digitali possa rivelarsi cruciale, soprattutto nei casi in cui si necessiti di riadattare tali strumenti per compiti diversi.

Lo sviluppo della piattaforma Omega è disponibile su Github al seguente indirizzo:

https://github.com/literarycomputinglab2. Al momento sono in corso le attività di definizione di

ulteriori API (a partire dalla gestione di lessici e dalla rappresentazione digitale di risorse testuali) e di documentazione delle singole API sviluppate. Inoltre, sono in corso di studio le modalità per il rilascio del software all’interno di altre infrastrutture di ricerca, come CLARIN e DARIAH. Come anticipato in contributi precedenti, reputiamo di fondamentale importanza ricevere feedback dalla comunità DH sui modelli e gli approcci che abbiamo deciso di impiegare per la realizzazione della piattaforma.

Riferimenti Bibliografici

Abrate, Matteo, Angelo Mario Del Grosso, Emiliano Giovannetti, Angelica Lo Duca, Damiana Luzzi, Lorenzo Mancini, Andrea Marchetti, Irene Pedretti, and Silvia Piccini. 2014. “Sharing Cultural Heritage: The Clavius on the Web Project.” In LREC2014 Proceedings, 627–634. ELRA.

Ackerman, Lee, and Celso Gonzalez. 2011. Patterns-Based Engineering: Successfully Delivering Solutions Via Patterns. Addison-Wesley.

Almas, Bridget, and Marie-Claire Beaulieu. 2013. “Developing a New Integrated Editing Platform for Source Documents in Classics.” LLC 28 (4): 493–503.

Benotto, Giulia, Emiliano Giovannetti, and Ouafae Nahli. 2016. “An Application of Distributional Semantics for the Analysis of the Holy Quran.” In CIST2016 Proceedings. Tangier-Assilah, Morocco.: IEEE.

2 Chiunque voglia contribuire alla implementazione di Omega è invitato ad unirsi al team di

185

Berti, Monica, Bridget Almas, David Dubin, Greta Franzini, Simona Stoyanova, and Gregory Ralph Crane. 2014. “The Linked Fragment: TEI and the Encoding of Text Reuses of Lost Authors.” JTEI 8. doi:10.4000/jtei.1218.

Bozzi, Andrea. 2013. “G2A: A Web Application to Study, Annotate and Scholarly Edit Ancient Texts and Their Aligned Translations.” Edited by ERC Ideas 249431. Studia Graeco-Arabica 3: 159–171. Chaudhuri, Sukanta. 2015. Bichitra: The Making of an Online Tagore Variorum. 1sted. Springer Publishing Company, Incorporated.

Ciotti, Fabio. 2016. “What’s in a Topic Model. I Fondamenti Del Text Mining Negli Studi Letterari.” In DH2016 Abstracts, 149–51. Kraków.

Del Grosso, Angelo Mario, Federico Boschetti, Emiliano Giovannetti, and Simone Marchi. 2016. “Vantaggi dell’Astrazione Attraverso l’Approccio Orientato Agli Oggetti per Il Digital Scholarly Editing.” In AIUCD2016 Abstracts, 213–18. Venezia.

Del Grosso, Angelo Mario, Davide Albanesi, Emiliano Giovannetti, and Simone Marchi. 2016. “Defining the Core Entities of an Environment for Textual Processing in Literary Computing.” In DH2016 Abstracts, 771–75. Kraków.

Evans, Eric. 2014. Domain-Driven Design Reference: Definitions and Pattern Summaries. Dog Ear Publishing.

Fischer, Franz. 2013. “All Texts Are Equal, But… Textual Plurality and the Critical Text in Digital Scholarly Editions.” Variants 10: 77–92.

Giovannetti, Emiliano, Davide Albanesi, Andrea Bellandi, and Giulia Benotto. 2016. “Traduco: A Collaborative Web-Based CAT Environment for the Interpretation and Translation of Texts.” Digital Scholarship in the Humanities. doi:10.1093/llc/fqw054.

Hedges, Mark, Anna Jordanous, Faith Lawrence, Charlotte Roueche, and Charlotte Tupman. 2016. “Digital Publication of Highly Interconnected Manuscripts: Sharing Ancient Wisdoms.” The Journal of Data Mining and Digital Humanities.

Knoernschild, Kirk. 2012. Java Application Architecture: Modularity Patterns with Examples Using OSGi. 1sted. Robert C. Martin Series. Prentice Hall.

Marchetti, Andrea, Martin Maria Morales, and Simone Marchi. 2015. “Il Progetto Clavius on the Web Entra Nelle Scuole.” Digitalia, 74–84.

Martini, Simone. 2016. “Types in Programming Languages, between Modelling, Abstraction, and Correctness.” In CiE2016 Proceedings, 164–69. Parigi: Springer.

Piccini, Silvia, Matteo Abrate, Clara Bacciu, Andrea Bellandi, Emiliano Giovannetti, Lorenzo Mancini, and Andrea Marchetti. 2016. “When Traditional Ontologies Are Not Enough: Modelling and Visualizing Dynamic Ontologies in Semantic-Based Access to Texts.” In DH2016 Abstracts, 653–55. Kraków.

Pierazzo, Elena. 2016. “Quale Futuro per Le Edizioni Digitali? Dall’haute Couture Al Prêt-À-Porter.” In AIUCD2016 Abstracts, 51–52. Venezia.

Robinson, Peter, and Barbara Bordalejo. 2016. “Textual Communities.” In DH2016 Abstracts, 876– 77. Kraków.

Shillingsburg, Peter. 2015. “Development Principles for Virtual Archives and Editions.” Variants 11: 9–28. doi:10.1163/9789401212113_002.

Smith, Neel. 2010. “Digital Infrastructure and the Homer Multitext Project.” In Digital Research in the Study of Classical Antiquity, 121–37. Farnham: Ashgate.

Tanenbaum, Andrew. 2014. Modern Operating Systems. 4th ed. Pearson Education, Inc.

Valsecchi, Fabio, Matteo Abrate, Clara Bacciu, Silvia Piccini, and Andrea Marchetti. 2016. “Text Encoder and Annotator: An All-in-One Editor for Transcribing and Annotating Manuscripts with RDF.” In ESWC2016 Proceedings, 9989:399–407. Lecture Notes in Computer Science. Heraklion: Springer.

186

Reading Habits: Marginalia in Author's Libraries