• Non ci sono risultati.

Il lavoro che presentiamo si inserisce nell’ambito del contributo apportato dall’unità di ricerca dell’Università di Roma “Tor Vergata” al progetto di ricerca PRIN “Memoria poetica e poesia della memoria. Ricorrenze lessicali e tematiche nella versificazione epigrafica e nel sistema letterario”, coordinato dall’Università Cà Foscari di Venezia, il cui obiettivo era la annotazione tematica digitale della tradizione epigrafica latina (Pistellato, 2015).

Il lavoro condotto dalla nostra unità ha riguardato l’estensione dell’annotazione tematica alle forme brevi della poesia italiana delle “Origini” in lingua volgare (considerata anche a partire dai suoi labili e mobili confini con la coeva produzione latina). Nella prima fase del progetto sono stati reperiti, digitalizzati e tematizzati tutti i testi poetici di forma breve (intendendo con questa come estensione massima la forma “sonetto”) del XIII secolo. Su un corpus di più di 60 autori del ‘200 e un totale di circa 500 testi, sono stati individuati oltre 500 temi, di cui un solido 30% con corpose attestazioni. Tutti questi dati saranno presentati con tabelle e grafici riassuntivi (di cui in questa sede forniamo un esempio).

L’operazione di annotazione dei testi inseriti è stata effettuata mediante uno strumento di annotazione che permetteva di assegnare uno o termini tematici a un verso, una strofa o un intero componimento, sulla base di un thesaurus tematico predefinito (mutuato dal progetto gemello – e precedente- Musisque Deoque), ma estensibile su suggerimento degli annotatori.

Il processo di annotazione è stato condotto da una equipe di esperti, coordinato da Daniele Silvi. La creazione di un gruppo di lavoro stabile si è resa necessaria per garantire un certo equilibrio sul fronte interpretativo di questa operazione. Ricordando infatti come ogni atto di annotazione rappresenti un atto interpretativo, il rischio di incorrere nella non omogeneità derivante dalla soggettività

170

dell’esperienza culturale oltre che della percezione del testo, è stato parzialmente mitigato proprio dal confronto diretto tra i diversi membri del gruppo di lavoro.

I testi sono stati dunque suddivisi tra i membri ed analizzati a coppie; poi, ciascun testo annotato è stato revisionato dal coordinatore campionando una selezione di testi. Questa procedura si è resa necessaria al fine di garantire la maggiore uniformità di giudizio possibile all’interno della rosa di temi messi a disposizione dal temario predefinito adottato.

Dato il numero consistente dei testi e dei temi a essi associati che abbiamo elaborato, forniamo qui solo un esempio tra i più significativi. Si tratta della categoria che riguarda le diverse forme dell’amore che vengono descritte nella tradizione testuale:

 Homines • Amor • Amans vel amator  Homines • Amor • Amatus

 Homines • Affectus • Amor

 Dei et heroes • Mythologica • Amor  Homines • Amor

 Homines • Amor • Amor aedificans  Homines • Amor • Amor castus  Homines • Amor • Amor et odium

 Homines • Amor • Amor qui fieri non potest  Homines • Amor • Amor saevus

 Homines • Amor • Amor tamquam morbus et dolor

I risultati dell’annotazione manuale, relativamente al corpus sopradescritto, sono riassunti nel seguente grafico, che ne indica la distribuzione.

171

L’analisi automatica con topic modeling

Lo stesso corpus di testi è stato sottoposto a un processo di analisi automatica basata su topic modeling. Esistono diversi algoritmi di topic modeling, ma ad oggi il più diffuso è quello noto come Latent Dirichlet Allocation (LDA), fondato su un approccio probabilistico bayesiano. In modo intuitivo possiamo dire che alla base di LDA vi è un semplicistico modello generativo del testo: quando un autore scrive un testo in prima battuta sceglie l’insieme degli argomenti (topic) di cui vuole parlare, poi determina la proporzione con cui ciascun argomento sarà presente e infine per ogni argomento mette nel testo un certo numero di parole che esprimono ciascun argomento. La cosa interessante di questo semplice metodo modello generativo è che può essere invertito: otteniamo in questo modo un algoritmo che è in grado di estrapolare i topic prevalenti in un insieme di documenti, ovvero la lista delle parole che co-occorrono con frequenza notevole e la loro distribuzione di probabilità. In termini tecnici si dice che in LDA un testo è una distribuzione di probabilità su un insieme di topic e un topic una distribuzione di probabilità su un insieme di parole.

Le liste ottenute vanno ovviamente interpretate, assegnando loro una determinata etichetta o categorizzazione. Nel nostro caso i testi del corpus sono stati sottoposti a un tool che implementa l’algoritmo LDA (Mallet, cfr. McCallum, A. K. 2002) seguendo diversi approcci di segmentazione e producendo diversi numeri di topic. Si è poi proceduto a verificare:

 la congruenza dei cluster ottenuti tramite LDA con l’albero del thesaurus

 la congruenza delle attribuzioni tematiche degli esperti con quelle individuate mediante LDA  la possibilità di usare i termini del thesaurus per etichettare i diversi topic prodotti dall'algoritmo

I risultati della ricerca, che saranno esposti nella presentazione, sono piuttosto contraddittori, e sembrano indicare la scarsa efficacia degli algoritmo di topic modeling (e in particolare di LDA) per una applicazione tematologica in ambito letterario, come già suggerito da Ciotti (2016), sebbene ci si possano aspettare sviluppi interessanti da alcune varianti di LDA (in particolare Labeled LDA, Ramage at al 2009).

Riferimenti Bibliografici

Blei, D. (2012). Probabilistic topic models. Communications of the ACM, 55.4: 77–84. Blei, D. (2013). Topic modeling and digital humanities. Journal of Digital Humanities, 2.1.

Ciotti F. (2014). Tematologia e metodi digitali: dal markup alle ontologie. In I cantieri dell'Italianistica. Ricerca, didattica e organizzazione agli inizi del XXI secolo. Atti del XVII congresso dell'ADI – Associazione degli Italianisti (Roma Sapienza, 18-21 settembre 2013), ed. Beatrice Alfonzetti. Roma: Adi editore.

Ciotti, F. (2016). What's in a Topic Model. I fondamenti del text mining negli studi letterari. In Digital Humanities 2016: Conference Abstracts. Jagiellonian University & Pedagogical University, Kraków, pp. 149-151.

Dennett, D. C. (1990). The Interpretation of Texts, People and Other Artifacts. Philosophy and Phenomenological Research, 50.S : 177-194.

Eco, U. (1979). Lector in fabula: la cooperazione interpretativa nei testi narrativi. Milano: Bompiani. Eco, U. (1990). I limiti dell’interpretazione. Milano: Bompiani.

Fahad Khan et al. (2016). Restructuring a Taxonomy of Literary Themes and Motifs for More Efficient Querying, MATLIT 4.

McCallum, A. K. (2002). MALLET: A Machine Learning for Language Toolkit. http://mallet.cs.umass.edu.

Moretti, F. (2013a). Operationalizing: Or, the Function of Measurement in Literary Theory. New Left Review 84: 103-119.

172

Pistellato, A. (a cura di), Memoria poetica e poesia della memoria. La versificazione epigrafica dall'antichità all'umanesimo, Atti dell’incontro di studi Venezia 3-4 maggio 2012, Edizioni Ca’ Foscari, Venezia, 2015.

Ramage, D., Hall, D., Nallapati, R. and Manning, C. D. (2009). Labeled LDA: A supervised topic model for credit attribution in multi-labeled corpora. Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing. Association for Computational Linguistics.

Segre, C. (1985). Tema/motivo. In Segre, C. Avviamento all’analisi del testo letterario. Torino: Einaudi, pp. 331-356.

173

Trascrizione e analisi linguistica del sogno:

oggetti concreti nei sogni di schizofrenici e depressi

Daniele Silvi, Università di Roma ‘Tor Vergata’, silvi@lettere.uniroma2.it

Marco Zanasi, Università di Roma ‘Tor Vergata’, marco.zanasi8@gmail.com

Sergio Pizziconi, pizziconi.sergio@gmail.com

Introduzione

L’idea di Marco Zanasi di codificare e di studiare le trascrizioni dei sogni dei suoi pazienti presso l’Ospedale Psichiatrico di Tor Vergata ha dato inizio ad una ricerca di squadra su un’ipotesi stimo- lante: C'è qualche correlazione tra la realizzazione linguistica della trascrizione di un sogno e la psico- patologia di cui il sognatore sta soffrendo? Finora, le analisi delle trascrizioni dei sogni si sono con- centrate principalmente sugli attanti, gli ambienti e i descrittori delle condizioni emotive, durante l'attività onirica. L'obiettivo della ricerca è verificare un insieme di funzioni linguistiche che possono essere significativamente correlate al tipo di psicopatologia su base statistica. Il sogno è un fenomeno psichico di precipua rilevanza per evidenziare alcune relazioni profonde tra corpo e mente. La prospet- tiva junghiana non vede differenze tra i significati latenti e quelli manifesti, pertanto l’apparente illeg- gibilità (o interpretazione) di un sogno è subordinata al linguaggio allusivo, allegorico ed opaco, uti- lizzato dalla narrativa onirica dell’inconscio. Un sogno, pertanto, deve essere considerato come un testo narrativo reale, al quale è possibile applicare l’analisi dello stile, narratologico e della struttura. Una trascrizione verbale dei dati onirici è, attualmente, il solo mezzo per rappresentare l’esperienza onirica. Naturalmente, la trasposizione di detta esperienza in un sistema linguistico preciso, si deve confrontare con fenomeni di traduzione intersemiotici: cosa si conserva e cosa si trasforma? È possibile identifi- care delle variabili che rimangono immutate in questo passaggio? Assumendo di sì, come possiamo collegare questi elementi con certezza all’attività psichica del soggetto studiato, filtrandola dalle strut- ture pertinenti al processo verbale utilizzato per riprodurla? La tesi sulla quale il progetto si basa, è che sia possibile, applicando l’analisi testuale al sogno considerato come espressione “grafica” di un lin- guaggio inconscio, estrarre importanti informazioni da un materiale apparentemente caotico e non strutturato. Il nostro obiettivo è dunque la creazione di un codice che consenta di leggere tali informa- zioni e non semplicemente una codifica che produca un testo annotato. A questo prodotto finale, la trascrizione del sogno, abbiamo poi applicator diverse tipologie di analisi, producendo tabelle e grafici che ne riportino I risultati. In questo paper intendiamo presentare i risultati della nostra ricerca sulla presenza, in questi racconti onirici, degli oggetti concreti: le cose che vengono menzionate dai pazienti in esame. In particolare, approfondendo questo punto, oggetto centrale del paper che presentiamo, se- guendo le suggestioni della grammatica funzionale di M.A.K. Halliday (1994), abbiamo indagato dif- ferenze e analogie nel modo i cui gli oggetti concreti sono inclusi nella struttura sintattica dei rapporti di sogni di schizofrenici e depressi. In particolare, abbiamo distinto la rappresentazione degli oggetti concreti all'interno dei processi espressi dai verbi in forma finita o non finita nel ruolo sintattico di (a) partecipanti o (b) circostanze.

La differenza, ad esempio, configura il ruolo sintattico di “autobus” menzionato in un sogno di una persona depressa nel ruolo di partecipante, strutturalmente il soggetto del processo nella frase: “l'autobus se ne va”; mentre è nel ruolo di circostanza a indicare il

174 luogo del processo verbale, nella frase: “mi trovavo su un autobus di quelli tipo aperti che sono da # da turismo no?”.

Abbiamo ridotto i ruoli di partecipante alle corrispondenti funzioni sintattiche di soggetto, oggetto diretto, oggetto indiretto, oggetto obliquo. La funzione circostanziale è stata invece ridotta ai tipi luogo, tempo, causa/fine, modo/maniera, condizione.

Il ruolo sintattico degli oggetti è stato quindi posto in correlazione con il tipo sintattico di processo distinguendo tra processi transitivi attivi, transitivi passivi, intransitivi, copulativi.

In questa porzione di sogno di persona cui è stata diagnosticata la schizofrenia si possono evidenziare diversi tipi di processo e di ruolo sintattico degli oggetti: “Ho sognato le farfallette per mettere le flebo mi sono sognato una farfalletta della flebo con un tubicino dal quale usciva tanto sangue ed era il mio sangue”. “Farfalletta” e “farfallette”, oggetti diretti strutturalmente, sono rappresentati come parteci- panti in due processi transitivi. “Flebo” è rappresentato con lo stesso ruolo nello stesso tipo di processo. “Sangue” è rappresentato come soggetto partecipante in un processo intransitivo (“usciva”) e in un processo copulativo (“era il mio”). “Tubicino” nella forma pronominale “dal quale” è rappresentato come elemento circostanziale a indicare il luogo di un processo intransitivo.

Tale matrice di dati arricchisce le correlazioni finora trovate nell'ambito del progetto Dream Coding tra forme linguistiche e tipo di psicopatologia diagnosticata ai soggetti che hanno raccontato i loro sogni per il gruppo di ricerca. L'idea originale di Marco Zanasi (Zanasi et al. 2005, 2008, 2010; Pizzi- coni, Zanasi e Silvi 2015) è che sia possibile affiancare ai normali protocolli diagnostici un'analisi linguistica dei racconti di sogni che individui la presenza di tratti linguistici che nelle indagini correnti e future sono stati correlati alle diverse psicopatologie.