• Non ci sono risultati.

Capitolo 2 Corpora, Traduzione e Ricerca

2.4 Corpora di parlato

Mentre, come vedremo nel paragrafo successivo, i corpora orali possono essere di tipo multimediale (integrando risorse audio e audio-video), oppure essere costituiti da dati unicamente in forma verbale scritta, e quindi del tutto assimilabili ai corpora di lingua scritta, i corpora di parlato sono per loro natura sempre multimediali, partendo dal trattamento dei dati audiovisivi. Allorché si ha a che fare con dati riguardanti l’interazione orale, è dunque necessario distinguere tra le registrazioni audio-video degli eventi e la relativa trascrizione. La tecnologia dei corpora della lingua parlata integra queste due forme di rappresentazione dei dati (primaria, nel caso dei dati audio-video, e secondaria, nel caso delle trascrizioni) considerando le audioregistrazioni o videoregistrazioni, assieme alle trascrizioni annotate, come modalità parallele e complementari di presentazione dei dati da analizzare.

In particolare, i corpora di parlato (speech corpora), veri e propri archivi di registrazioni sonore e/o visive, mirano a permettere un’analisi dello scambio comunicativo orale mediante strumenti analoghi a quelli oggi disponibili per la

18

Oltre agli strumenti citati, la linguistica computazionale ricorre a tutta una serie di ulteriori e più complessi test statistici e probabilistici per la verifica della rappresentatività del corpus e della legittimità dei risultati ottenuti dalla sua interrogazione (cfr. McEnery/Wilson 1996: 84-101).

lingua scritta o trascritta (cfr. 2.3 supra). Il recente sviluppo tecnologico ne ha consentito un’implementazione effettiva, con il passaggio da registrazioni audio- video su supporto analogico a registrazioni su supporto digitale, archiviabili in formato elettronico e, per questo, rapidamente condivisibili attraverso i canali tradizionali (CD-ROM, DVD) oppure on-line. Tali corpora sono stati originariamente utilizzati come materiale per la costruzione e la verifica di applicazioni tecnologiche specifiche, come i sistemi per il riconoscimento e la sintesi vocale.19 Oggigiorno, i corpora di parlato sono prevalentemente impiegati in studi antropologici, etnografici, di comunicazione non verbale, associata alla dimensione verbale, e in ricerche sull’apprendimento della prima e della seconda lingua.

Molte sono altresì le applicazioni software appositamente create per l’analisi di corpora di parlato. Le problematiche principali riguardano la segmentazione del dato audio-video, la definizione delle unità minime di analisi e l’elaborazione di strumenti e metodologie specifiche per l’annotazione. Data la tipologia di discipline che ne fanno attualmente uso, i corpora di parlato ad oggi disponibili sono per lo più corpora monolingui di tipo comparabile. Inoltre, la maggior parte degli strumenti attualmente disponibili consente di gestire non solo il dato audiovisivo ma anche le trascrizioni, risultando di fatto utilizzabile sia nella costruzione di corpora di parlato che di corpora orali, in cui porzioni di immagini o di file sonori sono ancorati a determinati punti della trascrizione. È il caso di Transcriber, un software liberamente accessibile, utilizzato per la trascrizione, la segmentazione, l’annotazione e l’allineamento di file del parlato. Originariamente concepito per il trattamento di registrazioni di tele e radio-giornali, il sistema consente di gestire una molteplicità di lingue (Barras et al. 2001). Il programma prevede altresì una finestra per la visualizzazione e la segmentazione del segnale sonoro con funzioni di zoom, selezione di parti del segnale o di pausa e riproduzione, e un editore di testo per la gestione del materiale trascritto. Le trascrizioni sono allineate e sincronizzate al segnale sonoro man mano che il testo è inserito.

19

Si rimanda a Bird e Harrington (2001) per un panorama generale di formati, strumenti e risorse sviluppati per la trascrizione e la codifica di testi orali.

Analogamente, esistono numerosi strumenti sviluppati specificamente per l’annotazione dei dati audiovisivi che operano per mezzo dell’assegnazione di time-code, spesso anche in assenza di parlato. Questi sistemi permettono di definire in maniera mirata le etichette dell’annotazione, modificarle in corso d’opera, creare delle gerarchie e ricercare i file annotati. Le annotazioni possono essere inoltre esportate in forma di tabelle per essere processate mediante software di elaborazione statistica, come Ms Excel o SPSS. Fra gli strumenti più importanti, citiamo EXMARaLDA (Extensible Markup Language for Discourse Annotation), applicazione sviluppata nel 2005 presso l’Università di Amburgo da Thomas Schmidt, che consiste in una serie di strumenti software per la creazione, la gestione e l’analisi di corpora di lingua parlata.20 Nata con l’obiettivo specifico di elaborare una piattaforma comune per l’archiviazione e la condivisione di vari progetti multilingui esistenti in seno all’Università, EXMARaLDA risulta essere particolarmente interessante, soprattutto in virtù della continuità del progetto. Il sistema consente di trascrivere il dato verbale in relazione al dato non verbale (video corrispondente) e di procedere all’annotazione multimodale. È altresì possibile importare le trascrizioni da altri sistemi, quali Praat, un programma di sintesi e analisi del parlato, messo a punto presso il Dipartimento di fonetica dell’Università di Amsterdam21; ELAN22, uno strumento per la creazione di annotazioni complesse su risorse audio e video, ideato nel 2002 presso l’Istituto di psicolinguistica Max-Planck (MPI) di Nijmegen; e, infine, Anvil23 (Kipp 2001), uno dei software che si è più rapidamente diffuso nella comunità scientifica internazionale e che consente di esportare le annotazioni allineate con il dato video. In tutti i sistemi citati, l’annotazione viene effettuata inserendo in una finestra a più livelli (che riproduce uno spartito musicale) la descrizione dei fenomeni specifici di interesse (movimenti del volto, delle mani, del corpo, ecc.), la trascrizione degli elementi verbali, ove presenti, nonché le rispettive funzioni o commenti. In questo modo, si ottiene un’annotazione di ciò che avviene nel video

20 http://www.exmaralda.org/. 21 http://www.fon.hum.uva.nl/praat/. 22

http://www.lat-mpi.eu/tools/elan/elan-description. Fra tutti i software ad oggi disponibili (se ne contavano già più di 60 nel 2004), solo Elan consente di gestire più video contemporaneamente (fino a quattro).

23

simile per forma e contenuto a una vera e propria trascrizione, estremamente minuziosa e scomposta nei suoi diversi elementi. Da un punto di vista terminologico, è inoltre interessante notare che, in letteratura, allorché tali strumenti sono utilizzati nell’ambito della comunicazione non verbale, ci si riferisce loro come a programmi per l’analisi e l’annotazione “multimodale”, mentre l’attributo “multimediale”, da noi adottato, viene preferibilmente impiegato in ambito traduttologico (cfr. 2.6).

Un altro strumento, che per caratteristiche tecniche e facilità di reperimento si sta rapidamente diffondendo e affermando come uno standard, è Workbench Transana.24 Il programma consente di affiancare alla visualizzazione della registrazione audiovisiva, salvata in formato digitale, un programma di videoscrittura. Esso crea, inoltre, una visualizzazione della traccia sonora (soundwave) permettendo l’inserimento semi-automatico della durata delle pause. L’analisi dei dati ne risulta così facilitata in quanto si ha la possibilità di accedere nello stesso ambiente operativo ai dati audiovisivi primari e, simultaneamente, alla loro trascrizione. Inoltre, filmato e trascrizione sono sincronizzati attraverso marche temporali inserite nel corpo della trascrizione. Infine, i file audiovisivi e il database Transana, ad essi associato, possono essere condivisi con altri utenti, messi in rete, oppure esportati su supporto digitale. Lo strumento consente, quindi, di effettuare vere e proprie analisi sui dati permettendo di codificare non solo la trascrizione, come avviene di solito nei corpora orali, ma direttamente i segmenti temporali, catalogabili in collezioni di clips. Ogni segmento, oltre a essere identificato da un titolo e da altri dati, può essere associato a un testo di commento e a una o più parole chiave che corrispondono a categorie descrittive/analitiche, a loro volta interrogabili. Diversamente da EXMARaLDA, che privilegia l’analisi del dato verbale, le ricerche effettuate con Transana non si basano, quindi, sulle caratteristiche formali della trascrizione, ma sulla selezione e classificazione di segmenti temporali a cui sono associati trascrizioni, commenti e parole chiave. Le trascrizioni possono comunque essere esportate per essere rielaborate e sottoposte ad analisi con altri programmi di concordanza e analisi statistica, quali quelli citati in precedenza.

24

Transana è stato creato da Chris Fassnacht e David Woods dell’Università di Wisconsin- Madison. Il programma è scaricabile gratuitamente dal sito http://www.transana.org.

Nonostante la grande quantità di software oggi disponibili, gli studi finora condotti hanno portato solo alla compilazione di corpora sperimentali, per lo più ancora di piccole dimensioni, circoscritti al dominio dell’analisi del discorso e della gestualità, e dell’apprendimento della prima lingua nei bambini. Tutti gli strumenti citati permettono, infatti, la compilazione di corpora essenzialmente monolingui, non consentendo l’allineamento né con le trascrizioni né con le videoregistrazioni di eventuali traduzioni dei dati originali, risultando quindi solo parzialmente utilizzabili al momento per la compilazione di corpora multimediali per la traduzione (e l’interpretazione).