• Non ci sono risultati.

L’evoluzione tecnologica e dinamica lavorativa

In precedenza ho accennato al fatto che, agli esordi della sua attività, la Cedat 85 era dotata di una strumentazione fortemente limitata. Nei primi anni novanta viene introdotto il dittafono della Sony, cioè un registratore con pedaliera e la funzione di speed control, per rallentare ed accelerare l’audio: le mani libere, così, consentivano una trascrizione più agevole. All’epoca, l’«attività era decisamente molto human intensive…l’importanza della persona, non solo dal punto di vista concettuale, di quello che era in grado di fare nel trasformare il parlato in scritto per bene, ma anche della sua capacità di utilizzare la tecnica e di essere veloce. Quindi le persone dovevano avere più capacità: velocità ad esempio a dattilografare e anche una notevole conoscenza della lingua italiana. Molto spesso tu avevi la persona di talento dal punto di vista linguistico, lessicale, che però con il computer, con la tastiera, non sapeva assolutamente come trattarla perché era brava a scrivere a penna. E quindi era molto difficile riuscire a trovare questa combinazione tra la qualità e la velocità nel fare il lavoro».

57 Quando nel ‘94-‘95 l’IBM produce il software Viavoice, la Cedat avvia il partenariato finalizzato alla creazione di dizionari specialistici. La necessaria pronuncia discreta, parola per parola, per la dettatura, e l’indispensabile intervento per la correzione delle parole, rendeva inizialmente tale metodologia di lavoro più lenta rispetto alla trascrizione dattilografica. Dato che per formare una dattilografa erano necessari due tre mesi, quando verso la fine degli anni novanta si ha il passaggio dalla tastiera alla dettatura, mi spiega Diana: «chiunque, tra virgolette, dopo una breve formazione di una settimana, poteva essere in grado di fare una trascrizione».

Questa innovazione, aggiunge Carlo, ha permesso di «modificare radicalmente il processo di lavorazione del verbale: così mentre nell’‘85 quando siamo nati c’erano gli operatori con cuffia sulla testa, audio e tastiera per trascrivere; nel ‘95 siamo diventati indipendenti dalla bravura nella velocità di digitare a testiera, incrociando i sistemi di riconoscimento vocale a dettatura». Dall’attività human intensive ove la professionalità si componeva tanto di conoscenze e di un intervento linguistico, quanto di bravura e di perizia fisica (incarnata nell’abilità di digitazione), con il software per il riconoscimento vocale ed il passaggio alla dettatura, quest’ultima viene meno. Dai due o tre mesi di formazione del professionista della rendicontazione, i tempi si contraggono ad una settimana.

Ma il processo evolutivo segna una ulteriore tappa, prosegue Carlo, quando «nel 2007 abbiamo anche messo da parte i sistemi vocali a dettatura, perché oggi l’operatore non ha nemmeno bisogno di dettare, riceve sulla sua postazione la trascrizione in bozza fatta dalla macchina sulla quale poi lui, ascoltando l’audio, interviene per rimettere a punto, dal punto di vista lessicale e linguistico». Questo sistema è stato considerato di successo quando si è verificato che, mediamente, il 90% del trascritto era corretto. «Sono quasi cinque anni che lavoriamo con questa tecnologia, che ha permesso di rendere il lavoro più agevole in quanto anche con la dettatura il trascrittore arrivava alla fine della giornata senza voce, facendo quotidianamente questo lavoro…molto stressante. E invece in questa maniera ci si può concentrare più sul testo, quindi su quello che viene effettivamente detto dall’oratore in modo da riportarlo per bene. Già si lavora su una trascrizione e quindi è stato anche nobilitato il lavoro del trascrittore che a quel punto può mettere in campo le sue conoscenze concettuali, le sue conoscenze delle nozioni, di quello che si sta parlando, più che fare la trascrizione meccanica come fino allora si era fatto di quello che veniva detto». Più precisamente, o meglio più realisticamente, il passaggio alla trascrizione automatica più che «nobilitare» il lavoro dei cosiddetti «filtri umani» - di cui parlava Viviana - di fatto, lo supera nella sua quasi totale automazione. Se, in termini generali, tale evoluzione tecnologica consente l’eliminazione dal lavoro di resocontazione delle attività più ripetitive di trascrizione, è vero anche che nel caso specifico dell’organizzazione della Cedat, che aveva scomposto il processo lavorativo nelle diverse attività di trascrizione, revisione e coordinamento, di fatto produce, sic et simpliciter, l’eliminazione di quel corpo di lavoratori votato alla più ingrata e ripetitiva delle tre.

Lo sviluppo informatico, infatti, ha avuto un incedere ristrutturante non solo sul piano micro- lavorativo del singolo professionista, ma anche su quello meso inerente all’intero processo produttivo: dalla piattaforma web trascrivi.net per la gestione della revisione, la dinamica lavorativa viene totalmente rivisitata con magnetofono. A metà anni novanta, appunto, «nasce il progetto magnetofono che rivoluziona completamente […] facendo gruppi di lavoro, assegnando parti di audio ad un trascrittore, parti ad un altro, parti ad un altro, e poi il tutto viene convogliato in un contenitore che produce il file unito, revisionato, trascritto della registrazione

58 completa…diciamo che questa è una logica che veniva già da trascrivi.net, quello che abbiamo fatto è automatizzare una sequenza di azioni che porti al prodotto finito», mi spiega Paolo, un informatico impegnato sulle attività di Ricerca e Sviluppo.

La strutturazione per più livelli è stata introdotta nel ’95, e prevedeva come canale di comunicazione una rete LAN Internet che ha poi consentito alla stessa metodologia di essere applicata a persone non poste nello stesso ufficio. L’evoluzione di questo modello tecno- organizzativo si è orientato negli ultimi anni verso la digitalizzazione - oltre che delle relazioni interne tra operatori, anche quelle con il cliente - e l’automazione di una serie di operazioni a cui si accennava sopra. La versione tre di questo flusso di lavorazione, mi spiega ancora il condirettore, «mantiene di base la stessa organizzazione ma ha visto integrato a livelli più spinti la trascrizione automatica, il riconoscimento di chi parla e la pubblicazione sulla pagina web: per cui tu oggi attraverso un imbuto che è il software che ti registra a casa del cliente, sei in grado attraverso questo imbuto di far entrare l’audio in questo imbuto, in una bottiglia all’interno della quale ci sono tutte le fasi che si possono scegliere se chiamare in causa o meno per gestire le diverse tipologie di servizio. Quindi dalla semplice trascrizione automatica, se il cliente vuole solo la trascrizione automatica, fino ai cinque gradi di revisione, senza che per questo manualmente ci debba essere un passaggio, un’organizzazione. Per cui semplicemente loggandosi con il proprio sistema, sul proprio computer si ha accesso a questa piattaforma e si può fare l’attività alla quale si è chiamati». Se il software di gestione del processo produttivo si concentrava negli anni novanta sulla suddivisione e ricomposizione dei file audio tra gli operatori, la sua evoluzione più prossima ha annullato la necessità che tecnici interni andassero fisicamente a recuperare l’audio presso i clienti, o che si riconsegnassero i testi trascritti a fine lavorazione.

Il concorso congiunto di tali modalità di interazione con il cliente, lo sviluppo della trascrizione automatica, insieme con il riconoscimento da parte del programma dell’oratore, ha consentito la vendita, come «prodotto» indipendente, di soluzioni informatiche messe a punto dalla Cedat. Se per alcuni clienti, infatti, risulta essenziale un intervento di adattamento allo scritto del parlato, altri si accontentano della trascrizione automatica. Così, aggiunge Carlo: «abbiamo raccolto il consenso di cento comuni, per un servizio di verbalizzazione automatica. Cioè noi gli mettiamo al servizio un sistema che gli registra l’audio (se c’è il video, fanno le riprese video, anche il video). Attraverso il sistema di trascrizione automatica, trascrive tutto automaticamente quello che viene detto durante il consiglio e mettiamo a disposizione del cliente una pagina web che loro possono anche integrare nel loro sito; dove hanno l’archivio delle sedute audio e video indicizzato, quindi possono fare una ricerca parola per parola all’interno dell’archivio». La strumentazione data al comune consiste in un software di registrazione installato al computer e quindi collegato all’impianto di amplificazione. La formazione è poi semplicissima, perché bisogna spiegare all’operatore come accendere, avviare e fermare la registrazione: insomma, di una sola ora. A quel punto l’intero processo è automatico: sufficiente che il registratore sia collegato in rete, quando si avvia il consiglio, l’audio viene dirottato sul server di Cedat dove ci sono tutti i diversi software che permettono la trascrizione automatica, indicizzazione, pubblicazione su pagina web, ricerca con motori di ricerca e, nel giro di pochi minuti dalla fine del consiglio, tutto è pubblicato su una pagina web disponibile per il cittadino. Già, perché nel 2012 si è messo a punto un sistema speaker recognition che riconosce chi parla e ne inserisce automaticamente il nome nella trascrizione prima del relativo intervento. Analizzando i profili

59 verbali, facendo un addestramento breve, il software fa un analisi dei profili vocali e dà probabilità che sia l’uno o l’altro con un livello di accuratezza del 90%. Con una tecnologia molto semplice e accessibile, si rendono immediatamente reperibili e disponibili le informazioni al cittadino sulle decisioni assunte dall’amministrazione con riduzione dei costi e con la possibilità di mettere a punto dei servizi per utenti con difficoltà uditive (sottotitolazione che manualmente costerebbe molto). Insomma, i clienti che non desiderino la resocontazione, possono acquistare la tecnologia Cedat e ottenere «il testo trascritto automaticamente alla fine dell’intervento: quindi uno finisce di parlare, e […] trenta secondi dopo può avere la stampa di quello che ha detto, come trascrizione automatica…è chiaro, ripeto, se c’è l’intervento umano devi comunque aspettare qualche minuto, ma parliamo di minuti», aggiunge Diana. Se si desidera, cioè, l’adattamento del parlato alla forma scritta si innesca tutta l’organizzazione di cui ho dato conto sopra e che chiama in ballo l’intervento dei revisori e del coordinatore.

Come è evidente da questa breve ricostruzione della storia tecnologica aziendale, la sua evoluzione ha prodotto risultati importanti: da un lato ha consentito l’alleggerimento del lavoro per gli operatori, sollevati dalla fatica dalla trascrizione, dall’altro ha notevolmente ridotto i tempi di lavoro. Ma, se dalla prospettiva organizzativa, il mutamento è una retta ascendente che porta a performance sempre migliori, da quella lavorativa non può intravedersi una medesima linearità. Come ho tentato di rendere conto precedentemente, la frammentazione del lavoro e delle corrispondenti conoscenze inerenti all’evento, tra vari operatori, i ritmi lavorativi serrati o dilatati, sui quali non si ha alcun controllo, la mancanza di potere, decisionalità e comprensione del processo lavorativo, la deficienza di interazioni costruttive, sebbene si svolgano dinamiche lavorative, formalmente, di gruppo, sono tutti aspetti che ci riportano un’immagine dell’impatto tecnologico sul lavoro fortemente in contrasto con le asserzioni del mainstream sociologico. Più precisamente la tecnologia (o meglio, l’uso che ne viene fatto), se porta ad un miglioramento complessivo dell’attività in termini di efficienza, sul lavoro impatta in modo negativo, al di là di diversi interventi migliorativi dello stesso.

Se il software speaking indipendent ha consentito una trascrizione automatica e, laddove richiesto, una riconsegna del lavoro prescindente dalla revisione, è vero anche che gli sforzi interni del gruppo di Ricerca e Sviluppo sono orientati, sempre più, ad assottigliare il margine di errore insito nella trascrizione e a incorporarla nell’attività che è ancora appannaggio dei revisori: inserimento automatico della punteggiatura ed eliminazione degli intercalari; con un gruppo dedicato, inoltre, si continuano ad accrescere i dizionari specialistici del software di modo da sofisticare sempre più lo stesso, riducendo i margini di errore nel riconoscimento. Alessandra che ne fa parte, mi spiega che: «questo sistema di riconoscimento vocale e quindi di trascrizione non è un sistema perfetto…tende alla perfezione…diciamo…quindi è continuamente in elaborazione, serve sempre e comunque una mole di dati che deve essere data ad incastro affinché possa elaborare questi dati e perfezionarsi. E questa mole di dati deve essere creata dalle trascrizioni che noi facciamo». I dati di cui parla sono parole tecniche mutuate dal linguaggio giuridico, medico-scientifico, giornalistico, «affinché il sistema possa sempre di più specializzarsi come un bambino che impara il linguaggio: a sei anni avrà un certo lessico, a dieci anni ne avrà un altro, a quindici anni avrà un lessico ancora maggiore. Quindi questo sistema deve essere educato, gli devono essere forniti una quantità di dati sempre maggiore ma sempre più…specializzati, ecco perché questo lavoro della trascrizioni non finisce».

60 Se il lavoro della trascrizione residua solo per il miglioramento del software e quindi per la ulteriore riduzione dell’apporto dei revisori, in questa fase successiva, l’intervento umano risulta tuttavia, ancora, necessario. Ma nel futuro prossimo lo sviluppo tecnologico potrà spingersi al di là del lavoro dei revisori. È possibile superare anche le fasi intermedie di revisione?

Secondo Carlo: «per quanto riguarda l’automazione, la risposta è no […]. Tutto quello che noi pensiamo, sviluppiamo, mettiamo a punto, è pensato esclusivamente per essere a supporto dell’attività di verbalizzazione, trascrizione, resocontazione, sbobinatura, come la vogliamo chiamare. C’è una parte importante che è quella che riteniamo che ancora oggi, e penso per ancora per un po’ di tempo, solo il cervello umano possa fare. Stiamo lavorando anche su sistemi di correzione informatica del linguaggio, però, quello che la rete neuronale, quello che è un cervello, che lavora quotidianamente su queste attività fa, sono una serie di passaggi in automatico che la macchina non riesce a fare […] che non è codificabile o che magari potrà anche essere codificata via via che gli studi e la ricerca che si va a fare viene approfondita…le potenze di calcolo aumentano, puoi costruire algoritmi sempre più complessi che le macchine riescano a sostenere a elaborare in maniera veloce. Ma arrivare ai salti mentali che anche noi facciamo, cioè anche nel momento in cui noi parliamo, se io ti dico mezza parola è come se tu l’avessi ascoltata. Nel sistema di trascrizione automatica, la mezza parola è molto probabile che ti trascriva qualcos’altro, perché è una parola che non esiste nel vocabolario, essendo mezza parola. O magari per una serie di eventi riesce a riconoscerla e lì si avvicina a quello che fa la mente umana». Prosegue dicendo che: «nel 70-80 per cento dei casi ti scrive una cosa sbagliata e non ti scrive la mezza parola perché non ce l’ha nel vocabolario. Nella nostra mente invece quello che io ti sto dicendo tu lo capisci perché la mente è già abituata a sapere che appena ti inizio la parola “reso” tu sai che non sto parlando del resort ma sto parlando della resocontazione perché questo è il contesto. E riteniamo che la mente umana non potrà essere sostituita con sistemi automatici». Se è certamente vero che allo stato attuale solo la mente umana consente di effettuare quei passaggi logici che permettono di decodificare quanto detto dall’oratore, è altrettanto vero che la Cedat sta facendo ricerca per provare a superare l’intervento umano, facendolo sussumere e riprodurre dalla macchina informatica attraverso un’analisi probabilistica delle parole mediante fonogrammi. La costruzione del modello, mi spiega Paolo, informatico, è complesso: «se ci stiamo lavorando? Ovviamente sì. Quanto è futuribile questa cosa in tempi brevi? Non te lo so dire, nel senso che ad oggi la percentuale di errori su un’analisi di questo tipo è parecchio elevata…è significativa, cioè non la puoi utilizzare…conviene ad oggi partire da una bozza di trascritto automatico del parlato ed avvalersi di quelle capacità specifiche degli operatori resocontisti che sono figure professionali skillate…anche perché poi c’è il problema che da azienda ad azienda (tu immagina la Camera dei Deputati, piuttosto che la Corte dei Conti, o il Comune di Roma o Regione Lazio), cambiano anche le formule, quindi hai ulteriormente la necessità di contestualizzare (a volte nella stessa azienda cambiano le formule da anno in anno), per cui è un lavoro abbastanza grosso…la mente umana è più flessibile da questo punto di vista, a meno di trovare un modello che sia facilmente personalizzabile, però ti ripeto le possibilità sono innumerevoli». La mente umana, allo stato attuale delle cose, risulta più utile che non un software. Ma ciò che voglio mettere in risalto è il tentativo, insistente e unidirezionale sia lo sviluppo tecnologico che la sua implementazione pratica, verso la simulazione/riproduzione delle funzioni umane, allo scopo di superare l’apporto del lavoratore al processo lavorativo. Questa

61 dinamica è data dall’incessante tensione verso la traduzione e l’adattamento informatico delle mansioni dei lavoratori, dapprima sostenendoli per poi roderne, via via, i margini di intervento.

1.4