AI MIEI GENITORI
INDICE
1
INTRODUZIONE
p. 3
1.1
L’analisi quantitativa del discorso
p. 4
1.2
Gli strumenti utilizzati
p. 8
2
I GIORNALI E I TEMI DEL LAVORO E DEL WELFARE
p. 102.1
I giornali e il periodo di riferimento
p. 10
2.2
Ipotesi generali e struttura del lavoro
p. 14
3
IL TRATTAMENTO PRELIMINARE DEL TESTO
p. 18
4
L’ANALISI “ESOGENA” DEI LESSICI
p. 21
4.1
Il confronto con il linguaggio comune
p. 21
4.2
Il confronto con un dizionario economico
p. 27
4.3
Il confronto con il discorso programmatico di governo
p. 29
5
L’ANALISI “ENDOGENA” DEI LESSICI
p. 32
5.1
I lemmi più utilizzati
p. 32
5.2
L’analisi delle specificità
p. 40
5.3
I sub-corpora “Salari” e “Pensioni”
p. 46
5.4
L’analisi delle concordanze
p. 51
6
L’UTILIZZO DEGLI AGGETTIVI
p. 57
6.2
L’utilizzo degli aggettivi nei sub-corpora “Salari” e “Pensioni” p. 61
6.3
L’utilizzo degli aggettivi nei vari mesi
p. 63
7
L’ANALISI DELLE CORRISPONDENZE
p. 73
8
CONCLUSIONI
p. 87
Glossario
p. 95
Bibliografia
p. 98
1
INTRODUZIONE
Obiettivo di questo lavoro è studiare come sei giornali – Il Giornale, Il
Manifesto, Il Mondo, La Repubblica, Il Sole 24 Ore, Lavoce.info1 – affrontano le notizie relative ai temi del lavoro e del welfare. Come strumento si utilizzano le tecniche
dell’analisi quantitativa del discorso, con gradi di approfondimento progressivamente maggiori, facendo ampio ricorso al software TalTac2. L’analisi si
svolge su un data base (detto corpus) di 5556 articoli pubblicati sui sei giornali nell’arco di tempo compreso tra i mesi di settembre e dicembre 2007.
Nell’introduzione si presentano, a grandi linee e in chiave storica, la
disciplina dell’analisi quantitativa del discorso e le tecniche utilizzate in questa ricerca; si presentano poi, nel secondo capitolo, le ipotesi e la struttura del lavoro.
La prima analisi che svolgiamo riguarda il linguaggio delle sei testate in generale: si valuta quali tra esse hanno un linguaggio più tecnico o più specialistico.
Nella fase successiva si osserva quali sono i termini più utilizzati, nell’intero corpus e negli articoli contenenti riferimenti ai temi dei salari e a quelli delle
pensioni (vengono a tal fine creati due sub-corpora), in modo da capire quali sono gli argomenti prioritari per ciascun giornale.
Si analizza poi come i sei giornali affrontano i temi del lavoro e del welfare,
sia nel senso della propensione a dare o a lasciare trasparire giudizi positivi e negativi, sia nel senso delle dimensioni concettuali di analisi da essi privilegiate. In entrambi i casi l’analisi è svolta sia sul corpus generale che sui sub-corpora “Salari” e
“Pensioni”. In questa parte ci si serve prima di un dizionario di aggettivi positivi e negativi e poi dell’analisi delle corrispondenze lessicali.
In generale, emerge che le differenze tra le testate generaliste (Il Giornale, Il Manifesto, La Repubblica) sono inferiori rispetto a quanto ci si potrebbe attendere.
1 Nel corso del nostro lavoro nomineremo questi giornali semplicemente come Giornale, Manifesto,
Mondo, Repubblica, Sole 24 Ore, Voce.info (senza il formato in corsivo e non necessariamente preceduti dall’ articolo).
In ogni caso Il Manifesto, conformemente alle nostre aspettative, dedica maggiore
spazio ai temi sindacali e adotta toni più critici rispetto agli altri due quotidiani. Più marcate sono invece le specificità dei tre giornali economici (Il Mondo, Il Sole 24
Ore, La Voce.info). Il Sole 24 Ore dedica maggiore spazio all’attualità politica, utilizza toni più critici ed è particolarmente attento alla realtà delle professioni, con
approfondimenti più spesso giuridici che economici. Il Mondo si concentra sul mondo della finanza e delle grandi imprese, e non affronta quasi mai i temi dei salari e delle pensioni. La Voce.info valorizza invece particolarmente questi due
temi, e presenta un grado di approfondimento economico maggiore rispetto agli altri due giornali.
Nelle conclusioni si cerca di valutare i risultati di questo lavoro alla luce di alcuni modelli – presenti nella letteratura economica e sociologica – che analizzano determinate caratteristiche del mercato dei giornali e la loro influenza sulla linea
editoriale dei giornali stessi. Effettueremo infine delle considerazioni sul rapporto tra i media e l’adozione e la percezione delle politiche pubbliche, con particolare
riguardo a quelle sui temi del lavoro e del welfare.
1.1 L’analisi quantitativa del discorso
L’analisi quantitativa in ambito linguistico è una disciplina giovane, che si è
sviluppata in anni recenti, in stretta interazione con l’evoluzione degli strumenti statistico-informatici. Questo tipo di analisi si rivolge a grandi moli di materiale testuale, e si contrappone ad approcci di ricerca qualitativi, caratterizzati da uno
scarso livello di standardizzazione degli strumenti di raccolta dei dati. L’esigenza principale, nell’avvalersi di tecniche statistiche per l’analisi testuale, è quella di
evitare interpretazioni suggestive e, soprattutto, di formulare procedure di analisi codificabili e ripetibili. L’esplorazione sistematica della struttura del testo, naturalmente, non impedisce di ritornare in ogni momento al testo originario per
arricchire le interpretazioni proposte. In questo senso, l’approccio
statistico-quantitativo non deve essere inteso come alternativo, ma come integrativo rispetto ad altri di tipo più qualitativo.
Questa disciplina nasce come branca della linguistica nel secondo dopoguerra2 e viene sviluppata negli anni ’60 e ’70 del secolo scorso, da studiosi
prevalentemente francesi, con la disciplina della analyse des donnés3. A questa logica di tipo linguistico, concentrata sullo studio delle proprietà della lingua, si affiancano, negli anni successivi, approcci di tipo lessicale, fondati sullo studio dei
lemmi4, e in seguito approcci di tipo lessico-testuale, che concentrano l’attenzione sull’analisi statistica delle forme grafiche, intese come unità di analisi elementari,
corrispondenti all’insieme di caratteri compresi tra due spazi. Questa disciplina, inoltre, tende a concentrarsi sulla comprensione del significato e del messaggio contenuti nei testi o nei linguaggi di riferimento, allontanandosi dagli aspetti di
pura teoria linguistica. Contestualmente a questo mutamento di obiettivo, vengono sviluppati, ad opera di Lebart e Salem5, i primi software per l’analisi dei dati
testuali, che consentono di elaborare in maniera automatica grandi moli di dati. Oggi, grazie a programmi informatici che consentono una rapida indicizzazione dei
corpora testuali, è possibile analizzare in modo sistematico e semi-automatico testi di dimensioni consistenti e difficilmente esplorabili in altro modo, attraverso l’attuazione di tutti i confronti possibili e l’individuazione delle dimensioni
fondamentali di senso presenti in un testo oggetto di studio.
2 Per questa parte di presentazione storica e metodologica della statistica linguistica si è fatto
riferimento prevalentemente a Bolasco (2005) e a Della Ratta-Rinaldi (2008).
3 Questa scuola francese, che faceva riferimento in particolare a Benzécri, sosteneva che la linguistica
dovesse seguire un metodo induttivo, ricavando le proprie regole da un corpus di testi, e si contrapponeva alla grammatica generativa di Chomsky, una teoria grammaticale completa ed organica che procede con metodo deduttivo, a partire da assiomi. Per un resoconto di questo dibattito, che non possiamo qui riportare, si rimanda tra gli altri a Bolasco (2004).
4 In linguistica si intende per lemma la forma rappresentativa di tutte le forme flesse che una unica
parola può presentare. Ad esempio, alle forme flesse bello, bella, belli, belle, corrisponde il lemma bello. A questa definizione faremo riferimento anche in seguito, nel nostro lavoro.
La scelta di concentrare l’analisi sulle forme grafiche, e non più per lemmi,
presenta il vantaggio di essere indipendente dalle regole della linguistica6. Seguendo un approccio definito formalista, si esaminano i segni – in questo caso i
significanti – per ottenere informazioni sul senso e sul contenuto del discorso – l’insieme di significati. Negli ultimi anni l’approccio formalista è stato integrato,
soprattutto ad opera di Bolasco7, rivolgendo l’attenzione ad unità di analisi di tipo misto, più flessibili, definite da questo autore forme testuali. Si considerano in sostanza non solo semplici forme grafiche, ma anche espressioni – definite
polirematiche – costituite da più parole, ma che abbiano un significato non composizionale, ossia diverso dalla somma dei significati elementari delle parole
componenti8. L’approccio che si concentra su queste unità minimali, “atomi di senso”, è definito lessico-testuale.
Uno dei problemi di fondo della statistica testuale è quello di effettuare degli
studi statistici su dati espressi in linguaggio naturale (dati testuali). Analisi di questo tipo, infatti, richiedono di associare ai dati – alle parole in questo caso – degli
indici statistici (frequenze assolute e relative, nel caso più semplice). La dimensione illimitata e sfuggente della lingua, tuttavia, rende difficile associare alle parole una
qualche frequenza in senso statistico-probabilistico. Da questo deriva l’esigenza, per ottenere dei linguaggi e delle frequenze di riferimento, di considerare le occorrenze delle parole in un testo o in una raccolta di testi di enormi dimensioni. Questi testi
sono considerati dei campioni del linguaggio di riferimento, e le frequenze sono delle stime dell’utilizzo dei vari termini nel lessico considerato, limitato solitamente
a specifici idiomi. In questa direzione, approcci quantitativi alla linguistica sono da molti anni seguiti da studiosi italiani. Fin dagli anni ’70, infatti, sono stati elaborati,
6 In questa disciplina non sempre le espressioni utilizzate hanno una definizione univoca. Pertanto,
per fini di chiarezza, le definizioni dei termini tecnici che utilizzeremo in seguito sono riportate nel glossario.
7 Per un ampio panorama di questa disciplina rimandiamo a Bolasco (2004). Tale approccio è stato
anche utilizzato, in uno studio specificamente rivolto al mondo dell’informazione, in Censis (2005).
8 La polirematica cuneo fiscale, ad esempio, ha un significato autonomo, che non corrisponde alla
ad opera di linguisti come De Mauro, Zampolli e Bortolini9, lessici di frequenza
d’uso delle parole a livello di lemmi. Come vedremo in seguito, per i fini del nostro lavoro ci siamo serviti di alcuni vocabolari messi a disposizione dal software
TalTac2, mentre altri, più semplici, sono stati da noi creati appositamente.
Una procedura per l’analisi automatica del testo
Come detto, l’analisi di un corpus con gli strumenti della statistica testuale consente, e presuppone, un elevato livello di automatizzazione delle procedure di analisi. Bolasco, delineando una “filiera”10, individua quattro fasi: la preparazione
del testo, l’analisi lessicale, l’estrazione di informazione e l’analisi testuale.
La prima fase consiste nella pulitura e normalizzazione del testo. In sostanza,
si tratta di eliminare i separatori (es. segni di interpunzione) e i caratteri ritenuti irrilevanti, e di riconoscere e uniformare, dove possibile, occorrenze discordanti
della stessa parola.
La seconda fase, l’analisi lessicale, studia il vocabolario del corpus di riferimento ed è volta a fornire una rappresentazione paradigmatica o verticale11 del
testo in esame. Può essere definita un’analisi di tipo verticale, in quanto le parole sono estratte come da un’urna, senza tenere conto dello sviluppo del discorso.
L’attenzione si può concentrare sia sulle parole “piene” (di contenuto), sia sulle parole “vuote” (connettivi, preposizioni, congiunzioni, determinanti, interiezioni).
In entrambi i casi, è possibile valutare statisticamente le costanti del linguaggio che differenziano, o accomunano, il corpus in esame con un corpus di riferimento.
9 Il primo lavoro italiano in questa direzione è Bortolini et al. (1972).
10 Bolasco (2005), pp. 8 e seguenti. Non si tratta tuttavia di una “proceduralizzazione” rigida né
generalmente riconosciuta. A titolo di esempio, in Della Ratta-Rinaldi (2008) ne è riportata una differente, in otto passaggi. Ciò che rileva è l’esigenza di automatizzare l’analisi, dividendola in procedure codificate.
11 Bolasco (2005), pp. 12 e seguenti. Un’analisi si dice paradigmatica o verticale quando è volta allo
studio delle singole parole e di quelle che possono essere ad esse sostituite senza modificare il senso del sintagma. Un’analisi si dice sintagmatica o orizzontale quando, a partire da una singola parola, studia le altre parole che la circondano.
La terza fase, l’estrazione di informazione, si concentra sulla parte del
linguaggio che risulta particolarmente significativa all’interno del testo in analisi. Si seleziona quindi il cosiddetto linguaggio peculiare del corpus, concentrando l’analisi
solo su di esso.
La quarta fase, l’analisi testuale, cerca di fornire una rappresentazione
sintagmatica o orizzontale – e non, come in precedenza, paradigmatica o verticale – del testo. Le operazioni non sono rivolte alle singole parole, come nell’analisi lessicale, ma direttamente al corpus. In questa fase si osserva in sostanza il modo in
cui interagiscono le parole, calcolando ad esempio le co-occorrenze di un gruppo di parole o le sequenze di parole che precedono o succedono a parole pivot.
1.2 Gli strumenti utilizzati
Fin dagli anni ’80 sono stati elaborati numerosi software per l’analisi
quantitativa del discorso. Per il nostro lavoro, abbiamo utilizzato TalTac2, il
programma più noto ed utilizzato in lingua italiana, nella sua versione più recente
(luglio 2008). TalTac2, acronimo di Trattamento Automatico Lessicale e Testuale per
l’Analisi del Contenuto, è stato elaborato, nel corso degli anni ’90, da Francesco
Baiocchi, Sergio Bolasco e Adolfo Morrone. Si tratta, come detto, di un software per l’analisi automatica del testo nella duplice logica di Text Analysis e Text Mining12,
utilizzando risorse di tipo sia linguistico che statistico. Tale analisi consente di dare delle rappresentazioni del fenomeno studiato su base quantitativa sia a livello di
unità di testo (parole) sia a livello di unità di contesto (frammenti/documenti), quindi come linguaggio utilizzato e come contenuti trattati nel testo. Per l'approccio
12 Per text mining si intende l’analisi di dati caratterizzati dal fatto di essere testi in lingua naturale.
L’obiettivo è, come visto prima, quello di estrarre l’informazione implicita contenuta in un insieme di documenti.
seguito questo è possibile senza leggere materialmente la collezione di testi e quindi
indipendentemente dalla dimensione del corpus, che può essere vastissima, come nel caso del nostro lavoro, basato su un corpus di quasi quattro milioni di parole. In
generale, l'analisi svolta in TalTac2 permette di selezionare ed estrarre
l’informazione più significativa dal corpus di testi analizzato (linguaggio peculiare, linguaggio rilevante, linguaggio specifico) e di operare secondo i principi del text
mining mediante ricerche per parole chiave o per concetti. Questo software, inoltre, mette a disposizione alcuni dizionari tematici, con i quali è possibile confrontare il
corpus oggetto di studio.
Nella seconda parte del lavoro si fa ricorso anche al programma di
2
I GIORNALI E I TEMI DEL LAVORO E
DEL WELFARE
2.1 I giornali e il periodo di riferimento
I giornali scelti per la nostra ricerca, come detto, sono il Giornale, il Manifesto, il Mondo, la Repubblica, il Sole 24 Ore e la Voce.info. La scelta di queste
sei testate è volta ad offrire un quadro da un lato, per quanto possibile, rappresentativo dell’intero panorama editoriale italiano, dall’altro adatto a mettere
in luce delle specificità interessanti. Sono infatti presenti giornali quotidiani (Giornale, Manifesto, Repubblica, Sole 24 Ore) e un settimanale (Mondo), generalisti (Giornale, Manifesto, Repubblica) ed economici (Mondo, Sole 24 Ore, Voce.info). La
Voce.info, inoltre, presenta la peculiarità di essere pubblicata esclusivamente on line, con articoli pubblicati senza una cadenza prestabilita.
Il Manifesto è un quotidiano apertamente schierato a sinistra, di media tiratura, che ha tenuto una posizione critica, anche se non avversa, nei confronti del
secondo governo Prodi. L’esplicito orientamento politico, unitamente alle ridotte dimensioni del giornale (circa venti pagine), fanno sì che il numero degli articoli economici sia inferiore a quello degli altri quotidiani e che essi affrontino
prevalentemente gli argomenti di interesse del Manifesto. Limitando la selezione agli articoli relativi al lavoro e al welfare, la differenza con gli altri quotidiani, in
termini di numero di articoli, si riduce in virtù della buona “esposizione” di questi temi sul Manifesto.
La Repubblica è, assieme al Corriere della Sera, il quotidiano con la maggiore
diffusione in Italia. Pur non essendo legato a nessun partito, è solitamente identificato come un quotidiano di centro-sinistra. Le sue dimensioni sono molto
grandi, superando generalmente – se si considerano le sezioni locali (Roma, Torino, Genova, Milano, Bologna, Firenze, Napoli, Bari, Palermo) – le cento pagine. Vi sono
riportate un gran numero di notizie, e si può dire che il quotidiano, pur avendo la
redazione principale a Roma, non abbia alcuna connotazione geografica e abbia anzi un respiro nazionale maggiore rispetto al Corriere della Sera.
Il Giornale è un quotidiano ad alta tiratura, la cui redazione principale è a Milano. Pur vendendo la gran parte delle proprie copie nelle regioni dell’Italia
settentrionale, può essere considerato il principale quotidiano nazionale di centrodestra. La proprietà del Giornale è della famiglia di Silvio Berlusconi, e durante i due anni del secondo governo Prodi questa testata ha tenuto una linea di
costante critica nei confronti delle politiche messe in atto dall’Unione. La posizione del Giornale nelle materie economiche non sembra univoca, tuttavia quella sui temi
del lavoro e del welfare può essere definita, a prima vista, liberal-conservatrice. Il Sole 24 Ore è il principale quotidiano economico italiano, con una diffusione media di circa 400.000 copie. La redazione principale è a Milano e buona
parte delle sue copie sono vendute nell’Italia settentrionale, ma il respiro di questo giornale è senza dubbio nazionale. All’edizione nazionale si affiancano diverse
edizioni locali (vi sono redazioni a Roma, Torino, Padova, Trieste, Bologna, Genova, Firenze, Bari, Napoli, Palermo). Il Sole 24 Ore è interamente di proprietà di
Confindustria e la sua linea politica ed economica è tradizionalmente liberale, con una posizione negli ultimi anni tendenzialmente imparziale nei confronti dei due principali schieramenti politici. La scelta del Sole 24 Ore, tra l’altro, ci pare che possa
autorizzare a non prendere in considerazione il Corriere della Sera. Il Corriere, infatti, si colloca tradizionalmente su posizioni e toni simili a quelli del quotidiano
da noi preso in considerazione, seppur in maniera evidentemente meno specialistica.
Il Mondo è un settimanale politico, economico e culturale fondato da Mario Pannunzio nel 1949. Tradizionalmente schierato su posizioni liberali e radicali, da alcuni anni è di proprietà di RCS Media Group. Anche il Mondo dovrebbe tenere
una linea simile a quella del Corriere della Sera, ma con un taglio più orientato verso l’approfondimento.
La Voce.info non è propriamente un giornale, quanto piuttosto una
newsletter – aggiornata con cadenza settimanale – di informazione sul quale vengono pubblicati articoli e approfondimenti su tematiche di economia ed
attualità. È stata fondata nel 2002 da alcuni professori universitari di economia, ed economisti sono quasi tutti i redattori e i collaboratori del sito; il contenuto degli
articoli è generalmente piuttosto tecnico, ma con un approccio divulgativo. Da un punto di vista politico, la Voce.info mantiene una posizione equidistante rispetto ai due principali schieramenti, utilizzando toni critici prevalentemente nei confronti
dell’azione del governo in carica13. Le analisi proposte sono solitamente riconducibili a idee che potremmo definire, con un’espressione anglosassone, liberal.
Il periodo di riferimento
Per quanto riguarda l’arco temporale, abbiamo deciso di assumere come
periodo di riferimento gli ultimi quattro mesi del 2007.
Tale arco temporale è stato scelto principalmente perché corrispondente alle fasi di discussione e approvazione della Legge finanziaria per il 2008. Questo
periodo, infatti, oltre ad essere quello più ricco di articoli a carattere economico, è quello in cui maggiormente si concentrano gli articoli per così dire “politici”, di
informazione ed analisi dei provvedimenti economici proposti dal governo e adottati dal parlamento. In questa fase insomma i giornali pongono la loro attenzione soprattutto sulla politica economica del governo, sia quella già
implementata, sia, e soprattutto, quella programmata, essendo la Finanziaria un documento volto a stabilire le spese future. Inoltre, nel periodo preso in
considerazione, ferveva un acceso dibattito riguardante il cosiddetto protocollo di luglio, firmato tra le parti sociali e il governo il 23 luglio 2007 e sottoposto a
referendum, tra i lavoratori iscritti a Cgil, Cisl e Uil nel mese di ottobre.
13 L’ambizione della Voce.info, come espressa nell’introduzione del sito, è quella di “essere
Il corpus di riferimento
Il corpus su cui è stata effettuata la ricerca è costituito da 5.556 articoli, di cui
830 del Giornale, 577 del Manifesto, 124 del Mondo, 1.999 del Sole 24 Ore, 1.987 della Repubblica e 41 della Voce.info. Sono stati selezionati gli articoli che
affrontano i temi del lavoro e del welfare, intesi in maniera estensiva. Abbiamo, in altri termini, preso in considerazione sia gli articoli descrittivi che quelli di analisi, includendo anche quelli relativi al dibattito politico, oltre che economico, sulle
politiche proposte in relazione a questi temi.
Per il Giornale e la Repubblica la raccolta dei dati è stata fatta con l’utilizzo
della banca dati on line Factiva, cui l’Ateneo pisano è abbonato. Factiva è dotata di un sistema di ricerca per data, per pubblicazione, per argomento e per parole
chiave. Gli articoli di questi due quotidiani sono una parte, selezionata dopo una rapida lettura, di quelli archiviati dalla banca dati utilizzando le seguenti
parole-chiave: lavor*, salar*, impieg*, operai*, manodopera, stipendi*, mensilità, produttiv*, scioper*, sindaca*, dipendent*, cuneo, tfr, pension*, assumere, assun*, licenzi*, precar*, flessibil*, sommers*, nero, disoccupa*, occupa*, welfare.
Per quanto riguarda il Manifesto, non essendo esso incluso nella banca dati di Factiva, si è fatto ricorso all’archivio elettronico consultabile nell’area del sito
internet del giornale riservata agli abbonati on line. In questo archivio, ogni articolo è preceduto da alcune parole che ne individuano l’argomento. Abbiamo quindi raccolto quasi tutti gli articoli (ne è stata scartata solo una minima parte rientrata
nella selezione per errore) che, nel testo o come argomento, contengono le parole-chiave sopra riportate.
Gli articoli del Sole 24 Ore sono stati raccolti tramite una banca dati on line disponibile presso i computer dell’Ateneo pisano. Gli articoli scelti sono il frutto di
una selezione da quelli archiviati dalla banca dati sotto gli argomenti “Lavoro e formazione” e “Imprese - macroeconomia e congiuntura”.
Gli archivi del Mondo e della Voce.info, infine, sono liberamente e
gratuitamente consultabili sui rispettivi siti web. Il minor numero di articoli, in questo caso, ha reso non necessario l’utilizzo di filtri nelle banche dati.
2.2 Ipotesi generali e struttura del lavoro
L’ipotesi centrale da cui parte questo lavoro è che i sei giornali affrontino in maniera diversa l’informazione economica. Ciò non significa semplicemente che gli editoriali di commento e analisi delle notizie assumano posizioni differenti a
seconda del giornale, cosa abbastanza scontata. Si presuppone piuttosto che nella stessa presentazione delle notizie, in cui si individuano molte meno divergenze
formali tra testate, vi siano differenze rilevanti dipendenti dalla visione politica di chi scrive. Riteniamo inoltre che queste differenze, volontarie o involontarie che siano, e almeno in parte individuabili già intuitivamente dal comune lettore, siano
“catturabili” con gli strumenti dell’analisi quantitativa del discorso.
Struttura del lavoro
Sulla base della nostra conoscenza dei sei giornali studiati, e tenendo conto
delle potenzialità offerte dal programma TalTac2, di cui abbiamo parlato in
precedenza, svolgeremo tre tipi di analisi del linguaggio, con un grado progressivo di approfondimento:
- Un primo tipo di analisi è incentrato sul tipo di linguaggio utilizzato. Si tratta in sostanza di misurare la prevalenza di termini comuni oppure di termini ricercati o specialistici. In questo caso, ci aspettiamo di osservare che il Giornale, il
Manifesto e la Repubblica, quotidiani generalisti, abbiano un linguaggio più “comune” rispetto al Mondo, al Sole 24 Ore e alla Voce.info, giornali
lessico tra giornali appartenenti alla stessa categoria, anche se si può forse supporre
che il Mondo abbia un taglio meno specialistico, con meno termini tecnici, rispetto agli altri due giornali economici. Oltre che con la debolezza di queste supposizioni,
inoltre, occorre confrontarsi con la parziale inadeguatezza, di cui parleremo in
seguito, dei mezzi forniti da TalTac2 per valutare quanto il linguaggio di un testo
possa essere definito “comune”.
- Un secondo tipo di analisi può riguardare gli argomenti trattati e i termini
utilizzati. Il software TalTac2, naturalmente, analizza solo le singole forme grafiche o
i singoli lemmi; l’analisi dei nomi propri più frequenti e di alcune altre forme grafiche chiave servirà per osservare gli argomenti più trattati, mentre l’analisi dei
nomi comuni e di altre forme grafiche ci consentirà di effettuare interessanti osservazioni sulle espressioni, di forma e soprattutto di sostanza, più “care” ai vari
giornali. Dal punto di vista degli argomenti, ci attendiamo che il Manifesto affronti con particolare frequenza le notizie relative allo scontro politico e alle vicende sindacali e più in generale alle condizioni dei lavoratori. Possiamo poi ipotizzare
che la Repubblica non privilegi particolarmente alcun argomento specifico, concentrandosi forse maggiormente sull’approvazione della manovra finanziaria,
che pure dovrebbe essere, presumibilmente, il tema più ricorrente su tutte e sei le testate. Per quanto riguarda il Giornale, si può forse supporre che esso affronti
frequentemente temi legati alle piccole e medie imprese, con una particolare attenzione alla tassazione dei fattori produttivi. È difficile ipotizzare differenze tra i tre giornali economici, accomunati probabilmente dall’attenzione a temi più tecnici.
Si può tuttavia supporre che il Sole 24 Ore, per ragioni anche di proprietà, e forse il Mondo, dedichino più spazio ai temi relativi al mondo imprenditoriale rispetto alla
Voce.info.
- Un terzo tipo di analisi, più complesso, riguarda il modo in cui i sei giornali
affrontano gli argomenti trattati, derivante dai presupposti di teoria economica, o in ogni caso corrispondente all’orientamento o al messaggio politico che il giornale
luogo, osservare la ricorrenza di determinate forme grafiche, sia aggettivi che
sostantivi, che riteniamo indicativi di un certo orientamento; in secondo luogo, è possibile, tramite l’analisi delle corrispondenze, fornire una rappresentazione
grafica, in uno spazio a due o più dimensioni, della distribuzione dei lemmi, a seconda della frequenza con la quale essi ricorrono sulla stessa testata; l’analisi delle
corrispondenze, inoltre, viene svolta sull’intero corpus, e questo consentirà confronti più immediati tra i sei giornali; infine, possiamo utilizzare un dizionario degli
aggettivi positivi e negativi fornito dal software TalTac2 per osservare quali testate
tendono a dare più di frequente giudizi di merito e se essi vedono gli eventi economici da essi riportati con favore o con contrarietà. Tramite questo tipo di
analisi, inoltre, è possibile valutare come varia nel tempo l’approccio dei differenti giornali rispetto alle notizie riguardanti i temi del welfare e del lavoro. Oltre ad
osservare i termini più utilizzati in ciascun periodo, infatti, valuteremo la maggiore o minore presenza di aggettivi positivi e negativi in momenti diversi. Se, nell’arco di pochi mesi, non ha molto significato parlare di mutamenti di fase economica, ci
avvarremo in ogni caso di dati macroeconomici scomposti per mese e terremo conto delle varie fasi politiche, ben più rapidamente mutevoli di quelle economiche. La
nostra ipotesi generale, in questa parte del lavoro, è che i giornali si pongano in linea con l’orientamento politico tendenziale, e necessariamente semplificato,
descritto nell’introduzione. Il Manifesto dovrebbe assumere un atteggiamento negativo nei confronti delle imprese e favorevole nei confronti dei sindacati e dei lavoratori; una posizione critica dovrebbe poi essere assunta non tanto nei confronti
del governo, quanto della manovra finanziaria da esso varata. Il Giornale dovrebbe porsi in maniera speculare rispetto al Manifesto in rapporto agli attori del mondo
del lavoro (per semplificare, dalla parte delle imprese); rispetto al governo e alla finanziaria, invece, l’atteggiamento dovrebbe essere di netta opposizione. La Repubblica, infine, dovrebbe avere un approccio più distaccato e istituzionale
rispetto alle notizie sui temi del welfare e del lavoro, caratteristica comune ai tre giornali economici; ci si attende, tuttavia, che essa guardi con un certo favore al
governo e soprattutto alla manovra finanziaria. Il Mondo, il Sole 24 Ore e la
Voce.info, oltre che dall’approccio formalmente più tecnico e imparziale, dovrebbero essere accomunati dalla condivisione delle esigenze di risanamento
finanziario manifestate dal governo. Inoltre, come detto prima, possiamo supporre che il Mondo e soprattutto il Sole 24 Ore tengano un atteggiamento di sostegno alle
esigenze delle imprese. A queste ipotesi generali, naturalmente, ne affiancheremo nel corso del lavoro altre più dettagliate. In particolare, dedicheremo un approfondimento maggiore all’approccio dei vari giornali nei confronti di due temi
specifici: da un lato gli articoli riguardanti la dinamica salariale e dall’altro gli articoli riguardanti il tema della riforma delle pensioni. Entrambi gli argomenti
saranno intesi in senso lato, in modo da avere un elevato numero di articoli da analizzare per ciascuna testata. Per questa parte del lavoro, infatti, estrarremo dei sub-corpora contenenti esclusivamente gli articoli riguardanti questi due specifici
temi.
- Nelle conclusioni cercheremo di valutare i risultati del nostro lavoro alla
luce di alcuni modelli, presenti nella letteratura economica e sociologica, sul mercato dei giornali, sulla sua influenza sulla linea editoriale degli stessi e sul
rapporto tra i media e le politiche pubbliche, con particolare riguardo a quelle sui temi del lavoro e del welfare.
3
IL TRATTAMENTO PRELIMINARE
DEL TESTO
Prima di presentare le analisi e i risultati del nostro lavoro, descriviamo qui
rapidamente le operazioni svolte con il software TalTac2 in maniera preliminare
rispetto all’analisi vera e propria.
In primo luogo, occorre normalizzare il testo. Questa operazione è finalizzata ad una prima omogeneizzazione di tutte le forme grafiche equivalenti. Vengono quindi ridotte tutte le lettere maiuscole collocate all’inizio di parole precedute da un
punto, da un punto interrogativo o da un punto esclamativo, con l’eccezione dei
nomi propri riconosciuti da TalTac2. Vengono inoltre omogeneizzate le forme
grafiche riconducibili a nomi propri presenti in liste, dette appunto di normalizzazione, di cui è dotato il software. Questa operazione è stata effettuata per
il corpus generale e per i sei corpora dei singoli giornali.
L’operazione successiva consiste nella lessicalizzazione. Dopo la
normalizzazione, con un apposito comando di TalTac2 abbiamo proceduto ad individuare i segmenti rilevanti, ovvero quelle sequenze di almeno due parole che ricorrono più volte nel corpus. A partire dalla lista dei segmenti, abbiamo costruito
una lista di lessicalizzazione, formata da 1.111 segmenti che ci sembravano dotati di un significato indipendente dalle parole che compongono i segmenti stessi. Questi
1.111 segmenti sono stati quindi aggiunti ai corpora, andando a costituire delle
nuove forme grafiche. TalTac2, inoltre, procede a sottrarre, per le forme grafiche
presenti all’interno di segmenti, dal totale delle occorrenze le occorrenze interne ai segmenti. Per fare un esempio, se il segmento mani nelle tasche ricorre 10 volte nel testo, le occorrenze totali delle forme grafiche mani, nelle e tasche risulteranno
inferiori di 10 unità rispetto alla situazione precedente alla lessicalizzazione. I segmenti rilevanti sono stati individuati sull’intero corpus, in modo da avere una
unica vasta lista di lessicalizzazione, che è stata poi inserita nei sei corpora dei
giornali.
In seguito, si è provveduto a calcolare le sub-occorrenze per le variabili data e
giornale. In questa maniera si ottiene per ogni forma grafica, a fianco delle occorrenze totali, la scomposizione delle occorrenze per ogni giornale e per ogni
giorno. Questa operazione è stata effettuata per l’intero corpus e per i sei corpora dei giornali, anche se nel secondo caso è stata considerata, per evidenti ragioni, solo la variabile data.
L’operazione successiva è quella del tagging grammaticale. Con questa
procedura, TalTac2 confronta il vocabolario del corpus con il dizionario predefinito
del software, costituito da circa 74.000 lemmi, pari a oltre 530.000 forme flesse. Tramite questo confronto è possibile etichettare grammaticalmente le forme grafiche
presenti nel vocabolario considerato. Ad ogni forma grafica riconosciuta dal software, infatti, viene associata la categoria grammaticale corrispondente, o le possibili categorie grammaticali, qualora si tratti di una forma ambigua (ad esempio
la forma grafica porto, che può essere un verbo o un sostantivo). Il risultato più rilevante di questa operazione14, tuttavia, è la generazione del lemma
corrispondente per ogni forma grafica. Sulla base dei lemmi, piuttosto che su quella delle forme grafiche, infatti, si svolgerà una parte consistente del nostro lavoro.
Qualora la forma sia ambigua, o non riconosciuta da TalTac2, nel campo “lemma”
viene semplicemente riportata la forma grafica. Il tagging grammaticale è stato effettuato sia sul corpus principale che sui corpora dei giornali.
Dopo il tagging grammaticale, abbiamo proceduto ad una ulteriore fase di “pulitura” del testo, volta da un lato ad una lemmatizzazione manuale, più
approfondita di quella effettuata dal software con il tagging grammaticale, e dall’altro alla correzione del maggior numero di errori di stampa possibile. In
particolare, abbiamo stabilito i lemmi relativi alle forme grafiche non riconosciute e
14 Le analisi che svolgeremo in questo lavoro non utilizzeranno le categorie grammaticali. Queste,
“disambiguato” i lemmi relativi alle forme grafiche ambigue. Abbiamo scelto di
svolgere questa operazione – svolta a livello manuale – per tutte le forme grafiche con più di 80 occorrenze nel corpus principale e per i 1.111 segmenti lessicalizzati,
che presentavano un gran numero di nomi propri15. Il risultato di questa operazione, che ha comportato 707 sostituzioni nel corpus principale, è stato salvato
in un piano di lavoro e riprodotto sui sei corpora dei giornali.
15 Ad esempio, i segmenti lessicalizzati Romano Prodi o premier Romano Prodi sono stati ricondotti al
lemma Prodi, e il segmento lessicalizzato Stati Uniti d’America, oltre alle forme grafiche Usa e USA, sono stati ricondotti al lemma Stati Uniti.
4
L’ANALISI “ESOGENA” DEI LESSICI
Il primo tipo di analisi che è possibile effettuare è volto ad osservare il tipo di
linguaggio utilizzato dai vari giornali. Per fare ciò effettueremo un’analisi “esogena” dei linguaggi, ovvero che si basa su liste o lessici di frequenza esterni al
corpus studiato.
4.1 Il confronto con il linguaggio comune
Valuteremo ora, per ciascun giornale, l’incidenza di termini comuni e quella
di termini ricercati, in modo da avere un’idea di quali testate abbiano un linguaggio più elevato.
La nostra ipotesi dovrebbe essere che i tre giornali economici e in particolare
il Mondo e la Voce.info, abbiano un linguaggio più ricercato. I quotidiani generalisti, viceversa, dovrebbero utilizzare un registro più colloquiale e non
dovrebbero presentare grosse differenze tra loro.
Il software TalTac2, per questo tipo di analisi, mette a disposizione diversi
dizionari di riferimento, da utilizzare come confronto con il corpus studiato. Il dizionario più indicato per questo tipo di studio è quello denominato “Linguaggio comune”, elaborato da Bolasco e Canzonetti16, comprendente tutte le forme con un
uso maggiore di 50 presenti in tutte le edizioni di Repubblica dal 1990 al 1999. Come si comprende, questo vocabolario non è esente da controindicazioni, derivanti da
due ordini di ragioni. Da un lato, il vocabolario di riferimento è tratto da uno dei quotidiani oggetto di analisi, seppur in relazione ad un periodo precedente di alcuni
anni. Dall’altro, questo vocabolario riproduce un linguaggio giornalistico che,
seppur relativo ad una testata di carattere generalistico, si colloca ad un livello
superiore a quello del linguaggio comune. Occorre tuttavia notare, a difesa della scelta di questo vocabolario, che esso è particolarmente numeroso (60.489 forme
grafiche e oltre 250 milioni di occorrenze) e che comprende tutte le sezioni del giornale, tra le quali quelle economiche e politiche, dalle quali sono stati tratti in
prevalenza gli articoli selezionati, sono senza dubbio tra quelle più specifiche17.
Tab. 4.1: Copertura dei tre dizionari del linguaggio comune rispetto ai corpora dei sei giornali Testata Linguaggio comune (forme grafiche) Linguaggio comune (occorrenze) Italiano standard (forme grafiche) Italiano standard (occorrenze) Italiano parlato (lemmi) Italiano parlato (occorrenze) Manifesto 71,62% 86,64% 59,77% 84,47% 48,61% 85,31% Sole 24 Ore 64,65% 85,06% 52,14% 83,18% 42,36% 83,32% Giornale 72,52% 86,00% 61,12% 83,71% 49,94% 84,46% Repubblica 64,80% 85,31% 51,51% 83,26% 42,45% 84,19% Mondo 69,18% 85,02% 60,34% 82,09% 52,56% 83,82% Voce.info 74,84% 87,13% 69,36% 85,37% 59,61% 84,06%
Da questa analisi emerge che il 64,65% delle forme grafiche presenti nel Sole 24 Ore e il 64,80% di quelle della Repubblica fanno parte del “linguaggio comune”.
Questa percentuale è invece superiore al 69% per tutte le altre testate. A prima vista, dunque, sembrerebbe che, paradossalmente, i due giornali più diffusi siano quelli
17 Un’altra peculiarità, in una certa misura limitante, di questo dizionario è che esso non contiene
nomi propri. Sono tuttavia presenti molti aggettivi da essi derivati. A titolo di esempio, mancano i sostantivi Berlusconi e Pisa, ma sono presenti gli aggettivi pisano e berluconiano, e persino il sostantivo berlusconismo.
con il registro nettamente più elevato. Questa dicotomia, tuttavia, è a nostro avviso
apparente, e dovuta al fatto che i corpora del Sole 24 Ore e la Repubblica, per via della loro grande dimensione, contengono un numero di forme grafiche di gran
lunga superiore a quello degli altri giornali. Si può di conseguenza supporre che, all’aumentare delle forme grafiche, sia più frequente trovare singole forme grafiche
poco frequenti, sia nella lingua italiana che nei corpora considerati, e pertanto assenti nel dizionario di riferimento. Queste nostre considerazioni sembrerebbero essere confermate se spostiamo l’attenzione dalle forme grafiche presenti al numero di
occorrenze totali, più indicativo dell’effettivo registro usato da un giornale. In questo caso, infatti, notiamo che le differenze tra i giornali si appiattiscono quasi
totalmente, oscillando i valori tra l’85,02% del Mondo e l’87,13% della Voce.info. La nostra supposizione, infatti, è che le parole “strane”, nei grandi corpora del Sole 24 Ore e della Repubblica, siano numerose, ma che la frequenza di ognuna di esse sia
relativamente bassa, con la conseguenza di risultare “diluita” qualora si considerino le occorrenze totali.
A tal proposito, è interessante anche effettuare delle misure lessicometriche, che danno informazioni sulla cosiddetta ricchezza lessicale dei testi analizzati. In
particolare, è utile osservare la percentuale di hapax18 (forme grafiche che ricorrono soltanto una volta nell’intero corpus) nei vari giornali e l’indicatore della ricchezza lessicale fornito dalla formula (V/N)*100, dove V è il numero di forme grafiche e N è
il numero delle occorrenze.
Tab. 4.2: Misure lessicometriche
Testata Hapax Ricchezza lessicale
(Forme grafiche / occorrenze) * 100
Manifesto 47,47% 9,73% Sole 24 Ore 41,86% 5,22% Giornale 47,91% 10,87% Repubblica 45,87% 6,61% Mondo 53,37% 17,17% Voce.info 54,21% 20,26% Intero corpus 43,65% 3,66%
Possiamo notare che il numero di hapax è abbastanza variabile, e compreso tra il 41,86% del Sole 24 Ore e il 54,21% della Voce.info. Anche per quanto riguarda
il secondo indicatore della ricchezza lessicale la variabilità è elevata, e il corpus del Sole 24 Ore ha il rapporto tra forme grafiche e occorrenze minore (5,22%) e quello della Voce.info ha il rapporto maggiore (20,26%). Questi risultati sembrano indicare,
in maniera peraltro plausibile, che la ricchezza lessicale sia maggiore per i due periodici di approfondimento e minore per i due quotidiani con massima tiratura.
Tuttavia, dobbiamo anche supporre che la variabilità del primo indicatore, e soprattutto del secondo, siano in parte dovuta alle differenze tra le dimensioni dei
corpora. In altri termini, per i corpora di maggiori dimensioni, l’elevato valore del denominatore tende a ridurre il valore dell’indice. A conferma di ciò, possiamo
anche notare che l’indice relativo alla ricchezza lessicale dell’intero corpus (3,66%) è inferiore a quelli di ogni sub-corpus19.
19 Per nessuno dei due indici, naturalmente, il valore relativo all’intero corpus rappresenta la media
ponderata dei valori dei singoli giornali. Per intenderci, una forma che ricorre solo una volta in ciascun giornale sarebbe catalogata come hapax in tutti e sei i sub-corpora, ma non in quello
In definitiva, ci pare che la quota di forme grafiche “coperte” (cioè presenti in
entrambi i corpora) dal dizionario di riferimento – in particolare con riguardo alle occorrenze totali – sia grosso modo simile per tutti e sei i giornali. Dobbiamo poi,
più in generale, precisare come sia difficile dire precisamente se la bassa “copertura”20 di questo dizionario21, indicativa di un linguaggio generalmente non
“comune”, sia da declinare prevalentemente nel senso di un lessico specialistico o in quello di un lessico forbito.
Dobbiamo inoltre per completezza aggiungere che in queste analisi, come
nelle successive, la nostra ipotesi è che la frequenza degli errori di stampa, anche al netto della nostra parziale correzione effettuata in sede di lemmatizzazione, sia
grosso modo uguale per tutte e sei le testate. Questa ipotesi, tuttavia, verosimilmente non è del tutto realistica, e la diversa frequenza di errori di stampa potrebbe in parte influenzare i risultati delle nostre analisi. In ogni caso, con
l’osservazione delle occorrenze totali, che come detto prima ci pare maggiormente indicativa del registro complessivo dei giornali studiati, l’influenza della frequenza
degli errori di stampa sui risultati ottenuti viene pressoché totalmente annullata.
Il confronto con l’”Italiano standard”
Un’analisi analoga è stata effettuata con un altro dizionario, elaborato da
Bolasco e Morrone nel 1998 e messo a disposizione dal software TalTac2, definito
“Italiano standard”. Questo dizionario è stato elaborato a partire da tutte le forme grafiche presenti almeno una volta in un campione di fonti di varia natura, di italiano scritto e parlato, formale ed informale, etc22. I risultati sono abbastanza
principale. Similmente, una forma presente n volte in un corpus e m volte in un altro, verrà considerata come n + m al denominatore (occorrenze), ma solo una volta al numeratore (forme grafiche).
20 Intendiamo qui per “copertura” la percentuale di forme grafiche del corpus in esame che sono
presenti anche nel vocabolario di riferimento.
21 Questo limite riguarda anche i due dizionari che utilizzeremo in seguito in questo capitolo. 22 Questo dizionario è stato presentato in Bolasco e Morrone (1998).
simili a quelli ottenuti con il vocabolario “linguaggio comune”, sia in termini di
forme grafiche che di occorrenze totali, con delle differenze tra quotidiano e quotidiano solo lievemente più marcate.
Poiché i due dizionari usati come riferimento per valutare il registro del linguaggio delle varie testate presentano alcuni limiti, che abbiamo visto prima,
abbiamo scelto di effettuare lo stesso tipo di analisi con un terzo tipo di vocabolario, di natura differente dai due precedenti. La lista è composta da 15478 lemmi, facenti parte del “Linguaggio dell’italiano parlato” (LIP), un enorme dizionario redatto da
una équipe di italianisti diretta da Tullio De Mauro all’inizio degli anni ’9023. In
questo caso il dizionario non è fornito da TalTac2, ma è messo a disposizione dal sito
internet dell’Università di Graz. Abbiamo deciso di utilizzare questo dizionario perché ci pare possa fornire una idea approssimativa, da un’angolatura differente
rispetto ai due vocabolari precedentemente utilizzati, del linguaggio dell’italiano comune. In questo caso, inoltre, l’analisi si svolge sulla base dei lemmi e non delle forme grafiche, a differenza delle due analisi precedenti.
23 Il corpus del Lessico di frequenza dell'italiano parlato (Corpus LIP) è la raccolta di testi dell'italiano
parlato più importante e più utilizzata nella ricerca linguistica. Fu costituito nel 1990-1992 da un gruppo di linguisti diretto da Tullio De Mauro e servì per costruire, in collaborazione con la Fondazione IBM Italia, il primo lessico di frequenza dell'italiano parlato ad opera di De Mauro, Mancini, Vedovelli e Voghera nel 1993. I suoi 469 testi, contenenti complessivamente ca. 490.000 parole, furono raccolti in quattro città (Milano, Firenze, Roma e Napoli) e provengono da cinque macroclassi e numerose sottoclassi di discorso. Le cinque macroclassi sono:
A) scambio comunicativo bidirezionale con presa di parola libera faccia a faccia (es. conversazioni in casa);
B) scambio comunicativo bidirezionale con presa di parola libera non faccia a faccia (es. conversazioni telefoniche);
C) scambio comunicativo bidirezionale con presa di parola non libera faccia a faccia (es. assemblee legislative);
D) scambio comunicativo unidirezionale in presenza del destinatario o dei destinatari (es. lezioni di scuola o universitarie);
E) scambio comunicativo unidirezionale o bidirezionale a distanza o differito su testo non scritto (es. trasmissioni televisive).
Per ulteriori informazioni su questo dizionario, si vedano De Mauro et al. (1993) e il sito web http://languageserver.uni-graz.at/badip.
I risultati di questa analisi, osservabili nella riassuntiva tabella 2 (vedi sopra),
sono comunque abbastanza simili a quelli delle altre due. In termini di numero di lemmi, le differenze sono marcate e analoghe alle analisi precedenti: si oscilla tra il
42,36% del Sole 24 Ore e il 59,61% della Voce.info. In termini di occorrenze totali, invece, le differenze si assottigliano24: si passa infatti dall’83,32% delle occorrenze
del Sole 24 Ore all’85,31% di quelle del Manifesto. In questo caso, tuttavia, è possibile intravedere una differenza tra le testate generaliste e quelle economiche, nella direzione delle ipotesi formulate in precedenza. Nei corpora del Sole 24 Ore,
del Mondo e della Voce.info, infatti, si incontrano più raramente rispetto agli altri giornali lemmi appartenenti al dizionario dell’italiano parlato.
4.2 Il
confronto
con
un dizionario economico
Abbiamo in seguito svolto un’analisi simile a quelle appena viste, ma diretta
ad osservare la frequenza, negli articoli riguardanti i temi del welfare e del lavoro, di termini specificamente economici. Naturalmente, in questo caso, ci attendiamo
che essi siano più presenti sul Sole 24 Ore, sul Mondo e sulla Voce.info che sulle altre tre testate. Non formuliamo invece alcuna ipotesi su eventuali differenze
all’interno delle due classi di giornali.
Per effettuare questa analisi ci siamo serviti delle voci del dizionario
economico on-line disponibile sul sito dell’editore Simone. Le voci sono più di 3.000, e comprendono sia termini molto tecnici (assioma debole delle preferenze rivelate, saggio tecnico di sostituzione...), che termini comuni (banca, azione, debito
pubblico...). Abbiamo quindi comparato, in maniera analoga a quanto fatto prima,
24 Anche in questo caso rimandiamo a quanto detto prima a proposito dei problemi relativi alla
discrepanza tra i risultati ottenuti con l’analisi dei lemmi e quelli ottenuti con l’analisi delle occorrenze.
un dizionario costituito da queste voci con i lemmi dei sei corpora. Riportiamo in tab.
4.3 i risultati dell’analisi.
Tab. 4.3: Confronto con un dizionario economico
Testata Dizionario economico (forme grafiche) Dizionario economico (occorrenze) Manifesto 2,05% 3,87% Repubblica 1,51% 3,01% Sole 24 Ore 2,04% 3,98% Giornale 2,05% 3,18% Mondo 3,17% 4,15% Voce.info 4,07% 4,75%
Dall’osservazione delle forme grafiche, e ancor più da quella delle
occorrenze, otteniamo una evidente conferma di quanto supposto: la Voce.info è il giornale sul quale sono presenti più termini economici (4,75%)25, seguita dal Mondo
e dal Sole 24 Ore. Non si verifica tuttavia la netta divisione in due categorie che avevamo ipotizzato. Da un lato, infatti, la Voce.info presenta dei valori molto superiori a quelli di tutti gli altri giornali, e dall’altro il Manifesto presenta un
25 Il valore particolarmente basso in termini assoluti di questo indice non deve stupire. Esso è infatti
creato a partire da un vocabolario di dimensioni relativamente piccole (3314 lemmi) e non comprendenti le parole “neutre” più utilizzate nella lingua italiana. Gli indici ottenuti con analisi analoghe, in precedenza, avevano valori molto superiori perché erano calcolati su vocabolari costituiti da migliaia di forme grafiche, e comprendenti tutti i termini più utilizzati nella lingua italiana. In ogni caso, ciò che rileva ai fini di questa analisi sono solo le variazioni di questi indici da quotidiano a quotidiano.
utilizzo di termini economici quasi pari a quello del Sole 24 Ore e ben superiore a
quello della Repubblica e del Giornale.
4.3 Il confronto con il discorso programmatico di
governo
Abbiamo infine deciso di effettuare un’altra analisi, analoga a quelle precedenti, servendoci del vocabolario del “Lessico del discorso programmatico di
governo”, messo a disposizione dal software TalTac2.
Il lessico di questo dizionario è composto da circa 3.000 lemmi provenienti da
uno studio26 sulle dichiarazioni programmatiche dei Presidenti del Consiglio incaricati della Prima Repubblica in Italia dal 1948 al 1994. Questo vocabolario è piuttosto ampio e contiene, oltre a delle forme peculiari, tutte le forme grafiche più
utilizzate generalmente nella lingua italiana. Tuttavia, riteniamo che esso non sia sovrapponibile ai tre dizionari precedenti, che avevamo utilizzato come
approssimazione dell’italiano comune. In questo caso, infatti, sono presenti numerosi termini istituzionali e politici, seppur di uso frequente. Riportiamo i
risultati dell’analisi in tab. 4.4.
Tab. 4.4: Copertura dei sei corpora rispetto al Lessico del discorso programmatico di governo
Testata
Lessico del discorso programmatico di
governo (forme grafiche)
Lessico del discorso programmatico di governo (occorrenze) Manifesto 24,31% 66,81% Sole 24 Ore 21,51% 66,02% Giornale 24,95% 65,04% Repubblica 19,46% 64,58% Mondo 30,17% 65,10% Voce.info 41,89% 69,13%
Anche in questo caso, come nelle analisi precedenti, i valori del primo indice presentano una variabilità molto maggiore rispetto a quelli del secondo, che
oscillano tra il 64,58% della Repubblica e il 69,13% della Voce.info. Limitandoci al calcolo del numero di occorrenze totali, possiamo appunto notare che la Voce.info
offre una “copertura” del lessico del discorso programmatico di governo molto maggiore rispetto agli altri giornali, seguita dal Manifesto (66,81%).
Questi dati sembrerebbero quindi suggerire che la Voce.info, e in misura
minore il Manifesto, utilizzino un lessico più politicizzato rispetto alle altre quattro testate. Se il risultato del Manifesto era tutto sommato prevedibile, più interessante
è quello riguardante la Voce.info. In ogni caso, bisogna considerare che questa testata si caratterizza per un taglio molto tecnico (da cui probabilmente un elevato
numero di espressioni istituzionali) e per un approccio dichiaratamente propositivo in termini di politiche economiche.
In conclusione, ci pare di poter affermare che tra le sei testate non vi siano differenze sostanziali in termini di registro utilizzato nei rispettivi articoli riguardanti i temi del lavoro e del welfare. Tendenzialmente, i giornali economici
sembrano utilizzare un linguaggio più ricercato e un lessico più ricco rispetto a
quelli generalisti, ma la differenza sembra minima. Possiamo poi dire che il Sole 24 Ore, la Voce.info e il Mondo, e in misura leggermente minore il Manifesto, tendono
ad affrontare i temi del lavoro e del welfare da una prospettiva più economica. Infine, il Manifesto e soprattutto la Voce.info sono i giornali che utilizzano un
5 L’ANALISI “ENDOGENA” DEI LESSICI
Le operazioni di estrazione di informazione che svolgeremo in questocapitolo sono di tipo endogeno, ovvero sfruttano dati dei soli testi in analisi e non altre risorse esterne al corpus. È questa una differenza rilevante rispetto ad altre
analisi di tipo esogeno, quali quelle che abbiamo svolto nel capitolo precedente, che si basano su liste o lessici di frequenza esterni al corpus studiato.
5.1 I lemmi più utilizzati
Prima di affrontare analisi più complesse, è opportuno individuare le parole più utilizzate per avere un primo spaccato delle priorità dei giornali in termini di argomenti affrontati.
Sono stati quindi evidenziati i lemmi col maggior numero di occorrenze per ciascuna testata27: nella tabella 5.1 si riportano i 25 lemmi significativi28 più presenti
in ciascun giornale.
27 Occorre precisare che per le analisi che seguono la significatività dei dati relativi al Mondo e
soprattutto alla Voce.info è inferiore a quella degli altri giornali a causa del minore numero di articoli a disposizione
28 Abbiamo eliminato i lemmi di preposizioni, avverbi e congiunzioni da noi ritenuti irrilevanti e i
seguenti verbi (in quanto ausiliari o comunque di uso vastissimo e molto diversificato): essere, avere, potere, dovere, venire, fare, dire, stare.
Tab. 5.1: I 25 lemmi più presenti in ciascun giornale
Giornale Manifesto Mondo
Lemma occorrenze Lemma occorrenze Lemma occorrenze
anno 779 lavoratore 1190 azienda 375
governo 621 lavoro 1074 anno 281
sindacato 607 sindacato 916 milione 243
lavoro 585 anno 783 Italia 235
lavoratore 471 governo 764 gruppo 191
euro 408 Cgil 574 società 180
sciopero 387 sciopero 543 lavoro 166
dipendente 354 operaio 470 dipendente 143
azienda 351 azienda 467 mercato 143
Roma 351 ieri 452 impresa 142
Italia 346 accordo 450 italiano 142
ieri 338 politica 400 mila 140
chiedere 327 sinistra 396 2006 121
Milano 292 chiedere 391 oggi 118
contro 290 impresa 386 manager 114
arrivare 287 contratto 374 lavorare 111
spiegare 282 contro 372 banca 109
Cgil 277 Fiom 368 settore 105
milione 273 oggi 333 2007 102
oggi 272 sociale 326 presidente 93
presidente 268 lavorare 323 servizio 89
Alitalia 261 no 316 sistema 88
Finanziaria 259 salario 315 università 84
per cento 257 parlare 309 produzione 82
lavorare 248 protocollo 301 spiegare 81
Sole 24 Ore Repubblica Voce.info
Lemma occorrenze Lemma occorrenze Lemma occorrenze
lavoratore 2516 anno 2336 lavoro 116
anno 2491 lavoro 1996 per cento 113
lavoro 2397 lavoratore 1762 lavoratore 112
azienda 1863 sindacato 1736 anno 111
impresa 1572 azienda 1489 paese 95
sindacato 1447 operaio 1069 Italia 93
governo 1233 chiedere 1036 sistema 75
dipendente 1200 dipendente 1027 impresa 68
numero 1142 Cgil 1019 economico 68
contratto 1121 euro 1003 risultato 66
attività 1099 per cento 943 italiano 65
Italia 1088 lavorare 929 dati 64
euro 1083 governo 920 donna 63
2007 1045 oggi 901 riforma 61
previsto 1040 ieri 863 scuola 59
milione 1034 arrivare 841 azienda 56
servizio 913 sciopero 825 dipendente 55
articolo 909 spiegare 794 contratto 55
2006 902 accordo 791 produttività 54
regione 892 contratto 735 2007 54
spiegare 890 regione 716 misura 53
legge 888 problema 692 effetto 52
accordo 865 giorno 689 personale 51
presidente 860 Italia 683 parte 51
La tabella, volta a fornire una prima e approssimata fotografia dell’utilizzo
dei vari lemmi da parte dei giornali, evidenzia come i sei giornali siano accomunati dall’utilizzo assai frequente di alcune parole (impresa, azienda, lavoro, lavoratore,
sindacato, anno...), di carattere piuttosto generale e strettamente legate ai temi affrontati nel nostro studio.
Anche in questo caso, come in precedenza, possiamo individuare una differenza tra i quotidiani generalisti e i giornali economici. I primi utilizzano molto più spesso, rispetto ai secondi, termini riconducibili all’attualità politica (governo,
accordo, sciopero). Le testate specialistiche, compreso il Sole 24 Ore, che pure viene pubblicato con cadenza quotidiana, sembrerebbero inserire meno frequentemente
nei propri articoli riferimenti alle vicende e al dibattito politico.
Osservando poi i singoli giornali, si può notare che il Manifesto e il Giornale hanno molti lemmi in comune tra quelli più utilizzati: si tratta in prevalenza di
termini relativi agli scontri politici e sindacali (sciopero, contro, chiedere). Questa comunanza tra due quotidiani di orientamento politico opposto tuttavia non deve
sorprendere, in quanto in questa fase l’analisi è limitata agli argomenti trattati, e non affronta le modalità con cui i giornali trattino questi argomenti. La grande
presenza di termini “conflittuali”, inoltre, può essere imputata ai connotati di quotidiani di opposizione, attribuibili sia al Manifesto sia, soprattutto, al Giornale, nel periodo preso in considerazione.
Questi termini, d’altro canto, sono nel Manifesto affiancati da altri più strettamente legati alle dinamiche sindacali (oltre a sciopero, contro, chiedere, no,
troviamo lemmi più “conciliativi” quali accordo, contratto, parlare, protocollo); più che di toni di scontro si può quindi parlare forse per il Manifesto di toni propri delle
notizie relative alle vicende sindacali. Infine, il Manifesto utilizza di rado, rispetto agli altri giornali, il lemma dipendente, preferendo espressioni più specifiche quali lavoratore e operaio.
La Repubblica presenta caratteristiche abbastanza simili a quelle dei due quotidiani appena visti, con una prevalenza di termini relativi al mondo del lavoro
e sindacale. Ciò risulta tra l’altro in contrasto con quanto rilevato in un’altra ricerca
da noi condotta relativamente al periodo, di un anno precedente, tra il 1° ottobre e il 31 dicembre 200629. Se in quel lasso di tempo la Repubblica privilegiava termini
relativi al mondo finanziario e imprenditoriale, sembra che un anno dopo le notizie delle vicende sindacali siano molto più valorizzate30. Questo cambiamento, tra
l’altro, pare difficilmente attribuibile a mutamenti del contesto politico; i periodi presi in considerazione, infatti, fanno riferimento alla prima e alla seconda finanziaria del secondo governo Prodi31.
I giornali economici, come era prevedibile, sono caratterizzati da un maggior numero di termini specialistici e relativi all’illustrazione di dati (in questo senso
sono da considerare gli anni 2006 e 2007). Il Mondo, in particolare, sembra privilegiare i temi delle grandi imprese e della finanza (gruppo, società – da intendersi presumibilmente in senso finanziario – manager, banca), ed è l’unico
giornale a fare frequente riferimento alla realtà universitaria.
La Voce.info sembra confermare la propria inclinazione a commentare e
proporre policies economiche (sistema, risultato, effetto, riforma); questo giornale, inoltre, dedica particolare attenzione ai temi dell’occupazione femminile, come
testimoniato dall’utilizzo molto frequente del lemma donna. È interessante infine notare che la Voce.info, al pari del Mondo, menzioni solo raramente, negli articoli che affrontano i temi del welfare e del lavoro, le associazioni sindacali.
Il Sole 24 Ore, rispetto alle altre due testate economiche, presenta molti lemmi “da quotidiano” (governo, sindacato...). Tra i termini caratterizzanti, invece, troviamo
29 Ranucci (2008).
30 Nel lavoro precedente si faceva riferimento alla totalità degli articoli economici della Repubblica, e
non solo a quelli relativi ai temi del welfare e del lavoro. Le considerazioni che seguono restano in ogni caso valide.
31 Una parziale spiegazione di questo mutamento è a nostro avviso individuabile nell’ampio risalto,
dato non tanto da Repubblica quanto dalla totalità dei media nazionali, alle vicende relative alla discussione e al referendum tra i lavoratori per l’approvazione del protocollo sul welfare, firmato dal governo e dalle parti sociali il 23 luglio 2007.