• Non ci sono risultati.

I temi del lavoro e del welfare sulla stampa italiana Un'analisi del linguaggio di sei giornali nel periodo settembre-dicembre 2007

N/A
N/A
Protected

Academic year: 2021

Condividi "I temi del lavoro e del welfare sulla stampa italiana Un'analisi del linguaggio di sei giornali nel periodo settembre-dicembre 2007"

Copied!
110
0
0

Testo completo

(1)

AI MIEI GENITORI

(2)

INDICE

1

INTRODUZIONE

p. 3

1.1

L’analisi quantitativa del discorso

p. 4

1.2

Gli strumenti utilizzati

p. 8

2

I GIORNALI E I TEMI DEL LAVORO E DEL WELFARE

p. 10

2.1

I giornali e il periodo di riferimento

p. 10

2.2

Ipotesi generali e struttura del lavoro

p. 14

3

IL TRATTAMENTO PRELIMINARE DEL TESTO

p. 18

4

L’ANALISI “ESOGENA” DEI LESSICI

p. 21

4.1

Il confronto con il linguaggio comune

p. 21

4.2

Il confronto con un dizionario economico

p. 27

4.3

Il confronto con il discorso programmatico di governo

p. 29

5

L’ANALISI “ENDOGENA” DEI LESSICI

p. 32

5.1

I lemmi più utilizzati

p. 32

5.2

L’analisi delle specificità

p. 40

5.3

I sub-corpora “Salari” e “Pensioni”

p. 46

5.4

L’analisi delle concordanze

p. 51

6

L’UTILIZZO DEGLI AGGETTIVI

p. 57

(3)

6.2

L’utilizzo degli aggettivi nei sub-corpora “Salari” e “Pensioni” p. 61

6.3

L’utilizzo degli aggettivi nei vari mesi

p. 63

7

L’ANALISI DELLE CORRISPONDENZE

p. 73

8

CONCLUSIONI

p. 87

Glossario

p. 95

Bibliografia

p. 98

(4)

1

INTRODUZIONE

Obiettivo di questo lavoro è studiare come sei giornali – Il Giornale, Il

Manifesto, Il Mondo, La Repubblica, Il Sole 24 Ore, Lavoce.info1 – affrontano le notizie relative ai temi del lavoro e del welfare. Come strumento si utilizzano le tecniche

dell’analisi quantitativa del discorso, con gradi di approfondimento progressivamente maggiori, facendo ampio ricorso al software TalTac2. L’analisi si

svolge su un data base (detto corpus) di 5556 articoli pubblicati sui sei giornali nell’arco di tempo compreso tra i mesi di settembre e dicembre 2007.

Nell’introduzione si presentano, a grandi linee e in chiave storica, la

disciplina dell’analisi quantitativa del discorso e le tecniche utilizzate in questa ricerca; si presentano poi, nel secondo capitolo, le ipotesi e la struttura del lavoro.

La prima analisi che svolgiamo riguarda il linguaggio delle sei testate in generale: si valuta quali tra esse hanno un linguaggio più tecnico o più specialistico.

Nella fase successiva si osserva quali sono i termini più utilizzati, nell’intero corpus e negli articoli contenenti riferimenti ai temi dei salari e a quelli delle

pensioni (vengono a tal fine creati due sub-corpora), in modo da capire quali sono gli argomenti prioritari per ciascun giornale.

Si analizza poi come i sei giornali affrontano i temi del lavoro e del welfare,

sia nel senso della propensione a dare o a lasciare trasparire giudizi positivi e negativi, sia nel senso delle dimensioni concettuali di analisi da essi privilegiate. In entrambi i casi l’analisi è svolta sia sul corpus generale che sui sub-corpora “Salari” e

“Pensioni”. In questa parte ci si serve prima di un dizionario di aggettivi positivi e negativi e poi dell’analisi delle corrispondenze lessicali.

In generale, emerge che le differenze tra le testate generaliste (Il Giornale, Il Manifesto, La Repubblica) sono inferiori rispetto a quanto ci si potrebbe attendere.

1 Nel corso del nostro lavoro nomineremo questi giornali semplicemente come Giornale, Manifesto,

Mondo, Repubblica, Sole 24 Ore, Voce.info (senza il formato in corsivo e non necessariamente preceduti dall’ articolo).

(5)

In ogni caso Il Manifesto, conformemente alle nostre aspettative, dedica maggiore

spazio ai temi sindacali e adotta toni più critici rispetto agli altri due quotidiani. Più marcate sono invece le specificità dei tre giornali economici (Il Mondo, Il Sole 24

Ore, La Voce.info). Il Sole 24 Ore dedica maggiore spazio all’attualità politica, utilizza toni più critici ed è particolarmente attento alla realtà delle professioni, con

approfondimenti più spesso giuridici che economici. Il Mondo si concentra sul mondo della finanza e delle grandi imprese, e non affronta quasi mai i temi dei salari e delle pensioni. La Voce.info valorizza invece particolarmente questi due

temi, e presenta un grado di approfondimento economico maggiore rispetto agli altri due giornali.

Nelle conclusioni si cerca di valutare i risultati di questo lavoro alla luce di alcuni modelli – presenti nella letteratura economica e sociologica – che analizzano determinate caratteristiche del mercato dei giornali e la loro influenza sulla linea

editoriale dei giornali stessi. Effettueremo infine delle considerazioni sul rapporto tra i media e l’adozione e la percezione delle politiche pubbliche, con particolare

riguardo a quelle sui temi del lavoro e del welfare.

1.1 L’analisi quantitativa del discorso

L’analisi quantitativa in ambito linguistico è una disciplina giovane, che si è

sviluppata in anni recenti, in stretta interazione con l’evoluzione degli strumenti statistico-informatici. Questo tipo di analisi si rivolge a grandi moli di materiale testuale, e si contrappone ad approcci di ricerca qualitativi, caratterizzati da uno

scarso livello di standardizzazione degli strumenti di raccolta dei dati. L’esigenza principale, nell’avvalersi di tecniche statistiche per l’analisi testuale, è quella di

evitare interpretazioni suggestive e, soprattutto, di formulare procedure di analisi codificabili e ripetibili. L’esplorazione sistematica della struttura del testo, naturalmente, non impedisce di ritornare in ogni momento al testo originario per

(6)

arricchire le interpretazioni proposte. In questo senso, l’approccio

statistico-quantitativo non deve essere inteso come alternativo, ma come integrativo rispetto ad altri di tipo più qualitativo.

Questa disciplina nasce come branca della linguistica nel secondo dopoguerra2 e viene sviluppata negli anni ’60 e ’70 del secolo scorso, da studiosi

prevalentemente francesi, con la disciplina della analyse des donnés3. A questa logica di tipo linguistico, concentrata sullo studio delle proprietà della lingua, si affiancano, negli anni successivi, approcci di tipo lessicale, fondati sullo studio dei

lemmi4, e in seguito approcci di tipo lessico-testuale, che concentrano l’attenzione sull’analisi statistica delle forme grafiche, intese come unità di analisi elementari,

corrispondenti all’insieme di caratteri compresi tra due spazi. Questa disciplina, inoltre, tende a concentrarsi sulla comprensione del significato e del messaggio contenuti nei testi o nei linguaggi di riferimento, allontanandosi dagli aspetti di

pura teoria linguistica. Contestualmente a questo mutamento di obiettivo, vengono sviluppati, ad opera di Lebart e Salem5, i primi software per l’analisi dei dati

testuali, che consentono di elaborare in maniera automatica grandi moli di dati. Oggi, grazie a programmi informatici che consentono una rapida indicizzazione dei

corpora testuali, è possibile analizzare in modo sistematico e semi-automatico testi di dimensioni consistenti e difficilmente esplorabili in altro modo, attraverso l’attuazione di tutti i confronti possibili e l’individuazione delle dimensioni

fondamentali di senso presenti in un testo oggetto di studio.

2 Per questa parte di presentazione storica e metodologica della statistica linguistica si è fatto

riferimento prevalentemente a Bolasco (2005) e a Della Ratta-Rinaldi (2008).

3 Questa scuola francese, che faceva riferimento in particolare a Benzécri, sosteneva che la linguistica

dovesse seguire un metodo induttivo, ricavando le proprie regole da un corpus di testi, e si contrapponeva alla grammatica generativa di Chomsky, una teoria grammaticale completa ed organica che procede con metodo deduttivo, a partire da assiomi. Per un resoconto di questo dibattito, che non possiamo qui riportare, si rimanda tra gli altri a Bolasco (2004).

4 In linguistica si intende per lemma la forma rappresentativa di tutte le forme flesse che una unica

parola può presentare. Ad esempio, alle forme flesse bello, bella, belli, belle, corrisponde il lemma bello. A questa definizione faremo riferimento anche in seguito, nel nostro lavoro.

(7)

La scelta di concentrare l’analisi sulle forme grafiche, e non più per lemmi,

presenta il vantaggio di essere indipendente dalle regole della linguistica6. Seguendo un approccio definito formalista, si esaminano i segni – in questo caso i

significanti – per ottenere informazioni sul senso e sul contenuto del discorso – l’insieme di significati. Negli ultimi anni l’approccio formalista è stato integrato,

soprattutto ad opera di Bolasco7, rivolgendo l’attenzione ad unità di analisi di tipo misto, più flessibili, definite da questo autore forme testuali. Si considerano in sostanza non solo semplici forme grafiche, ma anche espressioni – definite

polirematiche – costituite da più parole, ma che abbiano un significato non composizionale, ossia diverso dalla somma dei significati elementari delle parole

componenti8. L’approccio che si concentra su queste unità minimali, “atomi di senso”, è definito lessico-testuale.

Uno dei problemi di fondo della statistica testuale è quello di effettuare degli

studi statistici su dati espressi in linguaggio naturale (dati testuali). Analisi di questo tipo, infatti, richiedono di associare ai dati – alle parole in questo caso – degli

indici statistici (frequenze assolute e relative, nel caso più semplice). La dimensione illimitata e sfuggente della lingua, tuttavia, rende difficile associare alle parole una

qualche frequenza in senso statistico-probabilistico. Da questo deriva l’esigenza, per ottenere dei linguaggi e delle frequenze di riferimento, di considerare le occorrenze delle parole in un testo o in una raccolta di testi di enormi dimensioni. Questi testi

sono considerati dei campioni del linguaggio di riferimento, e le frequenze sono delle stime dell’utilizzo dei vari termini nel lessico considerato, limitato solitamente

a specifici idiomi. In questa direzione, approcci quantitativi alla linguistica sono da molti anni seguiti da studiosi italiani. Fin dagli anni ’70, infatti, sono stati elaborati,

6 In questa disciplina non sempre le espressioni utilizzate hanno una definizione univoca. Pertanto,

per fini di chiarezza, le definizioni dei termini tecnici che utilizzeremo in seguito sono riportate nel glossario.

7 Per un ampio panorama di questa disciplina rimandiamo a Bolasco (2004). Tale approccio è stato

anche utilizzato, in uno studio specificamente rivolto al mondo dell’informazione, in Censis (2005).

8 La polirematica cuneo fiscale, ad esempio, ha un significato autonomo, che non corrisponde alla

(8)

ad opera di linguisti come De Mauro, Zampolli e Bortolini9, lessici di frequenza

d’uso delle parole a livello di lemmi. Come vedremo in seguito, per i fini del nostro lavoro ci siamo serviti di alcuni vocabolari messi a disposizione dal software

TalTac2, mentre altri, più semplici, sono stati da noi creati appositamente.

Una procedura per l’analisi automatica del testo

Come detto, l’analisi di un corpus con gli strumenti della statistica testuale consente, e presuppone, un elevato livello di automatizzazione delle procedure di analisi. Bolasco, delineando una “filiera”10, individua quattro fasi: la preparazione

del testo, l’analisi lessicale, l’estrazione di informazione e l’analisi testuale.

La prima fase consiste nella pulitura e normalizzazione del testo. In sostanza,

si tratta di eliminare i separatori (es. segni di interpunzione) e i caratteri ritenuti irrilevanti, e di riconoscere e uniformare, dove possibile, occorrenze discordanti

della stessa parola.

La seconda fase, l’analisi lessicale, studia il vocabolario del corpus di riferimento ed è volta a fornire una rappresentazione paradigmatica o verticale11 del

testo in esame. Può essere definita un’analisi di tipo verticale, in quanto le parole sono estratte come da un’urna, senza tenere conto dello sviluppo del discorso.

L’attenzione si può concentrare sia sulle parole “piene” (di contenuto), sia sulle parole “vuote” (connettivi, preposizioni, congiunzioni, determinanti, interiezioni).

In entrambi i casi, è possibile valutare statisticamente le costanti del linguaggio che differenziano, o accomunano, il corpus in esame con un corpus di riferimento.

9 Il primo lavoro italiano in questa direzione è Bortolini et al. (1972).

10 Bolasco (2005), pp. 8 e seguenti. Non si tratta tuttavia di una “proceduralizzazione” rigida né

generalmente riconosciuta. A titolo di esempio, in Della Ratta-Rinaldi (2008) ne è riportata una differente, in otto passaggi. Ciò che rileva è l’esigenza di automatizzare l’analisi, dividendola in procedure codificate.

11 Bolasco (2005), pp. 12 e seguenti. Un’analisi si dice paradigmatica o verticale quando è volta allo

studio delle singole parole e di quelle che possono essere ad esse sostituite senza modificare il senso del sintagma. Un’analisi si dice sintagmatica o orizzontale quando, a partire da una singola parola, studia le altre parole che la circondano.

(9)

La terza fase, l’estrazione di informazione, si concentra sulla parte del

linguaggio che risulta particolarmente significativa all’interno del testo in analisi. Si seleziona quindi il cosiddetto linguaggio peculiare del corpus, concentrando l’analisi

solo su di esso.

La quarta fase, l’analisi testuale, cerca di fornire una rappresentazione

sintagmatica o orizzontale – e non, come in precedenza, paradigmatica o verticale – del testo. Le operazioni non sono rivolte alle singole parole, come nell’analisi lessicale, ma direttamente al corpus. In questa fase si osserva in sostanza il modo in

cui interagiscono le parole, calcolando ad esempio le co-occorrenze di un gruppo di parole o le sequenze di parole che precedono o succedono a parole pivot.

1.2 Gli strumenti utilizzati

Fin dagli anni ’80 sono stati elaborati numerosi software per l’analisi

quantitativa del discorso. Per il nostro lavoro, abbiamo utilizzato TalTac2, il

programma più noto ed utilizzato in lingua italiana, nella sua versione più recente

(luglio 2008). TalTac2, acronimo di Trattamento Automatico Lessicale e Testuale per

l’Analisi del Contenuto, è stato elaborato, nel corso degli anni ’90, da Francesco

Baiocchi, Sergio Bolasco e Adolfo Morrone. Si tratta, come detto, di un software per l’analisi automatica del testo nella duplice logica di Text Analysis e Text Mining12,

utilizzando risorse di tipo sia linguistico che statistico. Tale analisi consente di dare delle rappresentazioni del fenomeno studiato su base quantitativa sia a livello di

unità di testo (parole) sia a livello di unità di contesto (frammenti/documenti), quindi come linguaggio utilizzato e come contenuti trattati nel testo. Per l'approccio

12 Per text mining si intende l’analisi di dati caratterizzati dal fatto di essere testi in lingua naturale.

L’obiettivo è, come visto prima, quello di estrarre l’informazione implicita contenuta in un insieme di documenti.

(10)

seguito questo è possibile senza leggere materialmente la collezione di testi e quindi

indipendentemente dalla dimensione del corpus, che può essere vastissima, come nel caso del nostro lavoro, basato su un corpus di quasi quattro milioni di parole. In

generale, l'analisi svolta in TalTac2 permette di selezionare ed estrarre

l’informazione più significativa dal corpus di testi analizzato (linguaggio peculiare, linguaggio rilevante, linguaggio specifico) e di operare secondo i principi del text

mining mediante ricerche per parole chiave o per concetti. Questo software, inoltre, mette a disposizione alcuni dizionari tematici, con i quali è possibile confrontare il

corpus oggetto di studio.

Nella seconda parte del lavoro si fa ricorso anche al programma di

(11)

2

I GIORNALI E I TEMI DEL LAVORO E

DEL WELFARE

2.1 I giornali e il periodo di riferimento

I giornali scelti per la nostra ricerca, come detto, sono il Giornale, il Manifesto, il Mondo, la Repubblica, il Sole 24 Ore e la Voce.info. La scelta di queste

sei testate è volta ad offrire un quadro da un lato, per quanto possibile, rappresentativo dell’intero panorama editoriale italiano, dall’altro adatto a mettere

in luce delle specificità interessanti. Sono infatti presenti giornali quotidiani (Giornale, Manifesto, Repubblica, Sole 24 Ore) e un settimanale (Mondo), generalisti (Giornale, Manifesto, Repubblica) ed economici (Mondo, Sole 24 Ore, Voce.info). La

Voce.info, inoltre, presenta la peculiarità di essere pubblicata esclusivamente on line, con articoli pubblicati senza una cadenza prestabilita.

Il Manifesto è un quotidiano apertamente schierato a sinistra, di media tiratura, che ha tenuto una posizione critica, anche se non avversa, nei confronti del

secondo governo Prodi. L’esplicito orientamento politico, unitamente alle ridotte dimensioni del giornale (circa venti pagine), fanno sì che il numero degli articoli economici sia inferiore a quello degli altri quotidiani e che essi affrontino

prevalentemente gli argomenti di interesse del Manifesto. Limitando la selezione agli articoli relativi al lavoro e al welfare, la differenza con gli altri quotidiani, in

termini di numero di articoli, si riduce in virtù della buona “esposizione” di questi temi sul Manifesto.

La Repubblica è, assieme al Corriere della Sera, il quotidiano con la maggiore

diffusione in Italia. Pur non essendo legato a nessun partito, è solitamente identificato come un quotidiano di centro-sinistra. Le sue dimensioni sono molto

grandi, superando generalmente – se si considerano le sezioni locali (Roma, Torino, Genova, Milano, Bologna, Firenze, Napoli, Bari, Palermo) – le cento pagine. Vi sono

(12)

riportate un gran numero di notizie, e si può dire che il quotidiano, pur avendo la

redazione principale a Roma, non abbia alcuna connotazione geografica e abbia anzi un respiro nazionale maggiore rispetto al Corriere della Sera.

Il Giornale è un quotidiano ad alta tiratura, la cui redazione principale è a Milano. Pur vendendo la gran parte delle proprie copie nelle regioni dell’Italia

settentrionale, può essere considerato il principale quotidiano nazionale di centrodestra. La proprietà del Giornale è della famiglia di Silvio Berlusconi, e durante i due anni del secondo governo Prodi questa testata ha tenuto una linea di

costante critica nei confronti delle politiche messe in atto dall’Unione. La posizione del Giornale nelle materie economiche non sembra univoca, tuttavia quella sui temi

del lavoro e del welfare può essere definita, a prima vista, liberal-conservatrice. Il Sole 24 Ore è il principale quotidiano economico italiano, con una diffusione media di circa 400.000 copie. La redazione principale è a Milano e buona

parte delle sue copie sono vendute nell’Italia settentrionale, ma il respiro di questo giornale è senza dubbio nazionale. All’edizione nazionale si affiancano diverse

edizioni locali (vi sono redazioni a Roma, Torino, Padova, Trieste, Bologna, Genova, Firenze, Bari, Napoli, Palermo). Il Sole 24 Ore è interamente di proprietà di

Confindustria e la sua linea politica ed economica è tradizionalmente liberale, con una posizione negli ultimi anni tendenzialmente imparziale nei confronti dei due principali schieramenti politici. La scelta del Sole 24 Ore, tra l’altro, ci pare che possa

autorizzare a non prendere in considerazione il Corriere della Sera. Il Corriere, infatti, si colloca tradizionalmente su posizioni e toni simili a quelli del quotidiano

da noi preso in considerazione, seppur in maniera evidentemente meno specialistica.

Il Mondo è un settimanale politico, economico e culturale fondato da Mario Pannunzio nel 1949. Tradizionalmente schierato su posizioni liberali e radicali, da alcuni anni è di proprietà di RCS Media Group. Anche il Mondo dovrebbe tenere

una linea simile a quella del Corriere della Sera, ma con un taglio più orientato verso l’approfondimento.

(13)

La Voce.info non è propriamente un giornale, quanto piuttosto una

newsletter – aggiornata con cadenza settimanale – di informazione sul quale vengono pubblicati articoli e approfondimenti su tematiche di economia ed

attualità. È stata fondata nel 2002 da alcuni professori universitari di economia, ed economisti sono quasi tutti i redattori e i collaboratori del sito; il contenuto degli

articoli è generalmente piuttosto tecnico, ma con un approccio divulgativo. Da un punto di vista politico, la Voce.info mantiene una posizione equidistante rispetto ai due principali schieramenti, utilizzando toni critici prevalentemente nei confronti

dell’azione del governo in carica13. Le analisi proposte sono solitamente riconducibili a idee che potremmo definire, con un’espressione anglosassone, liberal.

Il periodo di riferimento

Per quanto riguarda l’arco temporale, abbiamo deciso di assumere come

periodo di riferimento gli ultimi quattro mesi del 2007.

Tale arco temporale è stato scelto principalmente perché corrispondente alle fasi di discussione e approvazione della Legge finanziaria per il 2008. Questo

periodo, infatti, oltre ad essere quello più ricco di articoli a carattere economico, è quello in cui maggiormente si concentrano gli articoli per così dire “politici”, di

informazione ed analisi dei provvedimenti economici proposti dal governo e adottati dal parlamento. In questa fase insomma i giornali pongono la loro attenzione soprattutto sulla politica economica del governo, sia quella già

implementata, sia, e soprattutto, quella programmata, essendo la Finanziaria un documento volto a stabilire le spese future. Inoltre, nel periodo preso in

considerazione, ferveva un acceso dibattito riguardante il cosiddetto protocollo di luglio, firmato tra le parti sociali e il governo il 23 luglio 2007 e sottoposto a

referendum, tra i lavoratori iscritti a Cgil, Cisl e Uil nel mese di ottobre.

13 L’ambizione della Voce.info, come espressa nell’introduzione del sito, è quella di “essere

(14)

Il corpus di riferimento

Il corpus su cui è stata effettuata la ricerca è costituito da 5.556 articoli, di cui

830 del Giornale, 577 del Manifesto, 124 del Mondo, 1.999 del Sole 24 Ore, 1.987 della Repubblica e 41 della Voce.info. Sono stati selezionati gli articoli che

affrontano i temi del lavoro e del welfare, intesi in maniera estensiva. Abbiamo, in altri termini, preso in considerazione sia gli articoli descrittivi che quelli di analisi, includendo anche quelli relativi al dibattito politico, oltre che economico, sulle

politiche proposte in relazione a questi temi.

Per il Giornale e la Repubblica la raccolta dei dati è stata fatta con l’utilizzo

della banca dati on line Factiva, cui l’Ateneo pisano è abbonato. Factiva è dotata di un sistema di ricerca per data, per pubblicazione, per argomento e per parole

chiave. Gli articoli di questi due quotidiani sono una parte, selezionata dopo una rapida lettura, di quelli archiviati dalla banca dati utilizzando le seguenti

parole-chiave: lavor*, salar*, impieg*, operai*, manodopera, stipendi*, mensilità, produttiv*, scioper*, sindaca*, dipendent*, cuneo, tfr, pension*, assumere, assun*, licenzi*, precar*, flessibil*, sommers*, nero, disoccupa*, occupa*, welfare.

Per quanto riguarda il Manifesto, non essendo esso incluso nella banca dati di Factiva, si è fatto ricorso all’archivio elettronico consultabile nell’area del sito

internet del giornale riservata agli abbonati on line. In questo archivio, ogni articolo è preceduto da alcune parole che ne individuano l’argomento. Abbiamo quindi raccolto quasi tutti gli articoli (ne è stata scartata solo una minima parte rientrata

nella selezione per errore) che, nel testo o come argomento, contengono le parole-chiave sopra riportate.

Gli articoli del Sole 24 Ore sono stati raccolti tramite una banca dati on line disponibile presso i computer dell’Ateneo pisano. Gli articoli scelti sono il frutto di

una selezione da quelli archiviati dalla banca dati sotto gli argomenti “Lavoro e formazione” e “Imprese - macroeconomia e congiuntura”.

(15)

Gli archivi del Mondo e della Voce.info, infine, sono liberamente e

gratuitamente consultabili sui rispettivi siti web. Il minor numero di articoli, in questo caso, ha reso non necessario l’utilizzo di filtri nelle banche dati.

2.2 Ipotesi generali e struttura del lavoro

L’ipotesi centrale da cui parte questo lavoro è che i sei giornali affrontino in maniera diversa l’informazione economica. Ciò non significa semplicemente che gli editoriali di commento e analisi delle notizie assumano posizioni differenti a

seconda del giornale, cosa abbastanza scontata. Si presuppone piuttosto che nella stessa presentazione delle notizie, in cui si individuano molte meno divergenze

formali tra testate, vi siano differenze rilevanti dipendenti dalla visione politica di chi scrive. Riteniamo inoltre che queste differenze, volontarie o involontarie che siano, e almeno in parte individuabili già intuitivamente dal comune lettore, siano

“catturabili” con gli strumenti dell’analisi quantitativa del discorso.

Struttura del lavoro

Sulla base della nostra conoscenza dei sei giornali studiati, e tenendo conto

delle potenzialità offerte dal programma TalTac2, di cui abbiamo parlato in

precedenza, svolgeremo tre tipi di analisi del linguaggio, con un grado progressivo di approfondimento:

- Un primo tipo di analisi è incentrato sul tipo di linguaggio utilizzato. Si tratta in sostanza di misurare la prevalenza di termini comuni oppure di termini ricercati o specialistici. In questo caso, ci aspettiamo di osservare che il Giornale, il

Manifesto e la Repubblica, quotidiani generalisti, abbiano un linguaggio più “comune” rispetto al Mondo, al Sole 24 Ore e alla Voce.info, giornali

(16)

lessico tra giornali appartenenti alla stessa categoria, anche se si può forse supporre

che il Mondo abbia un taglio meno specialistico, con meno termini tecnici, rispetto agli altri due giornali economici. Oltre che con la debolezza di queste supposizioni,

inoltre, occorre confrontarsi con la parziale inadeguatezza, di cui parleremo in

seguito, dei mezzi forniti da TalTac2 per valutare quanto il linguaggio di un testo

possa essere definito “comune”.

- Un secondo tipo di analisi può riguardare gli argomenti trattati e i termini

utilizzati. Il software TalTac2, naturalmente, analizza solo le singole forme grafiche o

i singoli lemmi; l’analisi dei nomi propri più frequenti e di alcune altre forme grafiche chiave servirà per osservare gli argomenti più trattati, mentre l’analisi dei

nomi comuni e di altre forme grafiche ci consentirà di effettuare interessanti osservazioni sulle espressioni, di forma e soprattutto di sostanza, più “care” ai vari

giornali. Dal punto di vista degli argomenti, ci attendiamo che il Manifesto affronti con particolare frequenza le notizie relative allo scontro politico e alle vicende sindacali e più in generale alle condizioni dei lavoratori. Possiamo poi ipotizzare

che la Repubblica non privilegi particolarmente alcun argomento specifico, concentrandosi forse maggiormente sull’approvazione della manovra finanziaria,

che pure dovrebbe essere, presumibilmente, il tema più ricorrente su tutte e sei le testate. Per quanto riguarda il Giornale, si può forse supporre che esso affronti

frequentemente temi legati alle piccole e medie imprese, con una particolare attenzione alla tassazione dei fattori produttivi. È difficile ipotizzare differenze tra i tre giornali economici, accomunati probabilmente dall’attenzione a temi più tecnici.

Si può tuttavia supporre che il Sole 24 Ore, per ragioni anche di proprietà, e forse il Mondo, dedichino più spazio ai temi relativi al mondo imprenditoriale rispetto alla

Voce.info.

- Un terzo tipo di analisi, più complesso, riguarda il modo in cui i sei giornali

affrontano gli argomenti trattati, derivante dai presupposti di teoria economica, o in ogni caso corrispondente all’orientamento o al messaggio politico che il giornale

(17)

luogo, osservare la ricorrenza di determinate forme grafiche, sia aggettivi che

sostantivi, che riteniamo indicativi di un certo orientamento; in secondo luogo, è possibile, tramite l’analisi delle corrispondenze, fornire una rappresentazione

grafica, in uno spazio a due o più dimensioni, della distribuzione dei lemmi, a seconda della frequenza con la quale essi ricorrono sulla stessa testata; l’analisi delle

corrispondenze, inoltre, viene svolta sull’intero corpus, e questo consentirà confronti più immediati tra i sei giornali; infine, possiamo utilizzare un dizionario degli

aggettivi positivi e negativi fornito dal software TalTac2 per osservare quali testate

tendono a dare più di frequente giudizi di merito e se essi vedono gli eventi economici da essi riportati con favore o con contrarietà. Tramite questo tipo di

analisi, inoltre, è possibile valutare come varia nel tempo l’approccio dei differenti giornali rispetto alle notizie riguardanti i temi del welfare e del lavoro. Oltre ad

osservare i termini più utilizzati in ciascun periodo, infatti, valuteremo la maggiore o minore presenza di aggettivi positivi e negativi in momenti diversi. Se, nell’arco di pochi mesi, non ha molto significato parlare di mutamenti di fase economica, ci

avvarremo in ogni caso di dati macroeconomici scomposti per mese e terremo conto delle varie fasi politiche, ben più rapidamente mutevoli di quelle economiche. La

nostra ipotesi generale, in questa parte del lavoro, è che i giornali si pongano in linea con l’orientamento politico tendenziale, e necessariamente semplificato,

descritto nell’introduzione. Il Manifesto dovrebbe assumere un atteggiamento negativo nei confronti delle imprese e favorevole nei confronti dei sindacati e dei lavoratori; una posizione critica dovrebbe poi essere assunta non tanto nei confronti

del governo, quanto della manovra finanziaria da esso varata. Il Giornale dovrebbe porsi in maniera speculare rispetto al Manifesto in rapporto agli attori del mondo

del lavoro (per semplificare, dalla parte delle imprese); rispetto al governo e alla finanziaria, invece, l’atteggiamento dovrebbe essere di netta opposizione. La Repubblica, infine, dovrebbe avere un approccio più distaccato e istituzionale

rispetto alle notizie sui temi del welfare e del lavoro, caratteristica comune ai tre giornali economici; ci si attende, tuttavia, che essa guardi con un certo favore al

(18)

governo e soprattutto alla manovra finanziaria. Il Mondo, il Sole 24 Ore e la

Voce.info, oltre che dall’approccio formalmente più tecnico e imparziale, dovrebbero essere accomunati dalla condivisione delle esigenze di risanamento

finanziario manifestate dal governo. Inoltre, come detto prima, possiamo supporre che il Mondo e soprattutto il Sole 24 Ore tengano un atteggiamento di sostegno alle

esigenze delle imprese. A queste ipotesi generali, naturalmente, ne affiancheremo nel corso del lavoro altre più dettagliate. In particolare, dedicheremo un approfondimento maggiore all’approccio dei vari giornali nei confronti di due temi

specifici: da un lato gli articoli riguardanti la dinamica salariale e dall’altro gli articoli riguardanti il tema della riforma delle pensioni. Entrambi gli argomenti

saranno intesi in senso lato, in modo da avere un elevato numero di articoli da analizzare per ciascuna testata. Per questa parte del lavoro, infatti, estrarremo dei sub-corpora contenenti esclusivamente gli articoli riguardanti questi due specifici

temi.

- Nelle conclusioni cercheremo di valutare i risultati del nostro lavoro alla

luce di alcuni modelli, presenti nella letteratura economica e sociologica, sul mercato dei giornali, sulla sua influenza sulla linea editoriale degli stessi e sul

rapporto tra i media e le politiche pubbliche, con particolare riguardo a quelle sui temi del lavoro e del welfare.

(19)

3

IL TRATTAMENTO PRELIMINARE

DEL TESTO

Prima di presentare le analisi e i risultati del nostro lavoro, descriviamo qui

rapidamente le operazioni svolte con il software TalTac2 in maniera preliminare

rispetto all’analisi vera e propria.

In primo luogo, occorre normalizzare il testo. Questa operazione è finalizzata ad una prima omogeneizzazione di tutte le forme grafiche equivalenti. Vengono quindi ridotte tutte le lettere maiuscole collocate all’inizio di parole precedute da un

punto, da un punto interrogativo o da un punto esclamativo, con l’eccezione dei

nomi propri riconosciuti da TalTac2. Vengono inoltre omogeneizzate le forme

grafiche riconducibili a nomi propri presenti in liste, dette appunto di normalizzazione, di cui è dotato il software. Questa operazione è stata effettuata per

il corpus generale e per i sei corpora dei singoli giornali.

L’operazione successiva consiste nella lessicalizzazione. Dopo la

normalizzazione, con un apposito comando di TalTac2 abbiamo proceduto ad individuare i segmenti rilevanti, ovvero quelle sequenze di almeno due parole che ricorrono più volte nel corpus. A partire dalla lista dei segmenti, abbiamo costruito

una lista di lessicalizzazione, formata da 1.111 segmenti che ci sembravano dotati di un significato indipendente dalle parole che compongono i segmenti stessi. Questi

1.111 segmenti sono stati quindi aggiunti ai corpora, andando a costituire delle

nuove forme grafiche. TalTac2, inoltre, procede a sottrarre, per le forme grafiche

presenti all’interno di segmenti, dal totale delle occorrenze le occorrenze interne ai segmenti. Per fare un esempio, se il segmento mani nelle tasche ricorre 10 volte nel testo, le occorrenze totali delle forme grafiche mani, nelle e tasche risulteranno

inferiori di 10 unità rispetto alla situazione precedente alla lessicalizzazione. I segmenti rilevanti sono stati individuati sull’intero corpus, in modo da avere una

(20)

unica vasta lista di lessicalizzazione, che è stata poi inserita nei sei corpora dei

giornali.

In seguito, si è provveduto a calcolare le sub-occorrenze per le variabili data e

giornale. In questa maniera si ottiene per ogni forma grafica, a fianco delle occorrenze totali, la scomposizione delle occorrenze per ogni giornale e per ogni

giorno. Questa operazione è stata effettuata per l’intero corpus e per i sei corpora dei giornali, anche se nel secondo caso è stata considerata, per evidenti ragioni, solo la variabile data.

L’operazione successiva è quella del tagging grammaticale. Con questa

procedura, TalTac2 confronta il vocabolario del corpus con il dizionario predefinito

del software, costituito da circa 74.000 lemmi, pari a oltre 530.000 forme flesse. Tramite questo confronto è possibile etichettare grammaticalmente le forme grafiche

presenti nel vocabolario considerato. Ad ogni forma grafica riconosciuta dal software, infatti, viene associata la categoria grammaticale corrispondente, o le possibili categorie grammaticali, qualora si tratti di una forma ambigua (ad esempio

la forma grafica porto, che può essere un verbo o un sostantivo). Il risultato più rilevante di questa operazione14, tuttavia, è la generazione del lemma

corrispondente per ogni forma grafica. Sulla base dei lemmi, piuttosto che su quella delle forme grafiche, infatti, si svolgerà una parte consistente del nostro lavoro.

Qualora la forma sia ambigua, o non riconosciuta da TalTac2, nel campo “lemma”

viene semplicemente riportata la forma grafica. Il tagging grammaticale è stato effettuato sia sul corpus principale che sui corpora dei giornali.

Dopo il tagging grammaticale, abbiamo proceduto ad una ulteriore fase di “pulitura” del testo, volta da un lato ad una lemmatizzazione manuale, più

approfondita di quella effettuata dal software con il tagging grammaticale, e dall’altro alla correzione del maggior numero di errori di stampa possibile. In

particolare, abbiamo stabilito i lemmi relativi alle forme grafiche non riconosciute e

14 Le analisi che svolgeremo in questo lavoro non utilizzeranno le categorie grammaticali. Queste,

(21)

“disambiguato” i lemmi relativi alle forme grafiche ambigue. Abbiamo scelto di

svolgere questa operazione – svolta a livello manuale – per tutte le forme grafiche con più di 80 occorrenze nel corpus principale e per i 1.111 segmenti lessicalizzati,

che presentavano un gran numero di nomi propri15. Il risultato di questa operazione, che ha comportato 707 sostituzioni nel corpus principale, è stato salvato

in un piano di lavoro e riprodotto sui sei corpora dei giornali.

15 Ad esempio, i segmenti lessicalizzati Romano Prodi o premier Romano Prodi sono stati ricondotti al

lemma Prodi, e il segmento lessicalizzato Stati Uniti d’America, oltre alle forme grafiche Usa e USA, sono stati ricondotti al lemma Stati Uniti.

(22)

4

L’ANALISI “ESOGENA” DEI LESSICI

Il primo tipo di analisi che è possibile effettuare è volto ad osservare il tipo di

linguaggio utilizzato dai vari giornali. Per fare ciò effettueremo un’analisi “esogena” dei linguaggi, ovvero che si basa su liste o lessici di frequenza esterni al

corpus studiato.

4.1 Il confronto con il linguaggio comune

Valuteremo ora, per ciascun giornale, l’incidenza di termini comuni e quella

di termini ricercati, in modo da avere un’idea di quali testate abbiano un linguaggio più elevato.

La nostra ipotesi dovrebbe essere che i tre giornali economici e in particolare

il Mondo e la Voce.info, abbiano un linguaggio più ricercato. I quotidiani generalisti, viceversa, dovrebbero utilizzare un registro più colloquiale e non

dovrebbero presentare grosse differenze tra loro.

Il software TalTac2, per questo tipo di analisi, mette a disposizione diversi

dizionari di riferimento, da utilizzare come confronto con il corpus studiato. Il dizionario più indicato per questo tipo di studio è quello denominato “Linguaggio comune”, elaborato da Bolasco e Canzonetti16, comprendente tutte le forme con un

uso maggiore di 50 presenti in tutte le edizioni di Repubblica dal 1990 al 1999. Come si comprende, questo vocabolario non è esente da controindicazioni, derivanti da

due ordini di ragioni. Da un lato, il vocabolario di riferimento è tratto da uno dei quotidiani oggetto di analisi, seppur in relazione ad un periodo precedente di alcuni

anni. Dall’altro, questo vocabolario riproduce un linguaggio giornalistico che,

(23)

seppur relativo ad una testata di carattere generalistico, si colloca ad un livello

superiore a quello del linguaggio comune. Occorre tuttavia notare, a difesa della scelta di questo vocabolario, che esso è particolarmente numeroso (60.489 forme

grafiche e oltre 250 milioni di occorrenze) e che comprende tutte le sezioni del giornale, tra le quali quelle economiche e politiche, dalle quali sono stati tratti in

prevalenza gli articoli selezionati, sono senza dubbio tra quelle più specifiche17.

Tab. 4.1: Copertura dei tre dizionari del linguaggio comune rispetto ai corpora dei sei giornali Testata Linguaggio comune (forme grafiche) Linguaggio comune (occorrenze) Italiano standard (forme grafiche) Italiano standard (occorrenze) Italiano parlato (lemmi) Italiano parlato (occorrenze) Manifesto 71,62% 86,64% 59,77% 84,47% 48,61% 85,31% Sole 24 Ore 64,65% 85,06% 52,14% 83,18% 42,36% 83,32% Giornale 72,52% 86,00% 61,12% 83,71% 49,94% 84,46% Repubblica 64,80% 85,31% 51,51% 83,26% 42,45% 84,19% Mondo 69,18% 85,02% 60,34% 82,09% 52,56% 83,82% Voce.info 74,84% 87,13% 69,36% 85,37% 59,61% 84,06%

Da questa analisi emerge che il 64,65% delle forme grafiche presenti nel Sole 24 Ore e il 64,80% di quelle della Repubblica fanno parte del “linguaggio comune”.

Questa percentuale è invece superiore al 69% per tutte le altre testate. A prima vista, dunque, sembrerebbe che, paradossalmente, i due giornali più diffusi siano quelli

17 Un’altra peculiarità, in una certa misura limitante, di questo dizionario è che esso non contiene

nomi propri. Sono tuttavia presenti molti aggettivi da essi derivati. A titolo di esempio, mancano i sostantivi Berlusconi e Pisa, ma sono presenti gli aggettivi pisano e berluconiano, e persino il sostantivo berlusconismo.

(24)

con il registro nettamente più elevato. Questa dicotomia, tuttavia, è a nostro avviso

apparente, e dovuta al fatto che i corpora del Sole 24 Ore e la Repubblica, per via della loro grande dimensione, contengono un numero di forme grafiche di gran

lunga superiore a quello degli altri giornali. Si può di conseguenza supporre che, all’aumentare delle forme grafiche, sia più frequente trovare singole forme grafiche

poco frequenti, sia nella lingua italiana che nei corpora considerati, e pertanto assenti nel dizionario di riferimento. Queste nostre considerazioni sembrerebbero essere confermate se spostiamo l’attenzione dalle forme grafiche presenti al numero di

occorrenze totali, più indicativo dell’effettivo registro usato da un giornale. In questo caso, infatti, notiamo che le differenze tra i giornali si appiattiscono quasi

totalmente, oscillando i valori tra l’85,02% del Mondo e l’87,13% della Voce.info. La nostra supposizione, infatti, è che le parole “strane”, nei grandi corpora del Sole 24 Ore e della Repubblica, siano numerose, ma che la frequenza di ognuna di esse sia

relativamente bassa, con la conseguenza di risultare “diluita” qualora si considerino le occorrenze totali.

A tal proposito, è interessante anche effettuare delle misure lessicometriche, che danno informazioni sulla cosiddetta ricchezza lessicale dei testi analizzati. In

particolare, è utile osservare la percentuale di hapax18 (forme grafiche che ricorrono soltanto una volta nell’intero corpus) nei vari giornali e l’indicatore della ricchezza lessicale fornito dalla formula (V/N)*100, dove V è il numero di forme grafiche e N è

il numero delle occorrenze.

(25)

Tab. 4.2: Misure lessicometriche

Testata Hapax Ricchezza lessicale

(Forme grafiche / occorrenze) * 100

Manifesto 47,47% 9,73% Sole 24 Ore 41,86% 5,22% Giornale 47,91% 10,87% Repubblica 45,87% 6,61% Mondo 53,37% 17,17% Voce.info 54,21% 20,26% Intero corpus 43,65% 3,66%

Possiamo notare che il numero di hapax è abbastanza variabile, e compreso tra il 41,86% del Sole 24 Ore e il 54,21% della Voce.info. Anche per quanto riguarda

il secondo indicatore della ricchezza lessicale la variabilità è elevata, e il corpus del Sole 24 Ore ha il rapporto tra forme grafiche e occorrenze minore (5,22%) e quello della Voce.info ha il rapporto maggiore (20,26%). Questi risultati sembrano indicare,

in maniera peraltro plausibile, che la ricchezza lessicale sia maggiore per i due periodici di approfondimento e minore per i due quotidiani con massima tiratura.

Tuttavia, dobbiamo anche supporre che la variabilità del primo indicatore, e soprattutto del secondo, siano in parte dovuta alle differenze tra le dimensioni dei

corpora. In altri termini, per i corpora di maggiori dimensioni, l’elevato valore del denominatore tende a ridurre il valore dell’indice. A conferma di ciò, possiamo

anche notare che l’indice relativo alla ricchezza lessicale dell’intero corpus (3,66%) è inferiore a quelli di ogni sub-corpus19.

19 Per nessuno dei due indici, naturalmente, il valore relativo all’intero corpus rappresenta la media

ponderata dei valori dei singoli giornali. Per intenderci, una forma che ricorre solo una volta in ciascun giornale sarebbe catalogata come hapax in tutti e sei i sub-corpora, ma non in quello

(26)

In definitiva, ci pare che la quota di forme grafiche “coperte” (cioè presenti in

entrambi i corpora) dal dizionario di riferimento – in particolare con riguardo alle occorrenze totali – sia grosso modo simile per tutti e sei i giornali. Dobbiamo poi,

più in generale, precisare come sia difficile dire precisamente se la bassa “copertura”20 di questo dizionario21, indicativa di un linguaggio generalmente non

“comune”, sia da declinare prevalentemente nel senso di un lessico specialistico o in quello di un lessico forbito.

Dobbiamo inoltre per completezza aggiungere che in queste analisi, come

nelle successive, la nostra ipotesi è che la frequenza degli errori di stampa, anche al netto della nostra parziale correzione effettuata in sede di lemmatizzazione, sia

grosso modo uguale per tutte e sei le testate. Questa ipotesi, tuttavia, verosimilmente non è del tutto realistica, e la diversa frequenza di errori di stampa potrebbe in parte influenzare i risultati delle nostre analisi. In ogni caso, con

l’osservazione delle occorrenze totali, che come detto prima ci pare maggiormente indicativa del registro complessivo dei giornali studiati, l’influenza della frequenza

degli errori di stampa sui risultati ottenuti viene pressoché totalmente annullata.

Il confronto con l’”Italiano standard”

Un’analisi analoga è stata effettuata con un altro dizionario, elaborato da

Bolasco e Morrone nel 1998 e messo a disposizione dal software TalTac2, definito

“Italiano standard”. Questo dizionario è stato elaborato a partire da tutte le forme grafiche presenti almeno una volta in un campione di fonti di varia natura, di italiano scritto e parlato, formale ed informale, etc22. I risultati sono abbastanza

principale. Similmente, una forma presente n volte in un corpus e m volte in un altro, verrà considerata come n + m al denominatore (occorrenze), ma solo una volta al numeratore (forme grafiche).

20 Intendiamo qui per “copertura” la percentuale di forme grafiche del corpus in esame che sono

presenti anche nel vocabolario di riferimento.

21 Questo limite riguarda anche i due dizionari che utilizzeremo in seguito in questo capitolo. 22 Questo dizionario è stato presentato in Bolasco e Morrone (1998).

(27)

simili a quelli ottenuti con il vocabolario “linguaggio comune”, sia in termini di

forme grafiche che di occorrenze totali, con delle differenze tra quotidiano e quotidiano solo lievemente più marcate.

Poiché i due dizionari usati come riferimento per valutare il registro del linguaggio delle varie testate presentano alcuni limiti, che abbiamo visto prima,

abbiamo scelto di effettuare lo stesso tipo di analisi con un terzo tipo di vocabolario, di natura differente dai due precedenti. La lista è composta da 15478 lemmi, facenti parte del “Linguaggio dell’italiano parlato” (LIP), un enorme dizionario redatto da

una équipe di italianisti diretta da Tullio De Mauro all’inizio degli anni ’9023. In

questo caso il dizionario non è fornito da TalTac2, ma è messo a disposizione dal sito

internet dell’Università di Graz. Abbiamo deciso di utilizzare questo dizionario perché ci pare possa fornire una idea approssimativa, da un’angolatura differente

rispetto ai due vocabolari precedentemente utilizzati, del linguaggio dell’italiano comune. In questo caso, inoltre, l’analisi si svolge sulla base dei lemmi e non delle forme grafiche, a differenza delle due analisi precedenti.

23 Il corpus del Lessico di frequenza dell'italiano parlato (Corpus LIP) è la raccolta di testi dell'italiano

parlato più importante e più utilizzata nella ricerca linguistica. Fu costituito nel 1990-1992 da un gruppo di linguisti diretto da Tullio De Mauro e servì per costruire, in collaborazione con la Fondazione IBM Italia, il primo lessico di frequenza dell'italiano parlato ad opera di De Mauro, Mancini, Vedovelli e Voghera nel 1993. I suoi 469 testi, contenenti complessivamente ca. 490.000 parole, furono raccolti in quattro città (Milano, Firenze, Roma e Napoli) e provengono da cinque macroclassi e numerose sottoclassi di discorso. Le cinque macroclassi sono:

A) scambio comunicativo bidirezionale con presa di parola libera faccia a faccia (es. conversazioni in casa);

B) scambio comunicativo bidirezionale con presa di parola libera non faccia a faccia (es. conversazioni telefoniche);

C) scambio comunicativo bidirezionale con presa di parola non libera faccia a faccia (es. assemblee legislative);

D) scambio comunicativo unidirezionale in presenza del destinatario o dei destinatari (es. lezioni di scuola o universitarie);

E) scambio comunicativo unidirezionale o bidirezionale a distanza o differito su testo non scritto (es. trasmissioni televisive).

Per ulteriori informazioni su questo dizionario, si vedano De Mauro et al. (1993) e il sito web http://languageserver.uni-graz.at/badip.

(28)

I risultati di questa analisi, osservabili nella riassuntiva tabella 2 (vedi sopra),

sono comunque abbastanza simili a quelli delle altre due. In termini di numero di lemmi, le differenze sono marcate e analoghe alle analisi precedenti: si oscilla tra il

42,36% del Sole 24 Ore e il 59,61% della Voce.info. In termini di occorrenze totali, invece, le differenze si assottigliano24: si passa infatti dall’83,32% delle occorrenze

del Sole 24 Ore all’85,31% di quelle del Manifesto. In questo caso, tuttavia, è possibile intravedere una differenza tra le testate generaliste e quelle economiche, nella direzione delle ipotesi formulate in precedenza. Nei corpora del Sole 24 Ore,

del Mondo e della Voce.info, infatti, si incontrano più raramente rispetto agli altri giornali lemmi appartenenti al dizionario dell’italiano parlato.

4.2 Il

confronto

con

un dizionario economico

Abbiamo in seguito svolto un’analisi simile a quelle appena viste, ma diretta

ad osservare la frequenza, negli articoli riguardanti i temi del welfare e del lavoro, di termini specificamente economici. Naturalmente, in questo caso, ci attendiamo

che essi siano più presenti sul Sole 24 Ore, sul Mondo e sulla Voce.info che sulle altre tre testate. Non formuliamo invece alcuna ipotesi su eventuali differenze

all’interno delle due classi di giornali.

Per effettuare questa analisi ci siamo serviti delle voci del dizionario

economico on-line disponibile sul sito dell’editore Simone. Le voci sono più di 3.000, e comprendono sia termini molto tecnici (assioma debole delle preferenze rivelate, saggio tecnico di sostituzione...), che termini comuni (banca, azione, debito

pubblico...). Abbiamo quindi comparato, in maniera analoga a quanto fatto prima,

24 Anche in questo caso rimandiamo a quanto detto prima a proposito dei problemi relativi alla

discrepanza tra i risultati ottenuti con l’analisi dei lemmi e quelli ottenuti con l’analisi delle occorrenze.

(29)

un dizionario costituito da queste voci con i lemmi dei sei corpora. Riportiamo in tab.

4.3 i risultati dell’analisi.

Tab. 4.3: Confronto con un dizionario economico

Testata Dizionario economico (forme grafiche) Dizionario economico (occorrenze) Manifesto 2,05% 3,87% Repubblica 1,51% 3,01% Sole 24 Ore 2,04% 3,98% Giornale 2,05% 3,18% Mondo 3,17% 4,15% Voce.info 4,07% 4,75%

Dall’osservazione delle forme grafiche, e ancor più da quella delle

occorrenze, otteniamo una evidente conferma di quanto supposto: la Voce.info è il giornale sul quale sono presenti più termini economici (4,75%)25, seguita dal Mondo

e dal Sole 24 Ore. Non si verifica tuttavia la netta divisione in due categorie che avevamo ipotizzato. Da un lato, infatti, la Voce.info presenta dei valori molto superiori a quelli di tutti gli altri giornali, e dall’altro il Manifesto presenta un

25 Il valore particolarmente basso in termini assoluti di questo indice non deve stupire. Esso è infatti

creato a partire da un vocabolario di dimensioni relativamente piccole (3314 lemmi) e non comprendenti le parole “neutre” più utilizzate nella lingua italiana. Gli indici ottenuti con analisi analoghe, in precedenza, avevano valori molto superiori perché erano calcolati su vocabolari costituiti da migliaia di forme grafiche, e comprendenti tutti i termini più utilizzati nella lingua italiana. In ogni caso, ciò che rileva ai fini di questa analisi sono solo le variazioni di questi indici da quotidiano a quotidiano.

(30)

utilizzo di termini economici quasi pari a quello del Sole 24 Ore e ben superiore a

quello della Repubblica e del Giornale.

4.3 Il confronto con il discorso programmatico di

governo

Abbiamo infine deciso di effettuare un’altra analisi, analoga a quelle precedenti, servendoci del vocabolario del “Lessico del discorso programmatico di

governo”, messo a disposizione dal software TalTac2.

Il lessico di questo dizionario è composto da circa 3.000 lemmi provenienti da

uno studio26 sulle dichiarazioni programmatiche dei Presidenti del Consiglio incaricati della Prima Repubblica in Italia dal 1948 al 1994. Questo vocabolario è piuttosto ampio e contiene, oltre a delle forme peculiari, tutte le forme grafiche più

utilizzate generalmente nella lingua italiana. Tuttavia, riteniamo che esso non sia sovrapponibile ai tre dizionari precedenti, che avevamo utilizzato come

approssimazione dell’italiano comune. In questo caso, infatti, sono presenti numerosi termini istituzionali e politici, seppur di uso frequente. Riportiamo i

risultati dell’analisi in tab. 4.4.

(31)

Tab. 4.4: Copertura dei sei corpora rispetto al Lessico del discorso programmatico di governo

Testata

Lessico del discorso programmatico di

governo (forme grafiche)

Lessico del discorso programmatico di governo (occorrenze) Manifesto 24,31% 66,81% Sole 24 Ore 21,51% 66,02% Giornale 24,95% 65,04% Repubblica 19,46% 64,58% Mondo 30,17% 65,10% Voce.info 41,89% 69,13%

Anche in questo caso, come nelle analisi precedenti, i valori del primo indice presentano una variabilità molto maggiore rispetto a quelli del secondo, che

oscillano tra il 64,58% della Repubblica e il 69,13% della Voce.info. Limitandoci al calcolo del numero di occorrenze totali, possiamo appunto notare che la Voce.info

offre una “copertura” del lessico del discorso programmatico di governo molto maggiore rispetto agli altri giornali, seguita dal Manifesto (66,81%).

Questi dati sembrerebbero quindi suggerire che la Voce.info, e in misura

minore il Manifesto, utilizzino un lessico più politicizzato rispetto alle altre quattro testate. Se il risultato del Manifesto era tutto sommato prevedibile, più interessante

è quello riguardante la Voce.info. In ogni caso, bisogna considerare che questa testata si caratterizza per un taglio molto tecnico (da cui probabilmente un elevato

numero di espressioni istituzionali) e per un approccio dichiaratamente propositivo in termini di politiche economiche.

In conclusione, ci pare di poter affermare che tra le sei testate non vi siano differenze sostanziali in termini di registro utilizzato nei rispettivi articoli riguardanti i temi del lavoro e del welfare. Tendenzialmente, i giornali economici

(32)

sembrano utilizzare un linguaggio più ricercato e un lessico più ricco rispetto a

quelli generalisti, ma la differenza sembra minima. Possiamo poi dire che il Sole 24 Ore, la Voce.info e il Mondo, e in misura leggermente minore il Manifesto, tendono

ad affrontare i temi del lavoro e del welfare da una prospettiva più economica. Infine, il Manifesto e soprattutto la Voce.info sono i giornali che utilizzano un

(33)

5 L’ANALISI “ENDOGENA” DEI LESSICI

Le operazioni di estrazione di informazione che svolgeremo in questo

capitolo sono di tipo endogeno, ovvero sfruttano dati dei soli testi in analisi e non altre risorse esterne al corpus. È questa una differenza rilevante rispetto ad altre

analisi di tipo esogeno, quali quelle che abbiamo svolto nel capitolo precedente, che si basano su liste o lessici di frequenza esterni al corpus studiato.

5.1 I lemmi più utilizzati

Prima di affrontare analisi più complesse, è opportuno individuare le parole più utilizzate per avere un primo spaccato delle priorità dei giornali in termini di argomenti affrontati.

Sono stati quindi evidenziati i lemmi col maggior numero di occorrenze per ciascuna testata27: nella tabella 5.1 si riportano i 25 lemmi significativi28 più presenti

in ciascun giornale.

27 Occorre precisare che per le analisi che seguono la significatività dei dati relativi al Mondo e

soprattutto alla Voce.info è inferiore a quella degli altri giornali a causa del minore numero di articoli a disposizione

28 Abbiamo eliminato i lemmi di preposizioni, avverbi e congiunzioni da noi ritenuti irrilevanti e i

seguenti verbi (in quanto ausiliari o comunque di uso vastissimo e molto diversificato): essere, avere, potere, dovere, venire, fare, dire, stare.

(34)

Tab. 5.1: I 25 lemmi più presenti in ciascun giornale

Giornale Manifesto Mondo

Lemma occorrenze Lemma occorrenze Lemma occorrenze

anno 779 lavoratore 1190 azienda 375

governo 621 lavoro 1074 anno 281

sindacato 607 sindacato 916 milione 243

lavoro 585 anno 783 Italia 235

lavoratore 471 governo 764 gruppo 191

euro 408 Cgil 574 società 180

sciopero 387 sciopero 543 lavoro 166

dipendente 354 operaio 470 dipendente 143

azienda 351 azienda 467 mercato 143

Roma 351 ieri 452 impresa 142

Italia 346 accordo 450 italiano 142

ieri 338 politica 400 mila 140

chiedere 327 sinistra 396 2006 121

Milano 292 chiedere 391 oggi 118

contro 290 impresa 386 manager 114

arrivare 287 contratto 374 lavorare 111

spiegare 282 contro 372 banca 109

Cgil 277 Fiom 368 settore 105

milione 273 oggi 333 2007 102

oggi 272 sociale 326 presidente 93

presidente 268 lavorare 323 servizio 89

Alitalia 261 no 316 sistema 88

Finanziaria 259 salario 315 università 84

per cento 257 parlare 309 produzione 82

lavorare 248 protocollo 301 spiegare 81

Sole 24 Ore Repubblica Voce.info

Lemma occorrenze Lemma occorrenze Lemma occorrenze

lavoratore 2516 anno 2336 lavoro 116

anno 2491 lavoro 1996 per cento 113

lavoro 2397 lavoratore 1762 lavoratore 112

azienda 1863 sindacato 1736 anno 111

impresa 1572 azienda 1489 paese 95

sindacato 1447 operaio 1069 Italia 93

governo 1233 chiedere 1036 sistema 75

dipendente 1200 dipendente 1027 impresa 68

numero 1142 Cgil 1019 economico 68

contratto 1121 euro 1003 risultato 66

attività 1099 per cento 943 italiano 65

Italia 1088 lavorare 929 dati 64

euro 1083 governo 920 donna 63

2007 1045 oggi 901 riforma 61

previsto 1040 ieri 863 scuola 59

milione 1034 arrivare 841 azienda 56

servizio 913 sciopero 825 dipendente 55

articolo 909 spiegare 794 contratto 55

2006 902 accordo 791 produttività 54

regione 892 contratto 735 2007 54

spiegare 890 regione 716 misura 53

legge 888 problema 692 effetto 52

accordo 865 giorno 689 personale 51

presidente 860 Italia 683 parte 51

(35)

La tabella, volta a fornire una prima e approssimata fotografia dell’utilizzo

dei vari lemmi da parte dei giornali, evidenzia come i sei giornali siano accomunati dall’utilizzo assai frequente di alcune parole (impresa, azienda, lavoro, lavoratore,

sindacato, anno...), di carattere piuttosto generale e strettamente legate ai temi affrontati nel nostro studio.

Anche in questo caso, come in precedenza, possiamo individuare una differenza tra i quotidiani generalisti e i giornali economici. I primi utilizzano molto più spesso, rispetto ai secondi, termini riconducibili all’attualità politica (governo,

accordo, sciopero). Le testate specialistiche, compreso il Sole 24 Ore, che pure viene pubblicato con cadenza quotidiana, sembrerebbero inserire meno frequentemente

nei propri articoli riferimenti alle vicende e al dibattito politico.

Osservando poi i singoli giornali, si può notare che il Manifesto e il Giornale hanno molti lemmi in comune tra quelli più utilizzati: si tratta in prevalenza di

termini relativi agli scontri politici e sindacali (sciopero, contro, chiedere). Questa comunanza tra due quotidiani di orientamento politico opposto tuttavia non deve

sorprendere, in quanto in questa fase l’analisi è limitata agli argomenti trattati, e non affronta le modalità con cui i giornali trattino questi argomenti. La grande

presenza di termini “conflittuali”, inoltre, può essere imputata ai connotati di quotidiani di opposizione, attribuibili sia al Manifesto sia, soprattutto, al Giornale, nel periodo preso in considerazione.

Questi termini, d’altro canto, sono nel Manifesto affiancati da altri più strettamente legati alle dinamiche sindacali (oltre a sciopero, contro, chiedere, no,

troviamo lemmi più “conciliativi” quali accordo, contratto, parlare, protocollo); più che di toni di scontro si può quindi parlare forse per il Manifesto di toni propri delle

notizie relative alle vicende sindacali. Infine, il Manifesto utilizza di rado, rispetto agli altri giornali, il lemma dipendente, preferendo espressioni più specifiche quali lavoratore e operaio.

La Repubblica presenta caratteristiche abbastanza simili a quelle dei due quotidiani appena visti, con una prevalenza di termini relativi al mondo del lavoro

(36)

e sindacale. Ciò risulta tra l’altro in contrasto con quanto rilevato in un’altra ricerca

da noi condotta relativamente al periodo, di un anno precedente, tra il 1° ottobre e il 31 dicembre 200629. Se in quel lasso di tempo la Repubblica privilegiava termini

relativi al mondo finanziario e imprenditoriale, sembra che un anno dopo le notizie delle vicende sindacali siano molto più valorizzate30. Questo cambiamento, tra

l’altro, pare difficilmente attribuibile a mutamenti del contesto politico; i periodi presi in considerazione, infatti, fanno riferimento alla prima e alla seconda finanziaria del secondo governo Prodi31.

I giornali economici, come era prevedibile, sono caratterizzati da un maggior numero di termini specialistici e relativi all’illustrazione di dati (in questo senso

sono da considerare gli anni 2006 e 2007). Il Mondo, in particolare, sembra privilegiare i temi delle grandi imprese e della finanza (gruppo, società – da intendersi presumibilmente in senso finanziario – manager, banca), ed è l’unico

giornale a fare frequente riferimento alla realtà universitaria.

La Voce.info sembra confermare la propria inclinazione a commentare e

proporre policies economiche (sistema, risultato, effetto, riforma); questo giornale, inoltre, dedica particolare attenzione ai temi dell’occupazione femminile, come

testimoniato dall’utilizzo molto frequente del lemma donna. È interessante infine notare che la Voce.info, al pari del Mondo, menzioni solo raramente, negli articoli che affrontano i temi del welfare e del lavoro, le associazioni sindacali.

Il Sole 24 Ore, rispetto alle altre due testate economiche, presenta molti lemmi “da quotidiano” (governo, sindacato...). Tra i termini caratterizzanti, invece, troviamo

29 Ranucci (2008).

30 Nel lavoro precedente si faceva riferimento alla totalità degli articoli economici della Repubblica, e

non solo a quelli relativi ai temi del welfare e del lavoro. Le considerazioni che seguono restano in ogni caso valide.

31 Una parziale spiegazione di questo mutamento è a nostro avviso individuabile nell’ampio risalto,

dato non tanto da Repubblica quanto dalla totalità dei media nazionali, alle vicende relative alla discussione e al referendum tra i lavoratori per l’approvazione del protocollo sul welfare, firmato dal governo e dalle parti sociali il 23 luglio 2007.

Figura

Tab. 4.1: Copertura dei tre dizionari del linguaggio comune rispetto ai corpora dei  sei giornali  Testata  Linguaggio comune  (forme grafiche)  Linguaggio comune  (occorrenze)  Italiano standard (forme grafiche)  Italiano  standard  (occorrenze)  Italiano
Tab. 4.2: Misure lessicometriche
Tab. 4.3: Confronto con un dizionario economico
Tab. 4.4: Copertura dei sei corpora rispetto al Lessico del discorso programmatico  di governo
+7

Riferimenti

Documenti correlati

All’inizio si notò un silenzio degli ambienti politici italiani e della stampa italiana a ciò che accadde in Algeria, la stampa di estrema sinistra come il caso dell’“Unità, La

Quando prendiamo in considerazione solamente gli articoli privi di contenuto scientifico queste istituzioni infatti spariscono, indice che molte delle istituzioni legate

Servizio di rassegna stampa a cura di Sandro Forte.. Il Sole 24 Ore 23

E questo è anche lo spi- rito che ha pervaso il brillante Festival Rock4 dedicato alle band della nostra zona tenuto- si l’11 e il 12 aprile scorsi presso il Teatro Delfino di

[r]

E racconta non solo le vicende storiche sino allo scioglimento del Pci, il 31 gennaio 1991 a Rimini (un altro anniversario su cui riflettere) e alla sua eredità

09/12/2020 170 CE_SAREU S CE_02 PAGAMENTO TRAMITE BANCOMAT PER RIFORNIMENTO GASOLIO DI DUE FURGONI PRESI A NOLEGGIO PER TRASPORTO DPI DALLA PROTEZIONE CIVILE DI CAGLIARI.. SODDU

teristiche più salienti: all'uscita troviamo il segnale convertito in doppia banda (frequenza oscillatore locale + frequenza segnale da convertire e frequenza