Il ranking di alcuni lemm
5.2 L’analisi delle specificità
Attraverso il software TalTac2 è possibile calcolare degli indici statistici che ci
permettono di approfondire le analisi sui linguaggi. Effettuando quella che viene chiamata “analisi delle specificità” si individuano le parole che godono di una
presenza particolarmente rilevante per ogni sezione in cui un corpus è suddiviso. Si definisce specifica o "caratteristica" di un testo ogni parola o espressione sovra-
utilizzata o sotto-utilizzata rispetto ad una norma di riferimento (ad esempio il valore medio o il valore assunto in un modello di riferimento). Ogni specificità positiva (sovra-utilizzo) di una parola o di una espressione equivale ad un uso
nostro caso, rispetto all’ipotesi nulla di indipendenza tra distribuzione delle parole e
giornali35. Ogni specificità negativa di un termine, per contro, equivale ad un sotto- utilizzo (o rarità del termine) rispetto al suddetto valore “atteso”. Lo scarto è quindi
valutato in termini probabilistici36. L’analisi delle specificità ci consente quindi di identificare quei termini che caratterizzano ogni singola parte in cui è suddiviso il
corpus, nel nostro caso ogni giornale.
Abbiamo quindi effettuato l’analisi delle specificità sulle forme grafiche37 del nostro corpus, e abbiamo ottenuto un grande numero di forme specifiche (quasi
12.000)38. Nella tab. 5.4 riportiamo le 25 forme grafiche più sovra-utilizzate e le 25 forme grafiche più sotto-utilizzate39, tra quelle dai ritenute rilevanti40, per ciascuna
35 Il procedimento per calcolare le frequenze attese è quello utilizzato per il test χ2 in tavole di
contingenza bivariate: ŷij = (yi.)(y.j) / N , dove ŷij è la frequenza attesa nella cella situata all’incrocio fra la riga i e la colonna j, yi. è la frequenza totale marginale della riga i, y.j è la frequenza totale marginale della colonna j e N è la numerosità del campione (nel nostro caso occorrenze totali del corpus.
36 Il modello utilizzato da TalTac2 è quello della legge ipergeometrica, il quale se, come nel nostro
caso, la frequenza delle parole nel corpus e le dimensioni dei sub-testi sono sufficientemente grandi, si approssima asintoticamente ad una distribuzione gaussiana.
37 TalTac2 non effettua questa operazione sulla base dei lemmi
38 Abbiamo deciso di selezionare le forme grafiche che avessero un indice di specificità – positiva o
negativa – uguale o inferiore a 0,025; in altri termini, abbiamo selezionato quelle forme grafiche per le quali la presenza di un valore maggiore o minore rispetto a quello atteso abbia meno del 2,5% di possibilità di essere un fatto casuale.
39 La scelta di riportare solo 50 forme grafiche è in realtà molto arbitraria, e volta a fornire un quadro
di facile comprensione. Se avessimo selezionato, ad esempio, le forme grafiche con un indice di specificità uguale o inferiore a 0,0001, che ci dice che il sovra-utilizzo o il sotto-utilizzo è pressoché certamente non casuale, avremmo ottenuto ancora diverse migliaia di forme. Non ha quindi molto significato parlare di 50 forme grafiche “più specifiche”. Per ragioni di chiarezza, anche visiva, ci è parso comunque utile effettuare una simile selezione.
40 Abbiamo tuttavia escluso dalle tabelle le forme grafiche che ci sembravano totalmente irrilevanti
per la nostra analisi e quelle con un numero di occorrenze nel corpus generale inferiore a 30. Tra le forme ritenute irrilevanti, è particolarmente frequente il caso dei nomi dei giornalisti delle varie testate, i quali, in maniera comprensibile, risultano sovra-utilizzati nei corpora dei giornali sui quali scrivono.
testata. In appendice (allegato A) riportiamo una visualizzazione della tabella di
TalTac2 con tutte le forme specifiche.
Ci pare opportuno precisare che le forme grafiche selezionate non
corrispondono affatto alle 50 con un minore indice di specificità, ma sono le 25 con un minore indice di specificità positiva e le 25 con un minore indice di specificità
negativa. Le forme individuate da TalTac2 come sovra-utilizzate sono infatti molto più numerose di quelle individuate come sotto-utilizzate. La causa di ciò sta nel fatto che le forme grafiche presenti solo su un giornale e assenti da tutti gli altri sono
presenti nella selezione (naturalmente con una specificità positiva per il quotidiano su cui sono presenti), mentre le forme che non hanno alcuna occorrenza su un
giornale non sono considerate tra le specificità negative di quello stesso giornale41.
41 Per fare un esempio, i termini riforma o gestione, presenti in tutti i giornali e particolarmente sul Sole
24 Ore, saranno considerati come sovra-utilizzati sul Sole 24 Ore e sotto-utilizzati su altri giornali, in quanto presenti nei loro corpora, seppur con poche occorrenze. Viceversa, termini come sottoscrittori o delimitazione, presenti solamente sul Sole 24 Ore, saranno sempre considerati come sovra-utilizzati sul Sole 24 Ore, mentre non saranno computati tra i termini sottoutilizzati sugli altri giornali, in quanto totalmente assenti nei loro corpora. Lo stesso discorso vale per il caso dei giornalisti delle testate, cui abbiamo fatto cenno prima. In ogni caso, nella tabella che segue non abbiamo riportato alcuna forma grafica che fosse presente su un solo giornale.
Tab. 5.4: Specificità del linguaggio dei sei giornali
Giornale Manifesto Mondo
specificità positive specificità negative specificità positive specificità negative specificità positive specificità negative Milano formazione sciopero attività manager lavoratori Malpensa lavoratore sinistra articolo milioni sciopero Alitalia master lavoratori per cento società sindacati centrodestra attività macchinisti Comune fatturato precari
Prodi imprese morti euro business operai
tasse articolo assemblee master Italia Finanziaria
Roma Tfr Vodafone assessore mercato euro
voli aziende diritti aziende dossier sinistra
Sea modello Fiom professionisti gruppo Cgil
Atm paesi parlamento manager Merloni segretario
sinistra radicale procedura migranti personale Usa protocollo Mediolanum datore di lavoro precarietà anno azienda articolo milanesi professioni ThyssenKrupp professionali private equity sistemi Forza Italia comma consultazione datore di lavoro investment accordo
sciopero Ddl legge 30 competenze fattura protesta
compagnia lavoratori protocollo assunzioni guidata governo Google all'estero padroni formazione milioni di fatturato testo
Expo Bari finanziaria presidente Banca ore
sinistra valutazione mobilitazione addetti life contratto
tassisti rapporto salari regionale Basilicata Comune
legge Biagi Piemonte lotta grafico partner lavoratore
scalo Inail Cgil professioni holding operaio
tram foto sindacato numero management salari
hub professionisti politica servizi Borsa reddito
Formigoni Inps Trentin Ddl Carlyle assessore
Repubblica Sole 24 Ore Voce.info
specificità positive specificità negative specificità positive specificità negative specificità positive specificità negative operai all'estero all'estero sciopero per cento Cgil Cgil articolo articolo sindacati contratto unico sciopero protesta Paesi Paesi precari delocalizzazione accordo
mila euro lavoratore lavoratore operai paesi Roma
Comune ragionieri decreto Cgil fecondità sindacati
assessore formazione ragionieri segretario disuguaglianza sindacato sindaco datore di lavoro formazione protesta tasso di adesione giorni fabbrica master riforma governo fondi pensione Torino Torino professionisti datore di lavoro mila euro relazione presidente
per cento grafico requisiti Comune aderenti Cisl
giunta Tfr master operaio qualifiche euro
carabinieri comma procedura assessore monetaria Milano
Fiat iscritti Inps Fiom effetti Uil
città modello online metalmeccanici club ex
Bertone all'anno datori di lavoro sindaco risultati piano ospedale imprese professionisti manifestazione disoccupazione sinistra Palermo riforma comunicazione in piazza dualismo noi Thyssen professioni Emilia Romagna fabbrica licenziamento Fiat
118 Inps grafico albo unico dati milioni
Regione valutazione ministero del Lavoro morti decessi dicembre ieri mattina requisiti professioni no sistema intesa Palazzo disciplina gestione morto insegnanti regionale incidente competenze soggetti Torino economica miliardi operaio periodo albo unico Alitalia domestica leader
Dall’analisi delle specificità risultano parzialmente confermate le
considerazioni svolte in precedenza. Tra i termini più “tipici” del Giornale troviamo riferimenti alle vicende di Alitalia (Malpensa, Alitalia, compagnia, hub, scalo, voli) e alle
realtà milanese e lombarda (Milano, Malpensa, milanesi, Expo, Formigoni); ciò è interessante e inaspettato, in quanto il Giornale, pur vendendo molte copie nelle
regioni settentrionali, si connota decisamente come un quotidiano nazionale, diffuso in tutte le aree del Paese. Tra le specificità negative, invece, troviamo prevalentemente termini inerenti ai rapporti di lavoro e alla formazione lavorativa
(Tfr, datore di lavoro, lavoratore, lavoratori, rapporto, Inail, Inps, imprese, formazione, master).
Il Manifesto è caratterizzato da espressioni legate alla condizione dei lavoratori, spesso con una decisa connotazione critica e politica (sciopero, Fiom, Cgil, sindacato, lavoratori, macchinisti, precarietà, lotta, mobilitazione, padroni, salari, morti,
Thyssenkrupp). È poi interessante notare come la stessa legge, relativa alla riforma del mercato del lavoro, sia frequentemente citata sia dal Giornale che dal Manifesto,
ma, per evidenti ragioni politiche, con due forme grafiche differenti (legge Biagi dal Giornale e legge 30 dal Manifesto). Tra i termini meno utilizzati dal Manifesto,
invece, troviamo quelli relativi alle assunzioni e alla formazione professionale (formazione, master, competenze, professionali).
Tra le specificità positive del Mondo troviamo espressioni tipiche del mondo
delle grandi imprese, e in particolare legate alla realtà finanziaria; molti di questi termini, tra l’altro, sono di origine inglese (manager, management, holding, Borsa,
partner, private equity, business, società, gruppo, investment, milioni di fatturato...). Tra le specificità negative vi sono forme grafiche relative ai rapporti di lavoro e alle
rivendicazioni sindacali (lavoratori, operai, sindacati, Cgil, sciopero, accordo, ore, protocollo, precari, contratto...).
L’analisi delle specificità della Repubblica porta a considerazioni piuttosto
simili a quelle fatte per il Manifesto. Sono sovra-utilizzate le forme grafiche relative alle condizioni e alle rivendicazioni dei lavoratori, mentre sono sotto-utilizzate
quelle più tecniche o legate alla formazione professionale. Questo fatto smentisce
quanto avevamo ipotizzato nel secondo capitolo, e sembra delineare, come abbiamo accennato prima, un cambiamento nella linea editoriale di questo quotidiano
rispetto all’anno precedente.
Tra le specificità positive del Sole 24 Ore troviamo termini legati al mondo
delle professioni (professioni, professionisti, ragionieri, albo unico) e diverse espressioni tecniche, ma di ambito più giuridico che economico (decreto, requisiti, procedura, soggetti, obbligo). Tra le specificità negative, invece, vi sono i riferimenti alle
condizioni dei lavoratori e alle notizie di attualità politico-sindacale (sciopero, sindacati, precari, operai, Cgil, protesta, Fiom, metalmeccanici, manifestazione, in piazza,
fabbrica, morti...).
Infine, la Voce.info sembra dedicare molto spazio alle vicende del lavoro, ma da un punto di vista più tecnico e macroeconomico che politico o di cronaca. Tra le
specificità positive, infatti, troviamo contratto unico, delocalizzazione, disuguaglianza, tasso di adesione, fondi pensione, aderenti, qualifiche, disoccupazione, licenziamento. La
maggior parte delle forme grafiche sotto-utilizzate, per altro verso, sono quelle proprie della cronaca delle rivendicazioni sindacali (Cgil, Cisl, Uil, sindacati, sciopero,
accordo, intesa, ore...).
In generale, possiamo concludere che tra i tre quotidiani generalisti non vi sono grandi differenze nei temi trattati. Questo “appiattimento” è probabilmente
dovuto alla prevalenza di articoli di cronaca, che, seppur con diverse sfumature, riportano solitamente i medesimi fatti. In ogni caso, abbiamo notato che il Manifesto
e la Repubblica affrontano le notizie del mondo sindacale più frequentemente del Giornale, e che questo dedica particolare risalto, rispetto a tutte le altre testate, alle
vicende legate ad Alitalia e alla Lombardia.
I tre giornali economici, al contrario, presentano molte differenze tra loro. Il Mondo sembra affrontare i temi del lavoro e del welfare dalla prospettiva del
mondo della finanza e delle grandi imprese. La Voce.info sembra la testata più tecnica, e si concentra molto sui rapporti di lavoro. Il Sole 24 Ore, oltre a dare
maggiore risalto, comprensibilmente vista la cadenza quotidiana, alle notizie di
cronaca, dedica molto spazio al mondo delle professioni. Inoltre, molto frequenti sembrano su questo quotidiano supporti tecnico-giuridici di utilità pratica per i
lettori.