• Non ci sono risultati.

Storia di una costruzione: analisi statistica e distribuzionale dell'evoluzione diacronica delle perifrasi gerundivali in italiano.

N/A
N/A
Protected

Academic year: 2021

Condividi "Storia di una costruzione: analisi statistica e distribuzionale dell'evoluzione diacronica delle perifrasi gerundivali in italiano."

Copied!
258
0
0

Testo completo

(1)

Indice

1. Introduzione... 1

2. Fondamenti teorici... 4

2.1. Construction Grammar... 4

2.1.1. La costruzione... 8

2.1.2. I pregi di un approccio costruzionista... 12

2.1.3. Il fondamento cognitivo delle costruzioni... 15

2.1.4. Schematicità e produttività... 17

2.2. Semantica distribuzionale... 21

2.2.1. Il significato: ipotesi distribuzionale... 22

2.2.2. Modello di spazio semantico... 23

2.2.3. Similarità in diacronia... 28

2.2.3.1. Alcuni studi di tipo diacronico... 32

2.3. Sintesi... 34

3. Le perifrasi gerundivali dell'italiano... 36

3.1. Costruzione o perifrasi?... 37

3.2. Costruzione progressiva... 37

3.2.1. Status di costruzione... 37

3.2.2. Storia... 39

3.2.3. Odierne restrizioni e condizioni d'uso... 41

3.2.3.1. Restrizioni morfologiche... 41

3.2.3.2. Restrizioni azionali... 42

3.2.3.2.1. L'azionalità... 42

3.2.3.2.2. Le restrizioni azionali della costruzione... 44

3.2.3.3. Restrizioni semantiche... 44

3.2.3.4. Restrizioni sintattiche... 45

3.2.4. Caratterizzazione semantica... 45

3.2.4.1. Il rapporto con l'aspetto... 45

(2)

3.2.4.1.2. Compatibilità aspettuale... 46

3.2.4.2. Analogie con la statività... 49

3.2.4.3. Il rapporto con gli avverbi... 49

3.2.4.5. Marca durativa o imperfettiva?... 50

3.2.5. Altre costruzioni affini... 53

3.3. Costruzione continua... 54

3.3.1. Status di costruzione... 54

3.3.2. Storia... 55

3.3.3. Caratterizzazione semantica... 58

3.3.3.1. Il rapporto con la telicità... 58

3.3.3.2. Condizionamenti semantici... 61 3.3.4. Andare + gerundio... 62 3.3.4.1. Restrizioni d'uso... 63 3.3.4.1.1. Restrizioni morfologiche... 63 3.3.4.1.2. Restrizioni azionali... 64 3.3.4.2. Evoluzione diacronica... 65

3.3.4.3. Il rapporto con l'aspetto... 66

3.3.5. Venire + gerundio... 67

3.3.5.1. Restrizioni d'uso... 68

3.3.5.1.1. Restrizioni morfologiche... 68

3.3.5.1.2. Restrizioni azionali... 68

3.3.5.2. Caratterizzazione semantica... 69

3.4. Confronto: stare vs. andare/venire... 72

3.5. Domande aperte... 74

4. Corpora diacronici ed estrazione dei dati... 77

4.1. I corpora... 77

4.1.1. Google Books Ngram Corpus... 77

4.1.2. MIDIA... 78

4.2. L'estrazione dei dati... 81

(3)

4.2.2. MIDIA... 81

4.3. Il trattamento dei dati... 83

4.3.1. Google Ngram Corpus... 84

4.3.2. MIDIA... 85

5. Discussione dei risultati conseguenti l'estrazione dei dati... 89

5.1. Analisi statistica: i risultati... 89

5.1.1. Frequenza relativa... 89

5.1.2. Type Frequency... 93

5.1.3. Type/Token Ratio... 97

5.1.4. Curva di crescita... 99

5.1.5. Gli hapax e la partial productivity... 101

5.1.6. Conclusioni... 105

5.1.6.1. Andare + gerundio... 105

5.1.6.1. Venire + gerundio... 106

5.1.6.1. Stare + gerundio... 107

5.2. Descrizione statistica dei tratti semantici... 108

5.2.1. Il soggetto... 109 5.2.2. L'aspetto... 111 5.2.3. L'aktionsart... 114 5.2.4. L'avverbio... 118 5.2.5. Conclusioni... 121 5.2.5.1. Andare + gerundio... 121 5.2.5.2. Venire + gerundio... 122 5.2.5.3. Stare + gerundio... 123

6. La distribuzione dei verbi nelle costruzioni gerundivali... 125

6.1. Distribuzione dei verbi... 125

6.1.1. Andare + gerundio... 125

6.1.2. Venire + gerundio... 127

6.1.3. Stare + gerundio... 129

(4)

6.2.1. I verbi comuni alle tre costruzioni... 131

6.2.2. I verbi condivisi da andare + gerundio e venire + gerundio... 132

6.2.3. I verbi condivisi da andare + gerundio e stare + gerundio... 135

6.2.4. I verbi condivisi da stare + gerundio e venire + gerundio... 136

6.2.5. I verbi ricorrenti esclusivamente nella costruzione andare + gerundio... 137

6.2.6. I verbi ricorrenti esclusivamente nella costruzione venire + gerundio... 140

6.2.7. I verbi ricorrenti esclusivamente nella costruzione stare + gerundio... 142

6.3. Conclusioni... 144

6.3.1. Andare + gerundio... 144

6.3.2. Venire + gerundio... 145

6.3.3. Stare + gerundio... 146

7. Analisi semantica: i risultati... 148

7.1. Lo spazio vettoriale... 148

7.2. Visualizzazione dei risultati... 150

7.3. Valutazione dei risultati... 152

7.3.1. MIDIA... 152

7.3.1.1. Andare + gerundio... 152

7.3.1.2. Venire + gerundio... 162

7.3.1.3. Stare + gerundio... 168

7.3.2. Google Ngram Corpus... 177

7.3.2.1. Andare + gerundio... 177 7.3.2.2. Venire + gerundio... 193 7.3.2.3. Stare + gerundio... 208 7.3.2.4. Il coseno... 227 7.4. Conclusioni... 230 7.4.1. Andare + gerundio... 232 7.4.2. Venire + gerundio... 234 7.4.3. Stare + gerundio... 235 8. Conclusioni... 238 8.1. Andare + gerundio... 238

(5)

8.2. Venire + gerundio... 241

8.3. Stare + gerundio... 243

8.4. Alcune considerazioni generali... 245

9. Bibliografia... 248

(6)

1. Introduzione

Se è vero che il linguaggio è un complesso sistema emergente (Bybee, 2010: 2), la comprensione di qualunque oggetto linguistico non potrà esulare dall'osservazione degli effettivi usi che i parlanti ne fanno. Anche il mutamento, attraverso il quale si costituisce il linguaggio, consiste in una serie di cambiamenti graduali nelle distribuzioni d'uso (id.: 118), o almeno questa è la forma con cui esso si presenta allo studioso. Nel caso dell'osservazione in diacronia, la considerazione delle attestazioni di un oggetto secondo vari parametri statistici, morfo-sintattici e semantici, diventa poi imprescindibile, dato il carattere corpus-based della linguistica diacronica, che analizza gli usi degli elementi linguistici testimoniati dai documenti testuali.

Da queste considerazioni molto generali sul carattere del linguaggio e delle dinamiche che lo contraddistinguono, deriva il particolare assetto di questo studio, che cerca di conciliare diversi metodi al suo interno. Scopo del lavoro è l'analisi in diacronia dell'evoluzione semantica di un gruppo di costruzioni formalmente correlate, le perifrasi gerundivali dell'italiano, in cui un verbo al gerundio si associa ad un verbo come stare, andare o venire, che funge da ausiliare, formando un'unità morfo-sintattica e semantica distinta. L'adozione di un approccio usage-based ha portato all'osservazione delle singole istanze delle costruzioni attraverso i verbi che sono in esse ricorsi in due corpora diacronici di riferimento. Secondo l'ipotesi distribuzionale (Lenci, 2008), forme linguistiche che occorrono in contesti simili possiedono un significato simile: il contesto in cui compare un'espressione linguistica può essere quindi considerato almeno un'approssimazione del suo significato. Inoltre il trattamento del significato in termini di cooccorrenze testuali, oltre ad essere un valido metodo per analizzare la parte semantica, che non è direttamente osservabile, permette di visualizzarla come continua e gradiente, offrendo un'ottima prospettiva per una visione diacronica che necessita di rappresentazioni graduali. Per questo, volendo proporre un'indagine di tipo diacronico, abbiamo adottato un approccio distribuzionale, secondo il modello dello studio di Perek “Using distributional semantics to study syntactic productivity in diachrony: A case study” (2015).

(7)

Questa la struttura del lavoro. Abbiamo dapprima definito alcuni concetti chiave secondo la cornice teorica della Costruction Grammar (Goldberg, 1995), indispensabile per definire in termini usage-based l'oggetto stesso del nostro studio. Abbiamo poi offerto un riassunto dei vari studi che si sono avvicendati sulle perifrasi gerundivali dell'italiano, cercando di delinearne i vincoli sintattici e semantici, la funzione, l'evoluzione diacronica, le specificità che le distinguono l'una dall'altra.

A questo punto sono stati interrogati due corpora diacronici di testi di lingua italiana riguardo alle tre costruzioni. Dal corpus MIDIA (Iacobini, 2009), dopo averle selezionate manualmente e annotate per alcuni tratti semantici giudicati significativi, abbiamo ottenuto 1578 occorrenze totali, che coprono gli anni dall'inizio del Duecento al 1947. A queste sono stati affiancati i dati tratti dal Google Ngram Corpus (Michel et al., 2011), un corpus più grande, anche se più rumoroso, da cui sono state ottenute in modo automatico 305081 occorrenze per gli anni 1550-2009. È stato così costituito il campione su cui abbiamo effettuato il presente studio.

L'analisi dei parametri statistici ci ha permesso di osservare quantitativamente l'evoluzione degli indici che sono giudicati importanti per la produttività di una costruzione argomentale (Goldberg, 2006: 99): Token frequency, Type frequency, Type/Token ratio, crescita dei types in rapporto alla crescita dei token, numero di Hapax legomena relativo al numero di Token. La valutazione dei dati nella loro globalità ci ha permesso di inferire alcune conclusioni sull'effettiva produttività delle costruzioni, sulla loro emersione, sulla loro crisi e sul loro rapporto reciproco.

Segue poi un'analisi di tipo qualitativo, che va a valutare le specificità e le somiglianze tra le tre costruzioni attraverso l'osservazione dei verbi con cui si combinano. Abbiamo considerato la composizione semantica dei raggruppamenti di verbi di intersezione tra le costruzioni due a due e tutte insieme, valutando se fosse presente una certa coerenza semantica tra i verbi che potesse indicare una funzione comune alle costruzioni. Viceversa abbiamo sottolineato la presenza di verbi che si combinano solo e soltanto con una costruzione e che quindi ne rispecchiano una funzione specifica. Sebbene le conclusioni siano frutto di interpretazioni soggettive, la provenienza dei dati dal campione che abbiamo adottato garantisce un margine di affidabilità dovuta all'esistenza

(8)

effettiva di questi insiemi di intersezione.

È stata infine proposta un'analisi di tipo distribuzionale dell'evoluzione dello spazio semantico riferito ad ogni costruzione. Ogni verbo ricorso in ogni perifrasi è stato associato a un vettore di contesti creato da altri due corpora di italiano sincronico, Repubblica e Paisà, con l'assunzione metodologica che il significato dei verbi sia rimasto costante nel tempo. Questi vettori sono rappresentazioni semantiche basate sulla misurazione dei contesti (Lund & Burgess, 1996: 207), a partire dalle quali viene generato uno spazio semantico rappresentabile in due dimensioni, in cui le posizioni relative tra i verbi sono correlate con la loro similarità semantica. Per ogni costruzione, in ogni intervallo temporale considerato, abbiamo ottenuto una rappresentazione visiva dello spazio semantico creato dalle istanze di quella costruzione in quel periodo. Il confronto tra gli spazi semantici relativi ai vari periodi individuati permette l'osservazione dell'evoluzione del significato delle costruzioni. È possibile dunque valutare quali sono i campi semantici privilegiati da una costruzione all'inizio della sua storia e verificare come procede la sua espansione, ovvero in quali direzioni si estende associandosi a quali verbi nuovi. Questo permette di comprendere meglio l'evoluzione della struttura semantica di un oggetto linguistico e consente di testare alcune ipotesi sulla produttività come quelle proposte da Barðdal (2008) e Bybee (2010).

Il presente studio si propone non solo di chiarire le dinamiche di evoluzione nel tempo delle tre costruzioni considerate, ma anche di dimostrare la convenienza dell'adozione delle due cornici teoriche qui scelte, la Construction Grammar e la semantica distribuzionale, che risultano compatibili e tra loro associabili in particolare in un contesto di tipo diacronico. Come siamo stati ispirati in questo dal recente studio di Perek (2016), allo stesso modo ci auguriamo che il nostro lavoro possa esortare all'applicazione in campo diacronico dei metodi e delle teorie più recentemente proposte in linguistica.

(9)

2. Fondamenti teorici

L'analisi che ci proponiamo assume come quadri teorici di riferimento due paradigmi che sempre più spesso si trovano abbinati per spiegare una realtà linguistica sfaccettata ed in costante mutamento, considerando il linguaggio un complesso sistema adattivo, le cui strutture sono emergenti dall'applicazione ripetuta di alcuni processi (Bybee, 2010: 2). Entrambe le prospettive adottano un approccio marcatamente usage-based e considerano il significato non come un'entità discreta, reificata e metalinguistica, ma come una serie di rappresentazioni ricche e basate sull'esperienza, da situare sempre in un contesto determinato linguisticamente, socialmente e cognitivamente (id.: 55). Queste teorie di tipo cognitivo-funzionalista fanno riferimento ad una struttura semantica enciclopedica caratterizzata da effetti di prototipicità (Glynn, in Glynn & Robinson, 2014: 118), mentre non riconoscono la nozione di condizioni sufficienti e necessarie alla rappresentazione del significato e non ammettono una netta divisione tra la sfera semantica del linguaggio e la pragmatica del contesto (id.: 10). In questo scenario, la frequenza è un indicatore molto importante, determinando l'entrenchment, cioè la forza di associazione e la salienza, delle coppie forma-funzione: per questo il sistema linguistico è emergente e interamente dipendente dal contesto (id.: 14-15).

Proprio questo orientamento comune permette di conciliare qui in un unico lavoro lo sfondo teorico offerto dalla Construction Grammar e l'approccio metodologico della semantica distribuzionale corpus-based.

2.1. Construction Grammar

Quest'approccio al linguaggio nasce dagli studi di Adele E. Goldberg (cf. il lavoro del 1995 A Construction Grammar approach to Argument Structure) e si propone di correggere gli errori prospettici della grammatica generativa (cf. il lavoro di Jackendoff The Architecture of Language Faculty), proponendo un'alternativa cognitivamente fondata che osservi l'uso linguistico in contesto. Rifiutando gli apparati derivazionali del generativismo, la sintassi viene considerata essa stessa portatrice di significato secondo

(10)

un'ottica funzionalista (“functionalist usage models” di Bybee, in Hoffman, & Trousdale, 2013: 50) del tipo “what you see is what you get” (Goldberg, 2006: 10). Rispetto all'antecedente strutturalista invece, il sistema semantico feature-based viene integrato con un approccio frame-based che faccia riferimento alla conoscenza enciclopedica (Bybee, 2010: 83).

Dei vari indirizzi di questa teoria che si sono sviluppati, questi sono i punti comuni (Goldberg, in Hoffman, & Trousdale, 2013):

– le costruzioni sono gli oggetti primari di descrizione;

– le costruzioni sono coppie forma-significato, convenzionali e memorizzate come tali, esistenti a vari gradi di complessità e astrazione e organizzate in una struttura gerarchica;

– lo sfondo teorico è non derivazionale, cioè la struttura semantica è direttamente associata alla forma superficiale, senza l'intervento di alcun processo trasformazionale;

lessico e grammatica non sono due componenti distinte, ma costituiscono un continuum di costruzioni: le costruzioni lessicali (ad esempio la parola cane) e quelle sintattiche (ad esempio la costruzione transitiva Sogg V Ogg) appartengono alla stessa tipologia di oggetto, cioè sono collegamenti tra una forma e un significato, ma differiscono per complessità interna e per specificazione della forma fonologica (nell'esempio, la costruzione transitiva è strutturalmente più complessa perché contiene più componenti che sono schematizzate attraverso posizioni vuote da riempire con altre costruzioni lessicali che rispettino i vincoli imposti da quelle posizioni, mentre la costruzione lessicale cane ha una struttura più semplice ed è interamente specificata a livello lessicale);

– le regolarità presenti nell'uso del linguaggio sono rappresentate dalle costruzioni schematiche: è possibile generalizzare a partire da diverse istanze linguistiche per formare in memoria una costruzione più astratta con slot1 aperti;

1 Gli slot di una costruzione sono le posizioni occupate dai suoi componenti e catturano le

(11)

– a parte il grado di specificità/schematicità2, le espressioni istanziate e i pattern

più generali corrispondenti hanno lo stesso carattere basico, trattandosi sempre di costruzioni. La conoscenza linguistica del parlante riguarda quindi sia gli elementi specifici che le generalizzazioni sopra questi. In particolare, i singoli pattern specifici vengono immagazzinati se sono sufficientemente frequenti, anche nel caso in cui siano istanze pienamente regolari e predicibili di altre costruzioni (Goldberg, 2006: 12);

– la struttura informazionale è un aspetto del significato di una costruzione: le informazioni circa la focalizzazione dei costituenti, la topicalità, il registro, sono rappresentate a fianco delle informazioni semantiche e possono anche essere discriminanti nel differenziare una costruzione da un'altra (Goldberg, 1995: 7). Semantica, struttura informazionale e pragmatica sono strettamente collegate in quanto funzioni linguistiche che strutturano il nostro sistema concettuale generale. Inoltre, la semantica stessa è basata sul construal di situazioni da parte del parlante, non su condizioni di verità oggettive;

– la memoria linguistica del parlante contiene anche assemblaggi non composizionali, idiosincratici in relazione ai normali pattern produttivi: espressioni idiomatiche lessicalmente complete o con slot più o meno schematici, collocazioni, espressioni prefabbricate. Queste strutture possono essere collegate a costruzioni più generali in gerarchie di ereditarietà, capaci di catturare sia gli aspetti regolari che quelli irregolari di ogni costruzione a qualunque livello di generalità e schematicità. La considerazione delle costruzioni periferiche è fondamentale perché giustifica l'esistenza di costruzioni più astratte nei livelli gerarchicamente più alti;

– la buona formazione di un'istanza deriva dalla soddisfazione di vincoli simultanei di tipo morfologico, sintattico, lessicale, semantico, secondo principi che impongono la compatibilità tra i componenti della struttura, come il principio

2 La schematicità si riferisce al grado di differenziazione tra i membri di una categoria ed è quindi funzione del range di variazione entro una classe (Bybee, 2010: 67). Nel caso di una costruzione, questo parametro sarà inerente alla classe di elementi che potenzialmente possono comparire in uno

(12)

della coerenza semantica e il principio di corrispondenza (Goldberg, 1995: 50). Quando le restrizioni presenti sulla costruzione a livello generale sono violati durante la formazione di un'istanza, l'espressione risulta mal formata. Ad esempio nella costruzione ditransitiva inglese (Sogg V Ogg1 Ogg2 : X CAUSES

Y TO RECEIVES Z) il ricevente (Ogg1) tende per lo più ad essere non

focalizzato e perciò viene spesso espresso da un pronome. Quando questo non accade e troviamo un sintagma nominale in quella posizione, bisogna ricorrere alla struttura alternativa con to (Goldberg, 1995: 92):

*She gave an old man it. vs She gave it to an old man.

Tutti gli approcci costruzionisti considerano ogni coppia costituita da una forma associata a una funzione (cioè a proprietà semantiche e/o pragmatiche) una costruzione, così da offrire un'analisi uniforme dei tratti linguistici più periferici e idiosincratici, così come di quelli più centrali e prototipici, senza alcun ricorso a trasformazioni, derivazioni o elementi vuoti (Hoffmann & Trousdale, 2013: 2).

Le generalizzazioni e i fatti idiosincratici che convivono nel linguaggio vengono unificati sotto la medesima competenza linguistica basata su singoli esemplari e ottenuta tramite il processo cognitivo di categorizzazione (Goldberg, 2006: 45-46). La categorizzazione è un processo di corrispondenza per similarità o identità che si attiva quando degli elementi sono riconosciuti come simili e vengono ricondotti a rappresentazioni già immagazzinate in memoria. Da questo procedimento derivano le categorie su cui si fonda il sistema linguistico, cioè le costruzioni (Bybee, 2010: 7). Le rappresentazioni degli esemplari, tenendo traccia dell'uso che ne viene fatto, permettono inoltre la rappresentazione della gradienza all'interno delle strutture e consentono di spiegare il loro mutamento graduale (Bybee, 2010: 14).

La Construction Grammar si propone di rivolgere gli stessi principi interpretativi verso oggetti molto diversi quanto a schematicità e complessità (o specificazione lessicale), due parametri che descrivono la differenza tra parole e strutture grammaticali (Wullf, in Hoffman, & Trousdale, 2013: 277). Si ottiene così un continuum tra la sintassi e il lessico, in cui strutture argomentali, locuzioni grammaticali, idiomi e parole isolate sono esempi di instanziazioni di costruzioni a diversi livelli di complessità e schematicità. Lo

(13)

spazio costruzionale contiene quindi unità lessicali e grammaticali ad ogni livello di schematicità e costituisce “a non-discrete set of categorization choices available for a specific conceptual domain” (Levshina, Geeraerts & Speelman, 2013: 1).

2.1.1. La costruzione

L'unità fondamentale del linguaggio riscontrabile in ogni livello di analisi grammaticale è la costruzione, così definita da Goldberg (2006: 5): “any linguistic pattern, where some aspects of its form or function is not strictly predictable from its component parts or from other constructions, or fully predictable with sufficient frequency”. Si tratta dunque di coppie costituite da una forma e da una funzione semantica o pragmatica, che sono convenzionalizzate, vengono memorizzate (id.) e possiedono una struttura prototipica a reti associative (Goldberg, 1995: 5). Riportiamo una tabella con alcuni esempi di costruzioni inglesi (Goldberg, 2006: 5):

Una speciale sottoclasse di queste unità sono le argument structure constructions, che costituiscono il collegamento di base tra la forma superficiale e gli aspetti generali dell'interpretazione semantica e rappresentano le varie configurazioni di complementi in cui appaiono i verbi (id.: 7).

(14)

A seconda dell'indirizzo teorico specifico che si sceglie di adottare, cambia la prospettiva da cui le costruzioni vengono considerate. Pur rappresentando in tutte le teorie costruzioniste lo stesso tipo di oggetto, le costruzioni possono apparire come regole che uniscono l'informazione formale e semantica in oggetti linguistici (Fillmore, in Hoffman, & Trousdale, 2013: 112), un tipo particolare di regole di interfaccia (Jackendoff, in id.: 84), mezzi attraverso cui i segni più semplici si combinano in segni più complessi che fungono da type constraints (Michaelis, in id.: 133), strutture conoscitive che guidano specifiche esperienze percettive e motorie che l'utente del linguaggio simula (Bergen & Chan, in id.: 170), coppie simboliche di una forma e di un significato che mostra idiosincrasie strutturali o semantico/pragmatiche oppure dotate di un alto grado di entrenchment (Hilpert, in id.: 458), chunks sequenziali convenzionalmente usati insieme e che a volte possiedono un significato specifico (Bybee, 2010: 36), e così via.

La giustificazione dell'esistenza delle costruzioni argomentali risiede nel fatto che le corrispondenze tra struttura sintattica e significato esistono indipendentemente dai verbi particolari che le istanziano. Evidenza di queste associazioni è portata da diverse verifiche sperimentali, che vanno a confermare l'esistenza di un significato costruzionale con cui si combina quello del verbo. Ad esempio, un esperimento riguarda l'interpretazione in contesti costruzionali di verbi inesistenti (Ahrens, 1994 in Goldberg, 2006: 116). Nel caso della Ditransitive Construction, associata al significato generale di trasferimento, lo studio ha rivelato che i parlanti interrogati, quando verbi inesistenti venivano combinati con questa costruzione, attribuivano al verbo un significato compatibile con l'idea di un trasferimento. Un altro esperimento riportato da Barðdal (2008: 101-118) dimostra l'esistenza di pattern sintattici disponibili per la formulazione di singole istanze: nell'assemblaggio di frasi con verbi sconosciuti presentati come sinonimi di alcuni verbi islandesi, i parlanti islandesi interrogati utilizzano questi verbi target nelle costruzioni sinonime con verbo specificato in cui compaiono normalmente i verbi islandesi simili ai verbi target oppure sulla base di una costruzione schematica e astratta di livello molto generale, cioè la costruzione Nominativo-Accusativo.

(15)

inglese, in cui un soggetto causa il movimento di un oggetto lungo un percorso (Sogg V Ogg Obl: X CAUSES Y TO MOVE Z), permette di giustificare alcuni usi verbali inconsueti. Nello slot verbale di questa costruzione possono ricorrere anche verbi che non implicano a livello lessicale un movimento causato, ma possono significarlo quando compaiono nella costruzione, ad esempio cough 'tossire':

I actually had a moth go up my nose once. I... coughed him out of my mouth.

(bikeforums.net/archive/index.php/t-292132 in Goldberg, in Hoffman, & Trousdale, 2013: 19).

Un altro esperimento (id.: 4) su alcuni nomi inglesi utilizzati come verbi in contesti nuovi dimostra che non è la semantica del verbo in isolamento a determinarne l'interpretazione, visto che l'elemento in questione non esiste nel lessico come verbo ma solo come nome, bensì il contesto costruzionale identifica una scena generale che viene specificata poi in dettaglio dall'affordance dell'oggetto denotato dall'elemento usato stavolta come verbo. Ad esempio, se prendiamo in considerazione il lessema crutch 'stampella' e lo immettiamo nello slot verbale di alcune costruzioni, otteniamo istanze che identificano diverse azioni. Combinato con la costruzione ditransitiva (a), il nuovo verbo implica un movimento di trasferimento di una palla per mezzo della stampella usata come asta per colpirla, movimento diverso da quello realizzato nella costruzione transitiva (b), in cui la stampella si muove direttamente e va a colpire il ricevente dell'azione (ibid.):

(a) She crutched him the ball. (b) She crutched him.

Le costruzioni influenzano quindi in modo diverso le interpretazioni dei verbi nuovi (Kaschak & Glenberg, 2000 in ibid.).

Secondariamente, la prova dell'esistenza di una costruzione come unità del linguaggio è costituita dalla presenza di restrizioni associate a tutta la costruzione a livello globale. Le costruzioni infatti possiedono proprietà olistiche non derivabili dalle proprietà dei costituenti o dalla loro struttura (Booij, in Hoffman, & Trousdale, 2013: 259). Basti pensare alla frequente non composizionalità del significato: almeno parte della funzione semantica della costruzione spesso non è interpretabile come una somma delle proprietà

(16)

semantiche dei suoi costituenti. Caso emblematico è quello delle espressioni idiomatiche, costruzioni lessicalmente specificate, a metà strada tra grammatica e lessico, costituite da porzioni di lessico combinate sintagmaticamente in modo tale da ottenere una nuova struttura con proprietà semantiche e formali associate all'intera costruzione, che devono essere immagazzinate in memoria in corrispondenza di una nuova unità. Un altro chiaro esempio di non composizionalità riguarda le proprietà semantiche delle forme perifrastiche. Ad esempio, nel caso delle perifrasi perfettive in italiano, il significato grammaticale di un tempo composto è una proprietà della struttura come intero, in quanto nella combinazione del verbo avere in funzione di ausiliare con un participio perfetto avere non mostra il suo significato lessicale 'possedere' bensì il significato grammaticale di perfettività, in combinazione con il significato del verbo al participio perfetto (id.: 263).

Esistono inoltre argomenti direttamente associati con la costruzione a livello di frase, a volte imposti sulla semantica dei predicati (Jackendoff in Goldberg, 1995: 220). Le costruzioni sono capaci di supplire alla semantica del verbo con l'aggiunta di argomenti addizionali e dunque la semantica e la sintassi frasali non sono proiettate esclusivamente dal verbo (Boas, in Hoffman, & Trousdale, 2013: 235). Ad esempio, esiste una costruzione in lingua inglese a cui possiamo riferirci con il nome di Way-Costruction: la struttura semantica associata alla forma Sogg [V [(Poss, way) Obl] identifica il movimento del soggetto lungo un percorso segnalato dal sintagma preposizionale (Obl) in un modo o con un mezzo significato dal verbo utilizzato. Questo fa sì che possano reggere il complemento oggetto semanticamente vuoto one's way anche verbi normalmente intransitivi, quindi la costruzione va a modificare la valenza del verbo e ad integrarlo con i suoi argomenti. Ecco un esempio in cui il verbo joke 'scherzare' utilizzato nella costruzione va a significare il mezzo o il modo in cui il movimento avviene (Goldberg, 1995: 202):

Sam joked his way into the meeting.

La frase potrebbe essere interpretata come 'Sam arrivò all'incontro grazie alla propria capacità di scherzare', oppure 'Sam arrivò all'incontro mentre stava scherzando'. Nel caso invece della Caused Motion Construction, prendendo un verbo come sneeze 'starnutire',

(17)

il verbo contribuisce con l'agente, mentre la costruzione può contribuire alla semantica del verbo con i ruoli argomentali tema (Ogg) e goal (complemento di moto a luogo): Mary sneezed the napkin off the table.

Infine, le costruzioni possono essere addirittura migliori predictors del significato complessivo di frase rispetto al verbo: la complessiva cue validity3 di una costruzione ha almeno lo stesso valore della cue validity del verbo ad essa associato, che è invece molto variabile da lessema a lessema (Goldberg, 2006: 113).

2.1.2. I pregi di un approccio costruzionista

I vantaggi dell'adozione di questa teoria sono molti (Goldberg, 1995: 9-21).

Prima di tutto, i sensi verbali implausibili, ammessi per giustificare alcuni usi “idiosincratici” dei verbi, sono eliminati, ottenendo una notevole parsimonia semantica. Per tener conto di prodotti linguistici come Mary sneezed the napkin off the table, dovremmo attribuire a un verbo intransitivo come sneeze 'starnutire' un senso con valenza triargomentale 'far muovere qualcosa lungo un percorso starnutendo'. Il verbo starnutire sarebbe allora ambiguo, essendo contemporaneamente associato al senso più tradizionale e a quello attivato in collocazioni sintattiche del tipo appena visto. Nessuna lingua del mondo a quanto pare possiede però due radici verbali distinte per significare tra due sensi semantici come questi, rendendo dunque implausibile l'attribuzione di tale differenza semantica al lessema verbale in questione. Nella prospettiva costruzionista, invece, il senso del movimento indotto è aggiunto dalla costruzione, senza assumere sensi specifici di verbi distinti per ogni costruzione in cui essi compaiono. Il significato verbale e il significato costruzionale vengono integrati, non esistono sensi verbali addizionali non giustificati, ma gli usi possibili sono determinati dai vincoli presenti sulle costruzioni. La semantica di espressioni composte e i vincoli su di esse sono diversi a seconda del tipo di verbo che ricorre nelle diverse costruzioni, ma queste differenze sono comunque attribuite alle costruzioni, piuttosto che a sensi verbali ad hoc.

Viene poi evitata la circolarità di analisi tipica degli approcci che vedono nella sintassi la

3 Con cue validity si intende la probabilità che un elemento appartenga a una certa categoria, data l'inerenza di un certo tratto a quell'elemento (Goldberg, 2006: 107).

(18)

proiezione di proprietà lessicali (cf. Projection Principle of Government and Binding Theory, Chomsky, 1981). Tentando di predire la sintassi a partire dai ruoli semantici dei costituenti, un verbo ha un senso collegato con n argomenti perché ricorre con n argomenti, così come esso ricorre con n argomenti perché possiede quel significato che richiede n ruoli argomentali. Vi sono invece evidenze che il verbo non determina da solo tutte le strutture argomentali in cui può apparire (ad esempio, il verbo 'calciare' kick può comparire in almeno 8 strutture sintattiche diverse).

Inoltre, il principio di composizionalità è in parte preservato: il significato di una frase deriva dall'apporto della semantica del verbo e della semantica della costruzione schematica, vale a dire la semantica del verbo è associata con una frame-semantic knowledge ed è integrata con una argument structure construction esistente indipendentemente dalle sue singole istanziazioni (Goldberg, 1995: 66). Riconoscere l'esistenza di costruzioni portatrici di significato permette di vedere la struttura semantica di un'espressione come il risultato dell'integrazione del significato dell'elemento lessicale nel significato della costruzione.

Alcune evidenze della convenienza esplicativa delle costruzioni derivano poi dal processing di frase. Le ambiguità lessicali di sensi distinti collegati alla stessa forma, se fraintese, implicano una maggiorazione nel peso del processing rispetto a usi mal interpretati dello stesso verbo in costruzioni diverse. Ad esempio, il lavoro cognitivo per interpretare correttamente il senso di set nelle seguenti frasi è diverso da quello richiesto da load, che è praticamente zero, in quanto non si tratta di un caso di polisemia del verbo, ma semplicemente della ricorrenza dello stesso elemento in due contesti costruzionali diversi:

(a) Bill set the alarm clock onto the shelf. vs Bill set the alarm clock for six. (b) Bill loaded the truck onto the ship. vs Bill loaded the truck with bricks.

Ulteriori evidenze derivano dall'acquisizione linguistica: i bambini sono capaci di riconoscere una correlazione statistica nei dati che ricevono in input e fanno uso dei pattern sintattici in cui hanno sentito usare un verbo per risalire al suo significato (Goldberg. 1995: 124). Inoltre l'uso di un verbo in una particolare cornice sintattica permetterebbe di inferire la pertinenza al verbo di particolari componenti di significato

(19)

associabili a quella struttura sintattica. Attribuendo un significato alla costruzione, è possibile che le cornici sintattiche vengano utilizzate come aiuto per l'acquisizione del significato verbale, senza assumere che ogni uso di un particolare lessema in una differente cornice sintattica implichi un senso diverso del verbo coinvolto.

Per quanto riguarda il trattamento degli elementi idiosincratici, alcuni pezzi di struttura sintattica non convenzionale vengono elencati nel lessico con un significato associato nel formato di costruzioni sintattiche, che possono avere variabili aperte da riempire produttivamente. Le conseguenze di questo sono la memorizzazione nel lessico di strutture sintattiche anche irregolari con il loro significato associato e l'eliminazione della distinzione tra parole e regole. Non esiste più la distinzione tra grammatica e lessico come l'una riguardante tutte le regolarità, l'altro contenente una lista di eccezioni estranee alla grammatica, ma solo una differenza di produttività4 nel lessico, che

contiene alcuni pezzi idiosincratici meno produttivi, altri più schematici con variabili da riempire (Jackendoff, 2008: 8).

Evidenziamo adesso quali di questi vantaggi contraddistinguono la visione proposta dalla Construction Grammar in riferimento ad alcune alternative principali.

Rispetto ad un approccio di tipo derivazionale, la struttura semantica è associata direttamente alla forma superficiale, si trova in correlazione con essa ed è basata sul construal di situazioni da parte del parlante (Goldberg, in Hoffman, & Trousdale, 2013: 16). Ogni configurazione sintattica è portatrice di significato indipendentemente dalle parole in essa contenute, come si deduce assumendo che ogni distinzione formale ne implichi una sul piano del significato, sia esso semantico o pragmatico (“Principle of No Synonymy of Grammatical Forms”, Goldberg, 1995: 3). Il collegamento tra semantica e sintassi avviene proprio a livello dei ruoli argomentali: la semantica associata a una costruzione definisce una cornice semantica e il verbo che si va a combinare sintatticamente con essa deve inerentemente designare un particolare aspetto saliente di quel frame e specificarlo ulteriormente attraverso la propria struttura semantica (Goldberg, 1995: 65).

4 La produttività di una costruzione è una proprietà della categoria formata sulle posizioni aperte della costruzione stessa e consiste nella probabilità che una costruzione si estenda a un nuovo elemento

(20)

Anche una teoria interamente lessicale sarebbe però inadeguata. Come testimoniano le evidenze citate sopra, esistono infatti, indipendentemente dalle singole istanziazioni, costruzioni schematiche lessicalmente aperte, associate ciascuna a una famiglia di sensi strettamente collegati che derivano da gruppi di istanze (Goldberg, 1995: 226). Queste unità si formano attraverso la schematizzazione, un processo grazie al quale i tratti comuni a un insieme di espressioni vengono astratti da esse e memorizzati in uno schema, cioè in una costruzione, sia a livello di lessico che di costruzioni argomentali. Proprio a partire dalle singole istanze emergenti dall'uso si formano quindi le unità linguistiche che costituiscono il linguaggio. La grammatica dunque non è un inventario di lessemi sempre uguale a se stesso, ma è emergente in quanto è costituita da strutture simboliche (costruzioni) che emergono da eventi d'uso concreto attraverso questo processo di schematizzazione (Broccias, in Hoffman, & Trousdale, 2013: 193).

Quanto ai limiti degli approcci più tradizionali, ricordiamo che quasi tutte le espressioni, quando vengono interpretate nel contesto in cui si trovano, sono in un certo grado non composizionali. La composizionalità è un concetto gradiente, in quanto ogni elemento porta un contributo diverso in ciascuna costruzione in cui compare (Wullf, in id.: 3). Le costruzioni perciò sono tutte in una certa misura idiomatiche, anche se gli effetti di variazione sono osservabili in modo migliore in costruzioni schematiche e complesse. La Construction Grammar si conferma un punto di vista affidabile anche per tener conto di questi effetti di non composizionalità che caratterizzano il linguaggio.

2.1.3. Il fondamento cognitivo delle costruzioni

Le costruzioni, qualunque sia il loro grado di schematicità, non sarebbero altro che generalizzazioni rispetto a diverse istanze memorizzate, cioè “clusters of cases in an associative memory” (Goldberg, 1995: 139). Secondo Bybee (2010), la memoria sarebbe organizzata attraverso unità di processing chiamate chunks: le costruzioni sarebbero chunks sequenziali convenzionalmente utilizzati insieme. Il chunking è il processo che produce queste unità e si riferisce all'abilità cognitiva generale di costruire strutture ricorsivamente, generando l'organizzazione gerarchica della memoria (id.: 33-34). Esperienze linguistiche che ricorrono in sequenza con sufficiente ripetizione aderiscono

(21)

l'una all'altra andando a formare unità più complesse. Da questa proprietà si formano le costruzioni: sequenze di parole o di morfemi ripetute vengono “impacchettate” insieme a livello cognitivo e in seguito la sequenza viene recuperata come una singola unità e non come una sequenza di elementi distinti.

La frequenza con cui due o più parole vengono usate insieme ha dunque un impatto sulle proprietà delle parole stesse (id.: 25). Se la sequenza è abbastanza frequente per stabilirsi come unità di processing, essa diventa una costruzione (ibid.). Per questo esistono costruzioni completamente regolari sia sul piano semantico che formale, la cui sequenza di morfemi o parole viene tuttavia recuperata dalla memoria come un'unica unità a causa dell'alta frequenza della combinazione (Bybee, in Hoffman, & Trousdale, 2013: 55). La costruzione acquista statuto cognitivo autonomo solo attraverso la ripetizione, in quanto la coesione dei chunks che la formano è basata sulla frequenza di cooccorrenza dei costituenti. La grammatica stessa, che è l'organizzazione cognitiva dell'esperienza, si forma attraverso la ripetizione di certi pattern linguistici nell'uso di una lingua (id.: 49). Le costruzioni derivano da processi cognitivi che si ritrovano non solo nel linguaggio ma in tutte le sfere della cognizione umana. Accanto al chunking, la cui evidenza deriva da mutamenti fonetici (Bybee, 2010: 41), che raggruppa e fonde insieme unità più piccole in un'entità sovraordinata, troviamo la categorizzazione, il rich memory storage, l'analogia e le cross-modal association (id.: 7-8). La categorizzazione è forse il procedimento più importante in quanto interagisce con tutti gli altri e dà luogo alle strutture del linguaggio. Si tratta di un processo di astrazione sopra le singole istanze, che sviluppa porzioni schematiche nelle costruzioni basandosi probabilisticamente su somiglianza e frequenza (id.: 78). La categorizzazione riconduce a oggetti di cui si è già avuta esperienza altri elementi riconosciuti come simili o uguali e permette la creazione di categorie più generali, raggruppando fra loro elementi simili. L'interazione di questa con il chunking conferisce poi alle costruzioni diversi gradi di composizionalità, portando a riduzioni fonetiche e alla parziale perdita di analizzabilità.

Il rich memory storage si riferisce all'immagazzinare in memoria i dettagli dell'esperienza linguistica (cioè la forma fonetica, i contesti d'uso, le inferenze, il significato associati agli enunciati). Attraverso la categorizzazione poi questi pezzi di

(22)

informazione mnemonica sono abbinati alle rappresentazioni esistenti, che sono dunque ricche di dettagli. Questa memoria è strutturata in esemplari costruiti da occorrenze di linguaggio considerate identiche e sulla cui rappresentazione cognitiva ogni esperienza linguistica successiva può avere un impatto.

Quanto all'analogia, essa rappresenta quel procedimento che consente la creazione di nuove istanze sulla base di quelle sperimentate in precedenza. Le estensioni analogiche consistono nell'uso di un nuovo item in un pattern esistente basato su uno specifico esemplare immagazzinato in memoria che funge da modello in virtù di somiglianze strutturali o semantiche (Barðdal, 2008: 2-3). Essa richiede la categorizzazione, in quanto prima di poter formare nuove enunciazioni a partire da un elemento è necessario che esso venga categorizzato.

Infine, le cross-modal association rappresentano i legami cognitivi tra oggetti linguistici diversi come forma e significato e consentono la formazione delle costruzioni in quanto coppie di una forma e di una funzione. Inoltre spiegano il fatto che esperienze che ricorrono spesso insieme tendono ad essere associate sul piano cognitivo (Bybee, 2010: 8).

2.1.4. Schematicità e produttività

Abbiamo visto che esistono istanze grammaticalizzate di costruzioni che sono parzialmente “lexically filled” in un continuum di schematicità (Goldberg, 1995: 192). Proprio la schematicità degli slot di una costruzione permette a procedimenti analogici di intervenire: più i suoi componenti sono flessibili e schematici, più essa è produttiva. L'uso di un nuovo elemento in un pattern esistente è basato su specifici esemplari immagazzinati in memoria secondo un processo di analogia item-based che dà luogo alla costruzione stessa e la cui probabilità cresce con l'aumentare della type frequency (Bybee, 2010: 63-64). La type frequency è un indice statistico che identifica il numero di tipi diversi appartenenti a una categoria che possono ricorrere in un certo contesto. Ad esempio, nel caso della costruzione ditransitiva, tutti i distinti predicati che possono saturare lo slot verbale della costruzione ammontano insieme alla type frequency della costruzione ditransitiva relativamente a quello slot. Di solito ci si riferisce alla type

(23)

frequency relativa, cioè osservata in un corpus di riferimento. Questo parametro non è da confondersi con la token frequency, che identifica invece le occorrenze totali di un tipo specifico oppure di tutti i tipi di una costruzione in un testo o in un corpus (Barðdal, 2008: 27). Esemplificando meglio la distinzione, in una frase come il mio cane è un vecchio cane contiamo 7 token, ma 6 type, in quando la parola cane ricorre due volte. La type frequency è un indicatore fondamentale per la produttività di una costruzione. Basti pensare che l'aumento dell'applicazione di procedimenti analogici a una costruzione, che generano nuove istanze sul modello di quelle già sperimentate, è visibile attraverso un aumento della sua type frequency. Inoltre, più questo parametro è alto, più la costruzione è astratta e schematica, copre un numero elevato di istanze ed è maggiormente saliente, quindi possiede molti tipi disponibili come modelli per estensioni analogiche. Essendo la produttività di una costruzione legata alla precedente esperienza del parlante con la stessa, la produttività sintattica è certo collegata ad un'alta type frequency.

Le nuove estensioni risultano accettabili a seconda di quanto esse si conformano ai vincoli semantici e morfologici dei raggruppamenti di casi esistenti (Goldberg, 1995: 192). Si tratta di estensioni locali innescate da gruppi di forme altamente collegate, che danno luogo a una “family resemblance structure” (Bybee, in Hoffman, & Trousdale, 2013: 55). La produttività, l'accettabilità e persino la comprensione nell'uso di una costruzione derivano da questo procedimento di “similarity matching” (Bybee, 2010: 63-64).

La creatività linguistica permette di generalizzare attraverso diverse istanze per formare costruzioni più astratte con slot aperti che permettano alle costruzioni più specificate di combinarsi tra loro generando gli effettivi enunciati del linguaggio5. La produttività, cioè

la possibilità che una costruzione venga estesa a nuovi item, dipende da come le istanze testimoniate sono distribuite e da come è collegato a queste istanze il potenziale nuovo uso, oltre che dall'esistenza o meno di un'alternativa già pronta che statisticamente anticipi e prevenga la nuova estensione (Goldberg, in Hoffman, & Trousdale, 2013: 24).

5 Per produrre un'espressione anche molto semplice come What did Mina buy Mel? è necessaria questa serie di costruzioni: Ditransitive construction, Nonsubject Question construction, Subject-Auxiliary Inversion construction, VP construction, NP construction, Indefinite Determiner construction, Mina,

(24)

La produttività ha come suoi indici prototipici la type frequency e la schematicità, che si riferisce al grado di dissimilarità tra i membri di una classe e può anche costituire un vincolo alla produttività. Quest'ultima si realizza attraverso analogie locali rispetto ad esemplari esistenti (Bybee, 2010: 102) ed è data dall'interazione dei seguenti parametri: type frequency, token frequency, statistical pre-emption, apertura del pattern (Goldberg, 2006: 99). Del ruolo della type frequency, che rappresenta il numero di tipi di una categoria combinabili con una costruzione, abbiamo già parlato. La token frequency risulta altrettanto importante perché determina il grado di entrenchment delle singole forme, rendendole salienti e disponibili come modelli analogici per nuove estensioni. La statistical pre-emption è invece la testimonianza ripetuta di una parola in un pattern in competizione che va a bloccare l'estensione di altre costruzioni alla parola considerata. Questo indice costituisce un'evidenza negativa indiretta per il parlante e permette di evitare generalizzazioni non giustificabili dei pattern più frequenti, costituendo perciò un vincolo alla produttività. L'apertura della costruzione riguarda la varietà di elementi che ricorrono nel pattern. Il grado di coerenza semantica delle nuove istanze a quelle di cui si è già avuta esperienza risulta un indice importantissimo per la produttività. Le costruzioni che sono state utilizzate con una grande varietà di elementi diversi sono più propense alle estensioni di quelle circoscritte a un gruppo particolare di types (Goldberg, 2006: 99-100). La densità e la coerenza degli elementi nello spazio semantico possono essere espressi dal concetto di coverage, che indica il grado in cui le istanze attestate ricoprono una certa categoria determinata unitamente dalle istanze attestate e dal target della nuova estensione (Suttle & Goldberg, 2011: 1254 in Perek, 2016: 5). Maggiore è il grado in cui le istanze precedentemente attestate riempiono lo spazio semantico che include la nuova istanza potenziale, più facilmente la costruzione sarà estesa a questa. Di produttività nel campo delle costruzioni argomentali si è occupata nel dettaglio Jóhanna Barðdal (2008). Questa proprietà si declinerebbe in tre categorie distinte, cioè la generalità, che implica l'estensibilità, le quali spesso sono concomitanti con la regolarità (Barðdal, 2008: 19-24). Quest'ultima caratteristica farebbe riferimento all'abilità del parlante di capire e generare nuove frasi, il concetto di estensibilità si riferisce invece alla capacità dei pattern sintattici e delle costruzioni argomentali di

(25)

essere estesi a nuovi verbi (id.: 30), mentre la generalità allude alla schematicità e ad un'ampia copertura della costruzione, fino a raggiungere eventualmente lo stato di default (id.: 22). Queste tre accezioni di produttività convivono e interagiscono tra di loro.

In questo studio ci riferiremo alla produttività sintattica in particolare come estensibilità, essendo funzione della type frequency6, della coerenza semantica (cioè della coesione

interna tra gli elementi che compongono la classe di riferimento per uno slot di una costruzione) e dell'inversa correlazione tra questi due fattori (id.: 34). Barðdal, totalmente in accordo con l'approccio usage-based qui adottato, considera come indicatore di produttività anche un'alta token frequency, in quanto la frequenza di occorrenza rende “individual lexical items more entrenched and thus more suitable as models for analogical extensions” e le formazioni analogiche altro non sono che un punto di vista diverso per lo stesso fenomeno della produttività (id.: 34). In particolare, la token frequency starebbe in correlazione inversa con il contributo della type frequency. La type frequency è un indicatore del livello più alto di schematicità a cui esiste ogni singola costruzione e dunque ne indica il raggio semantico e il dominio di produttività, mentre la token frequency è un fattore psicolinguistico importante che identifica singoli elementi che possano fungere da modello quando i parlanti estendono le costruzioni a nuovi usi (id.: 89-96). Secondo Bybee (in Hoffman, & Trousdale, 2013: 55-57), elementi contraddistinti da una token frequency molto alta possono aver formato un chunk autonomo e non attivare più tutto l'exemplar cluster della costruzione corrispondente.

La produttività è gradiente, come suggerisce l'idea di costruzioni che esistono a diversi livelli di schematicità (Barðdal, 2008: 36). Il seguente grafico di produttività (id.: 38) rappresenta la correlazione inversa tra type frequency e coerenza semantica. Da una parte si collocano costruzioni caratterizzate da un'alta type frequency e da un alto indice di schematicità, e dunque di produttività, mentre sull'altro versante troviamo costruzioni contraddistinte da una bassa type frequency e da una scarsa schematicità, che formano raggruppamenti di grande coerenza semantica grazie a procedimenti analogici.

(26)

Tutto questo permette di effettuare alcune previsioni circa la produttività di una costruzione in diacronia. Argument structure constructions che possiedono un'alta type frequency attrarranno per lo più nuovi verbi, mentre una bassa type frequency consentirà un'estendibilità solo minore, ma nel caso in cui nuovi verbi vengano attratti da una costruzione di questo tipo, questo processo avverrà sulla base di un alto grado di sovrapponibilità semantica, cioè sulla base di procedimenti analogici innescati da elementi ad alta token frequency e da una notevole coerenza semantica (id.: 180).

2.2. Semantica distribuzionale

Il problema principale in un'analisi di tipo semantico è che il significato non è direttamente osservabile. Non solo, a volte anche l'identificazione della forma di un elemento linguistico presenta alcune difficoltà, come nel caso di costruzioni argomentali che possono anche non comparire istanziate al livello schematico che le caratterizza, ma trovarsi utilizzate nel linguaggio soltanto in combinazione con i verbi e/o gli argomenti

(27)

che necessitano. In ogni caso, in un corpus, cioè in una collezione di testi linguistici che costituisce una fonte imprescindibile di dati per l'analisi linguistica sincronica e diacronica, sono osservabili soltanto le forme linguistiche, mentre il piano del significato resta totalmente da ricostruire attraverso metodi di vario tipo (Perek, 2016: 5). All'annotazione manuale dei tratti semantici, che porta a giudizi inevitabilmente soggettivi e produce dati categorici, ai test su parlanti nativi che richiederebbero una quantità enorme di giudizi, abbiamo preferito la terza via proposta dalla semantica distribuzionale attraverso elaborazioni computazionali.

2.2.1. Il significato: ipotesi distribuzionale

L'approccio al significato che intendiamo proporre nasce con le riflessioni di Wittgenstein (1953) sul linguaggio e si sviluppa attraverso le successive formalizzazioni di Harris (1954), Weaver (1955), Firth (1957), Deerwester, Dumais, Landauer, Furnas & Harshman (1990) (Turney & Pantel, 2010: 143).

In questa prospettiva, forme linguistiche che ricorrono in contesti simili possiedono un significato simile. Il significato di un elemento non viene considerato come ancorato a un'entità extralinguistica discreta, ma è legato al comportamento combinatorio della forma a cui corrisponde. L'informazione distribuzionale viene considerata come “proxy to word meaning”, ma resta aperta la questione se essa possa essere ritenuta una rappresentazione del significato in sé o soltanto un suo riflesso (Perek, 2016: 26), posizione teorica che si specializza nel caso si assuma una versione debole o una forte dell'ipotesi distribuzionale (correlazione tra contesto e significato vs. relazione causale tra i due elementi) (Lenci, 2008: 13-18).

Assumiamo dunque che i patterns di cooccorrenza delle parole, estratti da corpora testuali, possano costituire una base solida per la rappresentazione del significato (id.: 1). Il grado di similarità semantica tra due espressioni linguistiche A e B è allora funzione del grado di similarità dei contesti linguistici in cui A e B possono comparire, così che almeno alcuni aspetti del significato di un'espressione lessicale sono in correlazione con le proprietà distribuzionali di quell'espressione (id.: 3).

(28)

usage-based, in quanto parte del significato delle parole (non tutto: resta al di fuori dell'osservazione la semantica connessa a contesti extralinguistici) può essere ricavato dall'analisi statistica dei dati linguistici che ne costituiscono la rappresentazione contestuale (id.: 13).

L'informazione quantitativa è poi adatta a identificare in modo oggettivo e affidabile i tratti rilevanti per l'analisi (Jenset, 2014: 3), attraverso misurazioni statistiche di salienza. La statistica è uno strumento che permette di ricavare i tratti contestuali più importanti per caratterizzare il profilo distribuzionale di una parola (Lenci, 2008: 11).

2.2.2. Modello di spazio semantico

Di tutti i vari strumenti distribuzionali a disposizione, che si propongono di modellare il significato “in a bottom-up, automated fashion from large amounts of corpus data” e consentono così di trattare enormi quantità di dati e di evitare di affidarsi a giudizi soggettivi umani, abbiamo scelto un modello di spazio semantico vettoriale (Vector space model), una sorta di estensione delle collocational analysis (Levshina & Heylen, 2014: 6-7), che costituisce la principale implementazione tecnica nell'ambito della semantica distribuzionale degli ultimi anni (Perek, 2016: 7).

Le proprietà distribuzionali delle parole possono essere descritte da modelli di spazi semantici di tipo vettoriale, in cui ogni parola è associata al suo vettore di contesti (Baroni & Gulordava, 2011: 2). Uno spazio semantico possiede spesso molte dimensioni in cui le parole sono rappresentate da punti, la cui posizione è collegata al significato della parola rappresentata. Una volta costruito lo spazio distribuzionale, le relazioni tra gli elementi contenuti sono quantificate matematicamente attraverso la distanza dei punti nello spazio (Lund & Burgess, 1996: 203).

Nello spazio vettoriale semantico sono tracciate le cooccorrenze di ogni parola con tutte le altre parole nel corpus di riferimento, restituendo un “over-all collocational profile” di ciascun elemento (Levshina & Heylen, 2014: 7). Parole con un simile profilo collocazionale sono semanticamente collegate. In pratica, il modello registra le frequenze di cooccorrenza di un set di parole-target con un ampio set di parole-contesto in una finestra di testo intorno alla parola-target (id.).

(29)

Il VSM (Vector space model) fu sviluppato per lo SMART information retrieval system da Gerard Salton e colleghi (Salton, Wong & Yang, 1975) per rappresentare ogni documento di una collezione di testi attraverso un vettore in uno spazio, in cui due punti vicini rappresentano due elementi simili. Modelli di questo tipo estraggono informazioni in modo automatico da un dato corpus, misurando la similarità di significato tra parole, sintagmi e documenti attraverso le frequenze di eventi nel corpus testuale (Turney & Pantel, 2010: 141-143).

Se le prime applicazioni degli spazi vettoriali (Salton et al. 1975) permettevano di misurare statisticamente la somiglianza tra documenti in una matrice term-document, Deerwester et al. (1990) comparano i vettori in riga in matrici di questo tipo per misurare la similarità tra parole, creando una matrice word-context, la cui giustificazione risiede nell'ipotesi distribuzionale (id.: 148). L'altra ipotesi statistica fondamentale alla base delle varie tipologie di spazi vettoriali è la seguente: “statistical patterns of human word usage can be used to figure out what people mean” (Weaver 1955, Furnas et al. 1983. in Turney & Pantel, 2010: 153).

Vediamo ora la procedura nel dettaglio. L'informazione semantica deriva dall'associazione degli elementi di cui si indaga il significato con righe di valori numerici, cioè vettori, basati su rilevazioni di cooccorrenza. Come primo passo viene creata una matrice di cooccorrenza word-context, che presenta le parole-target come righe, mentre le colonne sono costituite dai collocati che permetteranno di valutare il significato delle parole in riga. A titolo esemplificativo, riportiamo una matrice di cooccorrenza tratta da Perek (2016: 8-9):

(30)

Ogni parola è quindi rappresentata da un vettore i cui elementi numerici rappresentano eventi, cioè si riferiscono al fatto che un certo elemento è stato osservato in un dato contesto un certo numero di volte (Turney & Pantel, 2010: 156). I vettori semantici sono dunque “representations that are essentially measures of context” e catturano la similarità delle relazioni tra parole (Lund & Burgess, 1996: 207). In ogni cella della matrice abbiamo il numero di volte che un token di w1 è osservato nel contesto (cioè nella finestra di parole) di un token di w2 nel corpus.

I valori vengono poi “pesati” con lo scopo di attribuire loro la giusta distintività, eliminando gli elementi ad altissima e a bassissima frequenza: le parole più comuni compariranno molto spesso, essendo tuttavia meno informative sulla parola target rispetto alle parole rare, così come le parole con frequenza testuale molto bassa saranno poco informative in quanto ricorrono solo con un set estremamente limitato di parole. Tra le misure di associazione citiamo la Pointwise Mutual Information (Church & Hanks, 1989; Turney, 2001 in Turney & Pantel: 2010, 157), la cui forma matematica consiste nel logaritmo del rapporto tra la probabilità di osservare una parola wi nel contesto cj e il prodotto della probabilità della parola wi per la probabilità del contesto cj.:

(31)

Fig. 2.4: Formula della Pointwise Mutual Information (Turney & Pantel, 2010: 157).

Questo indice statistico permette di stabilire in che misura un collocato ricorre con una certa parola in maniera statisticamente significativa. Un elemento che occorre frequentemente solo con un insieme limitato di parole target semanticamente collegate riceve un peso più alto, risultando un contesto altamente informativo per la parola target, relativamente alla quale possiede un alto indice di associazione.

I contesti meno salienti possono poi essere eliminati tramite tecniche di riduzione dimensionale, come la truncated Singular Value Decomposition (Deerwester et al. 1990 in Turney & Pantel, 2010: 159), che crea un'altra matrice con un numero minore di dimensioni. A questo punto ogni riga della matrice di cooccorrenza è un vettore che rappresenta in modo informativo il profilo distribuzionale di una parola. La similarità tra vettori, secondo l'ipotesi distribuzionale, correla con la similarità semantica tra le parole da essi rappresentate. Questa può essere misurata con funzioni matematiche come il coseno dell'angolo tra due vettori (Baroni & Gulordava, 2011: 2). Il coseno dell'angolo θ tra i vettori x e y può essere così calcolato (Turney & Pantel, 2010: 161):

(32)

Alla misura di similarità si collega quella di densità: un gruppo denso di vettori altamente similari avrà un alto coseno medio (Sagi, Kaufmann & Clark, 2009: 106). Il computo di tutte le similarità a coppie di vettori dà luogo alla matrice di similarità parola per parola.

Lo spazio vettoriale creato è visualizzabile a livello grafico attraverso tecniche di riduzione dimensionale come il Multidimensional scaling, la Correspondence analysis o la Principal component analysis, che consentono di rappresentare visivamente l'informazione semantica distribuzionale ottenuta. Si tratta di tecniche statistiche di esplorazione dei dati per visualizzare le associazioni in essi contenute. La matrice di cooccorrenza è considerata uno spazio semantico multidimensionale in cui le colonne corrispondono alle dimensioni dello spazio, mentre i valori contenuti in ogni cella, che sono frequenze di cooccorrenza, costituiscono le coordinate per posizionare gli elementi in riga secondo la loro distribuzione. La riduzione di questo spazio multidimensionale ad uno spazio più limitato, e dunque rappresentabile, viene operata da queste tecniche matematiche di visualizzazione, che producono mappe semantiche computazionali. Questo procedimento avviene sottolineando le cooccorrenze più frequenti e rappresenta la migliore approssimazione alla struttura generale delle associazioni multiple che esistono in un insieme complesso di dati linguistici (Jenset, 2014: 9-10).

Spendiamo qualche parola in più sul Multidimensional scaling (MDS). Questa tecnica (Kruskal & Wish, 1978, Wheeler, 2005) viene utilizzata per aggregare informazioni circa la similarità (e, conseguentemente, la dissimilarità) tra elementi e per rappresentarla visivamente. Essa permette di ridurre la ricca dimensionalità dei dati a un numero minimo di dimensioni, ignorando quei dati che possiedono un valore informativo minimo e massimizzando la variazione in due o tre dimensioni. Gli elementi da rappresentare vengono collocati in uno spazio grafico a queste dimensioni, preservando la distanza tra loro il più possibile. Le coordinate vengono assegnate ad ogni punto da un algoritmo che lavora sui vettori associati ad ogni elemento (Hilpert, 2011: 448).

In pratica, innanzitutto i dati devono essere raccolti e quantificati, esprimendone i rapporti in termini di frequenze di occorrenza. Poi MDS usa tutte le informazioni

(33)

quantitative disponibili nella matrice di cooccorrenza per determinare la mutua distanza tra i dati, ottenendo come risultato una matrice di distanze. Infine un algoritmo trasforma la matrice di distanze ottenuta in un insieme di coordinate x e y per ogni elemento. Il grafico finale non catturerà le differenze precise tra ogni elemento, ma sarà la miglior approssimazione che può essere ottenuta con un numero ridotto di dimensioni (id.: 449). Tornando adesso al Vector space model, le principali critiche rivolte a questa tecnica sono la mancata considerazione della polisemia, in quanto gli oggetti di osservazione diretta sono l'espressione delle parole e non il loro significato, e il fatto che venga misurata una correlazione semantica indistinta, sotto cui ricadono non solo le relazioni di sinonimia, ma anche di antonimia, iponimia e iperonimia (Perek, 2016: 10). In generale, i limiti dei VSMs sono gli stessi della famiglia delle ipotesi distribuzionali: la questione riguarda l'adeguatezza dei patterns statistici di uso delle parole a rappresentare ciò che la parola effettivamente significa (Turney & Pantel, 2010: 175).

Pregio indiscusso del metodo è invece la creazione di un modello semantico empiricamente testabile. Inoltre, le rappresentazioni lessicali ottenute tramite lo sviluppo di uno spazio semantico sono adeguate alla complessità del linguaggio, in quanto inerentemente basate sul contesto, distribuite (cioè il contenuto semantico di una parola deriva dal contributo globale dei modi in cui essa interagisce ed ha interagito con i vari contesti), quantitative e graduali (anche la salienza dei singoli contesti è un indicatore gradiente importante del significato) (Lenci, 2008: 12).

2.2.3. Similarità in diacronia

In un approccio distribuzionale di tipo non composizionale, basato sul contesto e condotto attraverso l'analisi di corpora (Jenset, 2014: 6), la similarità tra elementi è quantificata da quanto frequentemente essi compaiono negli stessi contesti linguistici, cioè viene ammessa una relazione tra il significato di una parola ed il suo uso. In pratica, la similarità semantica tra due elementi è proporzionale al numero dei collocati frequenti da essi condivisi in un corpus sufficientemente vasto di testi (Perek, 2016: 8).

Se è possibile comparare due elementi e stabilirne la similarità semantica, talvolta può essere utile confrontare invece lo stesso elemento lungo fasi diverse della sua storia, allo

Riferimenti

Documenti correlati

come già emergeva nelle tabelle elaborate da Gini per alcune città europee nel 1909 55 , anche nel caso fiorentino una classificazione delle diverse zone urbane in base alla

Nevertheless, the prestige Italian could display had its source in Latin and this linguistic and literary affinity could not be ignored by early modern English authors – at least

 Lo sforzo di pesca di ogni attrezzo considerato è diminuito rispetto al 2002; per le saccaleve questo valore è sceso mediamente del 25% circa, mentre per gli altri due attrezzi

Numerose meta-analisi (si vedano Calvani & Vivanet, 2016;.. Tamim, Bernard, Borokhovski, Abrami & Schmid 2011; Schmid et al. 2009; Rosen & Salomon, 2007)

Ya se anticipó que la mayor parte de las medidas emprendidas por el gobierno borbónico se centraron en Melfi y que una de las fuentes más interesantes para su estudio es la crónica de

The strategy adopted in this work is to minimize the variational energy by initializing the trial function with the density functional theory (DFT) single determinant ansatz

Nella ricostruzione di Giametta non c’è, quindi, scampo per Nietzsche, soprattutto quello di Jenseit von Gut und Böse, dall’esito mistico, e non solo perché la riflessione

WP1. Sistema di caratterizzazione, di monitoraggio e di miglioramento delle funzionalità di matrici ambientali ed industriali. In particolare, il focus sarà sull’uso di metodi