• Non ci sono risultati.

Relazioni semantiche osservate

Nel documento Copisti digitali e filologi computazionali (pagine 159-170)

La riduzione delle dimensioni dello spazio semantico originario permette la rap- presentazione delle distanze fra termini in un grafo bidimensionale. La riduzione delle dimensioni viene eseguita in due fasi: nella prima fase Infomap riduce le dimensioni originali, che sono pi`u di un migliaio, a 300, grazie alla scomposizione in valori singolari (SVD). Nella seconda fase, viene eseguito il multidimensional scaling tramite uno script in R.

Per rappresentare i dati in un grafico bidimensionale, dopo avere effettuato il multidimensional scaling (Baayen, 2008, pp. 146–148), si procede alla parti- zione dei gruppi di termini trovati tramite il metodo k-means (si veda Feng e Manmathan, 2006).

Questo metodo di raggruppamento `e particolarmente efficace per gli antonomi e per i termini strutturabili gerarchicamente. I membri di una coppia antonimica, condividendo contesti molto simili, tendono ad essere raggruppati strettamente fra di loro e a essere invece separati dalle altre coppie. I membri di tassonomie tendono a essere disposti in base alla gerarchia tassonimica e a formare gruppi per ciascuna categoria con sottogruppi organizzati in modo significativo.

Gli antonimi stabiliscono sia relazioni sintagmatiche che paradigmatiche. Sul piano sintagmatico, coppie di antonimi appaiono frequentemente nello stesso con- testo. Specialmente in testi filosofici e in opere metalinguistiche, come gramma- tiche e lessici, commentari e scholia, coppie di antonimi sono oggetto di studio.

Sull’asse paradigmatico, gli antonimi compaiono in contesti simili, perch´e esprimono propriet`a opposte degli stessi termini, in particolare quando la cop- pia di antonimi `e costituita da aggettivi che possono occorrere con un piccolo numero di sostantivi.

Per questi motivi, ci si aspetta che i componenti delle coppie antonimiche siano molto vicini nello spazio semantico ridotto. Si osservano relazioni strette per termini di un dominio specifico, come œµψυχος (animato) e ¥ψυχος (inanimato), comunemente usati in testi filosofici e medici, anche se il senso metaforico pu`o essere correlato a un numero limitato di altri domini, come la retorica (ad esempio, un discorso animato o uno stile senz’anima). Rapporti meno stretti sono osservati per coppie di contrari che possono essere usati in qualsiasi contesto, come µέγας e µικρός. Ad esempio, il valore di similarit`a di ¥ψυχος rispetto a œµψυχος `e 0.8, mentre il valore di similarit`a di µικρός rispetto a µέγας `e 0.6. Il valore di similarit`a `

e fornito sempre dallo strumento associate.

Infine, vale la pena notare che le parole polisemiche possono avere contrari differenti, a seconda dei diversi sensi (si veda Fellbaum, 1998a, p. 51). Ad esempio, βαρύς nel senso di “grave”, ha come antonimo Ñξύς nel senso di “acuto”, ma βαρύς, nel senso di “pesante” ha κοàφος fra i suoi antonimi, nel senso di “leggero”.

L’esempio presentato in Figura 7.1 si basa su nove coppie di antonimi sele- zionati arbitrariamente ed elencati in Tabella 7.4. Tutte le parole sono termi- ni ad alta frequenza: il pi`u frequente `e ¢νήρ (uomo) con 51845 occorrenze e il meno frequente `e ¥ψυχος (inanimato) con 2712 occorrenze. Come mostrato nel- la figura, tutte le coppie sono raggruppate correttamente usando il metodo di raggruppamento k-means.

¢νήρ uomo γυνή donna ¥ρσην maschile θÁλυς femminile γλυκύς dolce πικρός amaro œµψυχος animato ¥ψυχος inanimato ¼µερος giorno νύξ notte θερµός caldo ψυχρός freddo λογικός razionale ¥λογος irrazionale Ñξύς acuto βαρύς grave φάος luce σκότος tenebra Tabella 7.4: Antonimia

La coppie sembrano disposte secondo una struttura gerarchica. Il dendro- gramma in Figura 7.2, che `e solo una rappresentazione grafica diversa degli stessi dati (sempre basata su due dimensioni), evidenzia meglio questa struttura.

Una semplice interpretazione di questi dati suggerisce che ¥ρσην (maschio) e θÁλυς (femmina) siano raggruppati con ¢νήρ (uomo) e γυνή (donna) come deter- minazioni di genere dell’iperonimo implicito ¥νθρωπος (essere umano). λογικός (razionale) e ¥λογος (irrazionale) sono implicati da œµψυχος, il termine positivo della coppia antonimica œµψυχος (animato) e ¥ψυχος (inanimato) mentre λογικός (razionale) rappresenta la differenza specifica, in termini aristotelici, di ¥νθρωπος (essere umano). Nella seconda met`a del grafico, φάος (luce) e σκότος (oscurit`a) sono raggruppati con ¼µερος (giorno) e νύξ (notte) a causa della forte associazio- ne tra questi termini. γλυκύς (dolce) e πικρός (amaro), θερµός (caldo) e ψυχρός (freddo), e infine Ñξύς (acuto) e βαρύς (grave), sono raggruppati come percezioni gustative, tattili e auditive, collegate al precedente gruppo di parole relative alle percezioni visive.

Figura 7.1: Raggruppamenti di antonimi

Tassonomie

Anche se la dimensione del TLG non `e grande, le tassonomie di maggior rilievo possono essere facilmente identificate e gli elementi classificati in modo appa- rentemente errato, a volte possono essere spiegati grazie a sensi secondari dei termini.

Quando i termini presi in esame appartengano a paradigmi ben consolidati, i risultati sono soddisfacenti sia per significati concreti, come parti del corpo, parti della nave, parti di edifici, sia per significati astratti, come relazioni famigliari, emozioni o virt`u.

Figura 7.2: Gerarchia di antonimi

In Figura 7.3, basata sui dati di Tabella 7.5, viene mostrato come i termini della tassonomia animale siano disposti nel grafico bidimensionale. La partizione tradizionale in terra, con χερσα‹ος (terrestre) o πεζός (a piedi), acqua, con œνυδρος (acquatico) e aria, con πτηνός (volatile) `e conservata, anche se alcuni casi devono essere discussi. Il significato principale di λαγîς `e la lepre, un animale terrestre, ma il termine `e classificato come uccello. La classificazione errata `e solo appa- rente perch´e λαγîς, come indicato nel LSJ, `e anche “a bird with rough feathered feet, mentioned with the swallow”. Inoltre, `e anche “a kind of sea-slug, Lepus marinus”. Allo stesso modo, στρουθός (passero) `e un uccello ma anche “a flat fish, flounder, Pleuronectes flesus”. Come mostrato nel grafico, στρουθός si trova nel mezzo tra uccelli e pesci. Gli iperonimi θήρ (bestia), Ôρνις (uccello) e „χθύς

θήρ bestia Ôρνις uccello „χθύς pesce

κριός montone γύψ avvoltoio τρίγλη triglia

κύων cane χελιδών rondine σκάρος pesce pappagallo

βοàς bue ¢ετός aquila θύννος tonno

áς maiale πέρδιξ pernice λάβραξ spigola

λέων leone ¢λεκτρυών gallo κέφαλος cefalo

œλαφος cervo κύκνος cigno œγχελυς anguilla

ταàρος toro τέττιξ cicala Ôνος asino ƒέραξ falco †ππος cavallo στρουθός passero ¹µίονος mulo λαγîς lepre Tabella 7.5: Animali

(pesce) sono al centro del grafico. L’insetto volante τέττυξ (cicala) `e classificato come un animale che vola, quindi insieme agli uccelli.

Nell’esempio precedente, i termini sono stati selezionati arbitrariamente. L’ag- giunta, la sottrazione o la sostituzione di parole pu`o modificare i rapporti reciproci fra tali parole, producendo delle classificazioni errate. Nell’esempio corrente, la modifica dei termini pu`o produrre, in particolare, sovrapposizioni tra bestie e uccelli, per la frequente condivisione di caratteristiche (ad esempio rapidit`a o in- telligenza), mentre la classe dei pesci tende a evitare sovrapposizioni con le altre classi.

Per ridurre l’arbitrariet`a nella creazione dell’elenco, `e possibile utilizzare delle cosiddette parole-seme (seed words), cio`e delle parole fortemente prototipiche, per creare la lista di parole per ciascun raggruppamento previsto, prendendo le prime n parole pi`u simili alle parole-seme.

Lo strumento associate individua similarit`a semantiche relative a singole pa- role ma anche a gruppi di parole. Una coppia di parole `e sufficiente per generare una lista di associazioni coerenti. Se le coppie di parole usate come semi sono suffi-

Figura 7.3: Clusters di animali

cientemente contrastive, ci si aspetta che le liste di parole generate si raggruppino senza sovrapposizioni. La regola empirica per scegliere parole-seme significative `e quella di osservare i grafici basati su liste di parole arbitrarie, come visto sopra, e poi selezionare una coppia di termini per ciascun raggruppamento che stia ai margini, facendo attenzione che almeno uno dei termini sia lontano dall’area di sovrapposizione fra i raggruppamenti.

Un esempio dell’applicazione di questo metodo `e mostrato in Figura 7.4. In questo caso, le coppie di parole usate come seme sono state selezionate dal gra- fico precedente, generato con elementi arbitrari (Figura 7.3). †ππος (cavallo) e κύων (cane) sono stati selezionati per gli animali terrestri, ƒέραξ (falco) e πέρδιξ (pernice) per i volatili e, infine, œγχελυς (anguilla) e θύννος (tonno) per gli ani-

mali acquatici. I rusultati forniti dallo strumento associate per ogni coppia di parole-seme sono mostrati in Tabella 7.6.

κύων cane ƒέραξ falco œγχυλος anguilla

λέων leone πέρδιξ pernice θύννος tonno

λύκος lupo Ôρνις uccello κωβιός ghiozzo

œλαφος cervo χελιδών passero γαλεός pescecane

πάρδαλις leopardo ¢λώπηξ volpe „χθύδιον pesciolino

¢λώπηξ volpe πτηνός volatile εÜχυλος succulento

θήρα caccia ¢λεκτρυών gallo κέφαλος cefalo

†ππος cavallo ¢ετός aquila θυννίς tonno femmina

σκύµνος cucciolo di leone λαγîς lepre τίφη imbarcazione

κυνηγός segugio „χθύδιον pesciolino κίχλη pesce di mare

Tabella 7.6: Lista di animali generata tramite parole-seme

Nella prima colonna, che riguarda animali terrestri, si trovano una serie di co- iponimi delle parole-seme †ππος (cavallo) e κύων (cane). θήρα (caccia alle bestie selvagge) appartiene al frame della caccia, quindi agli animali terrestri. La parola condivide anche alcune forme flesse con l’iperonimo θήρ (bestia): θÁρ' e θηρîν. Morpheus, l’analizzatore morfologico, assegnando entrambe le forme a θήρ, fa perdere per quelle occorrenze l’associazione con θήρα.

Nella seconda colonna, che riguarda volatili, si trovano non solo co-iponimi di ƒέραξ (falco) e πέρδιξ (pernice), ma anche l’iperonimo Ôρνις (uccello) e l’ipe- ronimo di questo, πτηνός (animale alato), che include uccelli e insetti volanti. λαγîς, come visto sopra, significa “lepre” ma anche un tipo di uccello, mentre ¢λώπηξ (volpe), presente nella lista delle bestie terrestri, indica anche un grande pipistrello. „χθύδιον (piccolo pesce), nutrimento degli uccelli marini, `e presente sia nella lista degli uccelli che nella lista dei pesci, ma nel grafico `e classificato correttamente come pesce.

Figura 7.4: Clusters di animali generati trmite parole-seme

Infine, nella terza colonna si trovano coiponimi di œγχελυς (anguilla) e θύννος (tonno), ma anche εÜχυλος (succulento), un attributo applicabile al pesce cotto e τίφη, un tipo di insetto ma anche un tipo di imbarcazione.

Il dendrogramma generato su questi dati non ha la stessa coerenza osservata nel dendrogramma generato tramite termini scelti arbitrariamente, ma alcuni raggruppamenti mostrano dei patterns interessanti. In particolare, la coppia ¢ετός (aquila) – λαγîς (lepre) e πάρδαλις (leopardo) – œλαφος (cervo) mostra una forte associazione fra predatore e preda. La tripletta σκύµνος (cucciolo di leone) – θήρα (caccia) – κυνηγός (segugio, cacciatore) conferma l’idea che , all’interno delle categorizzazioni del grafico in Figura 7.5, le relazioni sintagmatiche espresse in

Figura 7.5: Dendrogramma di animali generato tramite parole-seme

frames e scene tipiche (ad esempio: la caccia) possa essere catturata tramite una diversa visualizzazione degli stessi dati.

Le parole-seme sono particolarmente efficaci per generare elenchi di co-meronimi. Tra i domini pi`u produttivi, corrispondenti alle conoscenze tecniche e scientifiche degli antichi greci, sono stati testati con successo: il dominio botanico (usando i semi φύλλον (foglia) e κλάδος (ramo): parti della pianta); il dominio della medi- cina (usando λάρυγξ (laringe) e στόµα (bocca): parti del corpo); il dominio della tecnica nautica (usando πρύµνα (poppa) e πρùρα (prua): parti della nave); tec- nica militare (usando κνηµίς (schiniere) e ¢σπίς (scudo): parti dell’armatura) e tecnica di costruzione (usando κίων (pilastro) e αÙλή (cortile): parti dell’edificio).

La maggior parte delle cinquanta parole generate da questi semi sono meronimi e sono raggruppati senza sovrapposizioni rilevanti.

Come anticipato nell’introduzione di questa sezione, i termini astratti che appartengono a tavole tradizionali, come ad esempio tavole di virt`u, sentimenti o emozioni, possono essere classificati correttamente. La tabella 7.7 elenca le virt`u corporali, psicologiche e spirituali, oggetto di speculazioni filosofiche e teologiche lungo i secoli. L’elenco delle virt`u da raggruppare `e stato generato manualmente. Infatti l’interesse principale era di esplorare gruppi di virt`u che costituiscono paradigmi tradizionali come fede, speranza e carit`a, rispetto ad altre virt`u meno presenti in tavole tradizionali, come la salute fisica.

Come mostrato in Figura 7.6, i raggruppamenti sono chiaramente separati. Sul lato destro del grafico sono concentrate alcune virt`u fisiche, arbitrariamente selezionate tra liste variabili di virt`u fornite dai filosofi. Sul lato sinistro del grafico sono distribuite le sette virt`u della tradizione cristiana, chiaramente distinte nei due gruppi consueti: le virt`u teologali (fede, speranza e carit`a) nella parte alta del grafico e le virt`u cardinali (forza, giustizia, temperanza e prudenza) nella parte inferiore.

¢ρτιότης salute ¢νδρεία forza ¢γάπη carit`a, amore

εÙαισθησία sensibilit`a δικαιοσύνη giustizia ™λπίς speranza εÙεξία allenamento σωφροσύνη temperanza πίστις fede

Øγίεια salute φρόνησις prudenza

Tabella 7.7: Virt`u

Altre categorie astratte testate con successo sono le emozioni, usando come seme le emozioni primarie tradizionali: φόβος (paura), ™λπίς (speranza), χαρά (felicit`a) e λύπη (dolore).

Anche i raggruppamenti di termini astratti, come i gruppi di termini concreti visti sopra, possono mostrare la loro struttura gerarchica, espressa dalla presenza di sottoinsiemi significativi. Ad esempio, in molti esperimenti con diversi gruppi di virt`u, le virt`u civili ™λευθερία (libert`a) e αÙτονοµία (autonomia) sono raggrup-

Figura 7.6: Raggruppamenti di virt`u

pate in un sottoinsieme comune, a causa dell’implicazione logica di αÙτονοµία e ™λευθερία, in quanto l’una presuppone l’altra.

Nel documento Copisti digitali e filologi computazionali (pagine 159-170)

Documenti correlati