• Non ci sono risultati.

Reti con nodi non omogenei e particelle emergenti

Capitolo 5. Modellazione delle lingue naturali e del significato

5.6. Reti con nodi non omogenei e particelle emergenti

Esiste un modello di crescita di una rete semantica che tenga conto degli attributi di ogni nodo? Si ipotizza che, dato un insieme { } di termini, esista una proprietà che fornisce la capacità del termine di generare legami; cioè . Questo termine allora avrà un intorno , la cui cardinalità (il numero di elementi che appartengono all’insieme) sarà pari a . Ad esempio, il termine “dangerous” di WordNet, presenta una rete indiretta di 9 nodi e 14 archi (9 nodi e 18 archi come rete diretta). In Figura 5.2a, è riportata la rete indiretta, visualizzata con Gephi ed il motivo della rete stessa. In questo caso .

Figura 5.2. (a) L’intorno 1 del termine “dangerous”. (b) il motivo corrispondente.

E’ interessante notare che i termini “dangerous”, “grave“,“gravely“ e “seriously“ formano un grafo completo.

94

Figura 5.3. (a) I termini “dangerous“,“grave“,“gravely“ e “seriously“ sono indicati in rosso in ;

una volta estratti formano un grafo completo (b).

Si indicano col nome particelle emergenti raggruppamenti di termini che formano grafi completi. Tale definizione non è esaustiva della molteplicità di manifestazioni che sono state rilevate. Di seguito si riporta qualche esempio e si rileva (dai dati empirici analizzati nel Capitolo 8) una prima non esaustiva classificazione delle particelle emergenti, intorno a due concetti fondamentali:

a. persistenza, deformazione, evoluzione e, in generale modifica della struttura geometrica del grafo perfetto;

b. modello di crescita generativo, che procede con modalità completamente diverse da quelle indicate in letteratura (Reti Random, Small World o reti a Invarianza di Scala, con Crescita Preferenziale), realizzando alle volte singoli collegamenti ad un unico nodo (livello locale della crescita), alle volte collegando strutture ad altre di strutture (livello multidimensionale della crescita).

Se si considera la rete diretta di , si osserva che esistono delle sostanziali differenze tra le due

95

Figura 5.4. Differenze tra reti indirette (a) e reti dirette (b).

Il passaggio da grafo indiretto a grafo diretto comporta sostanziali differenze nei motivi organizzativi della rete semantica, come si nota dalla Figura 5.5.

Figura 5.5. La differenze tra reti indirette e reti dirette si traduce in una differenza tra particelle emergenti

(a) (b).

Il fatto che le reti possano essere dirette, cioè per qualche i e j può accadere che è che le relazioni

non sono invertibili (tranne alcune, per esempio le relazioni antonimiche). Altre differenze sono dovute al modo in cui i termini e le loro relazioni sono organizzati nel lessico e nella semantica. Se si considera il grafo completo di Figura 5.5a come grafo diretto (vedi Figura 5.6a), si osserva che possiede le stesse simmetrie del quadrato, cioè è invariante per rotazione di 90°, 180° e 270°, è invariante per riflessione, ecc. Alcune di queste simmetrie non sono rilevabili se si considera la rete diretta. In particolare,

96

questo accade per le simmetrie di rotazione, mentre solo una simmetria di riflessione (quella rispetto all’asse orizzontale, passante per il centro del quadrato) è mantenuta (Figura 5.6c). In un certo senso, la Figura 5.5b risulta da una rottura di alcune delle simmetrie della Figura 5.5a o 5.6b.

Figura 5.6. (a) il grafo completo della particella emergente composta da 4 termini e le sue differenti manifestazioni attraverso i differenti legami che sono realizzati fra termini (a, b, c). In 3 dimensioni la sua

struttura è quella di un tetraedro (d). In due dimensioni il nodo centrale non sembra avere le stesse caratteristiche dei nodi periferici. In realtà questo effetto è dovuto solo alla visualizzazione in quanto le

caratteristiche dei nodi del grafo dipendono solo ai legami che intrattengono con gli altri nodi.

Si consideri il grafo della Figura 5.2. Questa rete è composta da un nodo padre P (“dangerous”) e 8 nodi figli . I nodi sono del tipo . Il rank del nodo P è . L’approccio usato è per reti indirette, ma è estendibile anche alle reti dirette. Se si analizza il secondo livello di crescita, la rete si presenta molto più complessa della precedente, avendo 224 nodi e 563 archi (Figura 5.7).In tale rete, esistono 6 archi tra coppie di figli ( ).

97

Figura 5.7. Il secondo intorno della rete del termine ”dangerous”. Il termine è rappresentato dal cerchio più grande. I termini “wild“ (in rosso), “saf“ (in verde) e “grave“ (in giallo) sono perfettamente visibili.

Sebbene il termine “dangerous” continui ad essere il più centrale, non è più quello con il maggior grado (Tabella 5.3). Termine Grado wild 99 safe 53 grave 45 tame 27 desperate 27 savage 17 gravely 14 wilderness 12 good 12 wilderness 11 rubber 11 seriously 11 safety 10

98 contraceptive 10 prophylactic_device 10 preventive 10 condom 10 prophylactic 10 contraceptive_device 10 birth_control_device 10 preventative 10 tomb 10 gentle 9 natural_state 9 state_of_nature 9 crazy 9 barbarian 9 idle 9 secure 9 heavy 9

Tabella 5.3. Parole con grado maggiore, nel secondo livello di crescita della rete che parte dal termine “dangerous”.

Nella Tabella 5.3, sono presentati 30 termini , il cui grado è maggiore di quello del termine ”dangerous”, considerato il termine padre di tale rete. In particolare ”wild”, rappresentato in rosso nella Figura 5.7, ha ben 99 archi, ”safe” (rappresentato in verde), ha 53 archi, e ”grave” (rappresentato in giallo), ne possiede 43. La natura della rete è completamente cambiata, in quanto la variabile di Betweenness Centrality è massima per ”wild” (vale 15.158), è alta per ”safe” (9.707), ma è molto più bassa per “dangerous” (5.670) . Se si indicano con i nodi che distano 2 passi dal termine “dangerous”, sono detti nodi nipote.

Gli archi sono del tipo ( ). Ad esempio, nel grafo di Figura 5.8, ci sono nodi nipoti, nodi figli dello stesso figlio F, che realizzano grafi completi di 9 particelle. Ogni nodo ha 8 collegamenti.

99

Figura 5.7. Figli dello stesso figlio che realizzano legami tra loro, creando una particella emergente,

composta da un grafo completo di 9 nodi ( con e senza etichette a e b rispettivamente).

Figura 5.8. Rappresentazione 3d della particella emergente composta da un grafo diretto di nove nodi. Le particelle trovate seguono differenti modelli organizzativi.

100

Per cui, in un ipotetico modello di crescita che tenga conto di un attributo dei nodi, si ha un nodo di partenza P, x nodi figlio F, y nodi nipote . Tra i nodi figlio si realizzano legami del tipo (F,F); tra i nodi nipote, si realizzano altri tipi legami , così come altri legami si possono stabilire tra figli dello stesso

figlio o tra figli di figli differenti. Ulteriori legami si possono creare tra nipoti che realizzano più legami con

figli differenti. Tutte queste forme sono presenti nella rete . Questo processo gerarchico può

essere ulteriormente codificato nella rete , che ora possiede 4881 nodi e 27077 archi.

Definendo questa serie di probabilità è possibile introdurre un nuovo modello di crescita.

In Figura 5.8, è riportata una visualizzazione 3d della particella composta da un grafo completo di nove nodi, rilevata al terzo step di evoluzione della rete, derivata dal termine “dangerous”.

Seguendo uno schema definito nei lavori di Bilotta & Pantano (Bilotta et al., 2011; Bilotta & Pantano, 2011a, b, c) per autoriproduttori in Automi Cellulari, le Particelle Emergenti (PE) sono state classificate in 4 categorie principali: grafi perfetti, indicati con la sigla PE_di tipo_A, grafi imperfetti a causa di rotture di

simmetrie, indicati con la sigla PE_di tipo_B, grafi con simmetrie complesse, indicati con la sigla PE_di tipo_C

e particelle complesse, risultanti da particelle più elementari, indicati con PE_di tipo_D.

Nel Capitolo 8, che riporta un ampio report sperimentale, una rassegna di particelle emergenti sono individuate, utilizzando le 4 categorie di classificazione, risultante dall’investigazione di WordNet. Per cui si avrà, riprendendo l’esempio di questo paragrafo, dangerousPE_di tipo_A_1, oppure dangerousPE_di tipo_D_6, ecc.