E sottoproblemi
Per gestire le difficoltà che la comprensione del linguaggio nel suo complesso comporta, si
scompone il compito (task) del NLP in vari sottoproblemi (subtasks) relativamente
indipendenti e consistenti con i livelli di analisi
identificati a livello teorico.
Analisi morfologica
Si analizza ogni parola PRESA SINGOLARMENTE e se ne esplicitano le caratteristiche
grammaticali:
- categoria grammaticale della parola (Part of Speech tagging), come nome, verbo,
aggettivo, ecc.
- Lemmatizzazione o ricerca delle radici, come
“vedere” per “vidi”, “rosso” per “rossi”, ecc.
Analisi morfologica
Deve essere chiarito cosa si intende per parola PRESA SINGOLARMENTE ovvero si deve
affrontare la tokenizzazione del testo:
- mangiamelo è una singola parola o sono tre?
- della è una singola parola o sono due?
- e la punteggiatura?
• Es.: la morfologia di CANI è
CANE (lemma), NOME COMUNE (categoria grammaticale), MASCHILE (genere),
SINGOLARE (numero)
• Es.: la morfologia di DORMÌ è
DORMIRE (lemma), VERBO (categoria
grammaticale), INDICATIVO (modo), PASSATO
REMOTO (tempo), 3 (persona), SINGOLARE
(numero)
Analisi morfologica
Un esempio di analisi morfologica di una frase 1. la (IL ART DEF F SING)
2. storia (STORIA NOUN COMMON F SING) 3. non (NON ADV NEG)
4. educa (EDUCARE VERB MAIN IND PRES 3 SING) 5. a (A PREP MONO)
6. nulla (NULLA NOUN COMMON M SING)
E se la parola è ambigua? Un esempio di analisi possibile:
1. la (IL ART DEF F SING)
2. pesca (PESCA NOUN COMMON F SING)
pesca (PESCARE VERB MAIN IND PRES 3 SING) pesca (PESCARE VERB MAIN IMP PRES 2 SING) 3. non (NON ADV NEG)
4. è (ESSERE VERB MAIN IND PRES 3 SING) 5. un (UN ART INDEF M SING)
6. frutto (FRUTTO NOUN COMMON M SING)
Analisi sintattica
Riguarda le informazioni a livello dell’intera frase e si può impostare secondo due modelli teorici:
- riconoscimento della struttura sintagmatica della frase, cioè dei sintagmi e del modo in cui si compongono tra di loro
- riconoscimento della struttura relazionale della
frase in cui gli interi sintagmi o le singole parole
sono legate tra di loro
Analisi sintattica
La struttura sintagmatica:
- in cosa consiste
- come si rappresenta
Analisi sintattica: sintagmi
La struttura sintagmatica della frase, detta anche struttura a costituenti rappresenta la suddivisione della frase in sottounità più piccole e così via
procedendo in ordine gerarchico:
La frase è un sintagma composto (e.g.) da sintagma nominale + sintagma verbale.
Il sintagma verbale è composto (e.g.) da verbo + sintagma nominale.
Il sintagma nominale è composto da articolo +
sintagma nominale … ecc.
Analisi sintattica: sintagmi
La struttura sintagmatica della frase si
rappresenta tradizionalmente con degli alberi, perchè sono le strutture che meglio consentono di mostrare un ordinamento gerarchico di
elementi.
Quindi il risultato prodotto su una frase da un
sistema di analisi sintattica, detto PARSER, è un
albero sintattico o albero di derivazione.
Analisi sintattica: sintagmi
E se la frase contiene ambiguità sintattiche?
Una frase ambigua permette più di una analisi sintattica, quindi verranno costruite più
strutture per la stessa frase.
Esempio: “Giorgio vide l’uomo dentro il parco con il telescopio”
Analisi sintattica: sintagmi
Analisi sintattica: sintagmi
L’albero di derivazione corrisponde alla seguente interpretazione della frase ambigua:
Giorgio vide l’uomo, Giorgio lo vide dentro il parco, Giorgio lo vide utilizzando il telescopio
Analisi sintattica: sintagmi
Analisi sintattica: sintagmi
L’albero di derivazione corrisponde alla seguente interpretazione della frase ambigua:
Giorgio vide l’uomo, Giorgio lo vide dentro il parco, il parco che ha il telescopio
Analisi sintattica: sintagmi
Analisi sintattica: sintagmi
L’albero di derivazione corrisponde alla seguente interpretazione della frase ambigua:
Giorgio vide l’uomo, l’uomo che stava dentro il parco, e Giorgio lo vide utilizzando il
telescopio
Analisi sintattica: sintagmi
Analisi sintattica: sintagmi
L’albero di derivazione corrisponde alla seguente interpretazione della frase ambigua:
Giorgio vide l’uomo, l’uomo che stava dentro il parco, il parco che ha il telescopio
Analisi sintattica: sintagmi
I quattro alberi di derivazione non esauriscono tutte le possibili strutture che si possono
costruire per la frase.
In questo esempio l’ambiguità è determinata dalla presenza di sintagmi preposizionali che possono essere agganciati praticamente a
qualunque altro sintagma.
Analisi sintattica: sintagmi
Analisi sintattica
La struttura relazionale:
- in cosa consiste
- come si rappresenta
Analisi sintattica: relazioni
La struttura relazionale, detta anche struttura a dipendenze, mostra in che rapporto stanno tra loro le parole della frase tramite le cosiddette relazioni grammaticali o di dipendenza.
In “il cane dorme” cane è il SOGGETTO del verbo dorme.
In “Mario sovente mangia banane” sovente è un
modificatore del verbo mangia, mentre banane è
l’oggetto del verbo mangia.
Analisi sintattica: relazioni
La struttura a dipendenze della frase si
rappresenta tradizionalmente con degli alberi, perchè sono le strutture che meglio consentono di mostrare le relazioni sugli archi che legano le parole.
Quindi il risultato prodotto su una frase da un
sistema di analisi sintattica, detto PARSER, è un
albero sintattico a dipendenze.
Es.: la sintassi della frase “Giorgio ama Maria”
Giorgio
ama
Maria
SUBJ OBJ