Complessit`a di una domanda - Interrogare in linguaggio naturale una base di conoscenza Datalog

Finora si è accennato alle difficoltà relative alla definizione di cosa sia una domanda. Anche se non esplicitamente espresso, tutte le interrogazioni trattate fanno tutte parte di una stessa classe. Tale classe può essere definita come l’insieme di tutte le domande le cui risposte possono essere costruite a parti- re da qualche meccanismo di ricerca dell’informazione contenuta in una base di conoscenza. Esistono tuttavia domande, come quelle riportate nel seguito, che pur non essendo particolarmente difficili nella realtà non possono essere risposte con la questa metodologia. Si considerino le seguenti domande:

What is one plus one?

How many legs does a dog have?

5.5 Complessit`a di una domanda 91

What was the dilemma facing Hamlet?

Ognuna delle precedenti domande è caratterizzata da una particolare richiesta: sia essa di natura matematica, logica, di semplice stima, o d’interpretazione. Risolvere ognuna di queste richieste, impiegando la stessa tecnica utilizzata in precedenza, imporrebbe l’assunzione che l’informazione necessaria a costruire la risposta sia contenuta all’interno della base di conoscenza. Sfortunatamen- te, come discusso nel capitolo riguardante la semantica del linguaggio, un tale approccio è destinato a fallire non solo per l’impresa infattibile di enumera- re la realtà, ma soprattutto perché distante dal principio di sistematicità del linguaggio che guida la sua interpretazione. Quindi per fornire una risposta corretta alle domande riportate sopra la sola conoscenza di informazione non è sufficiente, ma occorre equipaggiare il sistema QA di una forma di ragionamento più avanzata in grado di costruire delle giustificazioni a supporto delle risposte generate.

Per chiarire questo punto si consideri la domanda d’esempio “What color does litmus paper turn when it comes into contact with a strong acid? ”. Per rispondere a tale domanda si può assumere l’esistenza di un qualche documento contenente il seguente passaggio “Litmus is the compound that turns red in acid solution.”. Sebbene attraverso la comune capacità interpretativa è facile definire come risposta alla domanda precedente l’entità red, il passaggio selezionato non è da solo sufficiente a fornire una risposta esaustiva alla domanda posta. Detto in altri termini, l’esempio appena mostrato evidenzia la necessità di impiegare una certa quantità di conoscenza, che può essere associata al senso comune, all’interno del processo d’inferenza.

Nell’esempio in corso, infatti,“ Litmus paper ” in quanto cartina deve essere assimilato ad un generico foglio di carta. Ma “paper ”, essendo parte di un’e- spressione nominale composta, riceve un insieme di caratteristiche derivanti dall’elemento di testa “Litmus”. Qui il primo problema da trattare riguarda la conoscenza dell’esatta misura di similarità che sussiste fra l’entità Litmus paper e l’entità Litmus. La seconda problematica da trattare riguarda invece l’interpretazione di “strong acid ”, contenuto nella domanda, ma che non trova un esatto equivalente all’interno del passaggio selezionato dal sistema come candidato a supporto della risposta. Se nell’esempio in questione non fa molta di↵erenza il livello di acidità della soluzione ai fini della colorazione della cartina tornasole, in generale non è cos`ı facile definire questo tipo di conoscenza e rendere equivalenti le due entità “strong acid ” e “acid solution”.

Rimane infine il problema di esplicitare lo stato di contatto che caratterizza gli elementi presenti in una soluzione, ma quest’ultimo tipo di informazione pu`o essere ricondotto a una qualche forma di ragionamento di senso comune e magari ricavato utilizzando qualche risorsa esterna.

Sulla base delle considerazioni appena trattate, è opportuno identificare alcuni modelli di ragionamenti capaci di semplificare il processo di risposta. Fra questi la possibilità di adottare un approccio composizionale per la definizione della semantica della domanda può essere sicuramente interessante. Tuttavia

rimane da valutare se il ricorso ad un tale approccio sia sempre necessario. In presenza di informazione incompleta infatti è preferibile tralasciare i costrutti della domanda che non ricevono una denotazione e proseguire l’analisi con la conoscenza assegnata ai restanti costrutti. Ma è anche vero il contrario: anche semplici domande come “Who is the wife of the President? ” sono più facili da trattare se decomposte in una serie di sotto-domande. Nel caso spe- cifico riconosce quale entità sia la denotazione della parola President facilita sicuramente il processo di risposta.

In generale altro aspetto problematico riguarda l’eccessiva specificazione che può caratterizzare alcune domande. Per introdurre la nozione di eccessiva specificazione è preferibile utilizzare alcuni esempi. Nella domanda “Who coined the term cyberspace in his novel Neuromancer ? ” il ruolo della frase preposizionale “in his novel Neuromancer ” è semplicemente descrittivo poiché non esistono due entità distinte che hanno coniato il termine “cyberspace” e sono autori del romanzo “Neuromancer ”. Ciononostante la domanda suggeri- sce un vicolo di uguaglianza da imporre sulle entità presenti rispettivamente nei predicati per chi ha coniato il termine e per chi ha scritto il romanzo. Per trattare questo genere di casi si possono definire i seguenti principi:

Analisi della configurazione : alcune proprietà strutturali delle domande sono indipendenti dall’entità coinvolte. L’insieme di domande riguardanti fatti o eventi tende il più delle volte ad essere caratterizzato dalla stessa costruzione. Tuttavia la definizione degli schemi di domanda dovrebbe essere fatta con cautela per non incidere negativamente con le prestazioni del sistema.

Rilassamento dei vincoli : se non sia possibile conoscere a priori la funzione dei modificatori(descrittivi o restrittivi), è opportuno utilizzarli tutti. Nel caso in cui l’insieme di risposta risulti vuoto si può tentare la rimozione di qualche vincolo. Tuttavia occorre sottolineare come a volte una risposta vuota può essere corretta, e che quindi non si debba sempre rimuovere vincoli.

Verifica della risposta : indipendentemente dalle entit`a selezionate per rappresentare le entit`a della domanda occorre sempre garantire che la loro composizione si logicamente valida.

5.6 Sommario e ulteriori riferimenti

Il primo sistema QA presentato in letteratura fu baseball porposto da Green e colleghi in [55]. Dopo quasi un ventennio fu presentato lunar in [149]. In- formazioni sul sistema START1_{, sviluppato da Boris Katz, possono essere}

trovate in [76], mentre i riferimenti per i sistemi lasso e falcono sono rispettivamente [109] e [60]. Gaizauskas e Humphreys presentarono invece il sistema

5.6 Sommario e ulteriori riferimenti 93

QA-LaSIE in [50]. I tentativi di applicare tecniche di apprendimento automa- tico ai sistemi QA sono poi documentati nei lavori di Zhang e Lee [151, 150]. Infine il sistema Watson fu presentanto publicamente nel lavoro [43].

Gli argomenti e la discussione condotta in questo capitolo è largamente ispirata dal lavoro di Prager [122] sui sistemi di risposta per domini aperti. Dagli argomenti trattati è facile concludere che la costruzione di un sistema QA sia in generale una faccenda abbastanza complessa. Sebbene vi siano ormai delle metodologie ben definite, risolvere le problematiche relative alla conoscenza generica e al comune senso di ragionamento richiede ancora ulteriore investigazione. Nel prossimo capitolo sarà presentato un tentativo di risolvere alcuni dei problemi discussi qui sfruttando un approccio di ragionamento dichiarativo basato su programmi logici.

6 ASP : un formalismo per rappresentare e

ragionare sulla conoscenza

Rappresentare e manipolare informazioni di tipo complesso richiede un ade- guato formalismo logico. Oggigiorno la maggior parte delle basi di conoscenza pubblicamente disponibili, come Wikidata, il Knowledge Graph di Google etc., adottano formalismi basati su logiche pi`u o meno complesse.

Fra i formalismi logici presenti in letteratura la programmazione logica disgiuntiva (DLP) è sicuramente una scelta solida, poiché la ricerca e gli stru- menti ad essa associati hanno raggiunto un ragguardevole grado di maturità, che ne permette l’uso anche in applicazioni reali di larga scala.

Lo scopo di questo capito è quello di introdurre i concetti di base riferiti alla sintassi di DLP ed alla sua semantica in termini di Answer-set Program- ming (ASP). Sarà presentata una metodologia di programmazione semplice ed efficace e saranno presentati alcuni esempi di rappresentazione in ASP di problemi computazionalmente difficili, in modo da evidenziare le capacità espressive del linguaggio.

Nel documento Interrogare in linguaggio naturale una base di conoscenza Datalog. Un approccio basato sull'annotazione semantica dei predicati (pagine 96-101)