• Non ci sono risultati.

Progetto e sviluppo di un'applicazione di Question Answering su Knowledge Base eterogenee

N/A
N/A
Protected

Academic year: 2021

Condividi "Progetto e sviluppo di un'applicazione di Question Answering su Knowledge Base eterogenee"

Copied!
29
0
0

Testo completo

(1)

Progetto e sviluppo di

un'applicazione di Question

Answering su Knowledge Base eterogenee

Università di Modena e Reggio Emilia

Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in

Informatica

Tesi di Laurea di Sonia Moretti

Relatore

Prof. Riccardo Martoglia

(2)

Siti Web che offrono il QA, ma che poggiano su ridotte

Knowledge-Base

Siti Web che utilizzano ampie Knoweldge-Base ma

non implementano il QA

Applicazione per il QA su Knowledge-Base affidabili,

ampie ed eterogenee

Obiettivi della tesi

Consentire all'utente l'inserimento di domande in NL e ottenere direttamente possibili approfondimenti su siti Web differenti,

riguardanti la risposta ottenuta.

Per..

(3)

Sorgenti informative utilizzate

Progettazione dell'applicazione

Implementazione

Risultato

Conclusioni

(4)

Modalità di

interrogazione: Natural Language Nomi Stati

mondiali Parole chiave Parole chiave

Lingua di

interrogazione:

Inglese Inglese Inglese Inglese

Cosa offre: Risposte di carattere scientifico riguardanti tutte le

categorie di sapere

Informazioni geografiche, politiche ed economiche riguardanti gli Stati mondiali

Informazioni riguardanti tutte

le categorie di sapere

Informazioni riguardanti diverse

categorie di sapere

KB scaricabile: No Si, tramite la pagina HTML

Si,

in formato RDF

Si,

in formato RDF

(5)

QA disponibile per diversi argomenti

Lingua: inglese

Knowledge base non

scaricabile

(6)

Informazioni Stati mondiali

Lingua: inglese

Knowledge-Base

scaricabile

(7)

Informazioni riguardanti

molteplici categorie di sapere

Lingua: inglese

Knowledge-Base

scaricabile in RDF

(8)

Informazioni riguardanti diversi categorie di sapere, risultati migliori riguardanti persone e personaggi

Lingua: inglese

Knowledge-Base scaricabile in RDF

(9)

➢ Sorgenti informative utilizzate

Progettazione dell'applicazione

Implementazione

Risultato

Conclusioni

(10)

I database

(11)

Activity Diagram

(12)
(13)

➢ Sorgenti informative utilizzate

Progettazione dell'applicazione

Implementazione

→ Cenni sulla fase di sviluppo

Risultato

Conclusioni

(14)

Creazione dei database

Alla creazione dei database con SQLite in Python

“SQLite: libreria che implementa un leggero database disk-based che non necessita di un processo server separato.”

A partire dai dataset scaricati in RDF

“modello standard per lo scambio di dati sul

Web”

(15)

Traduzione della domanda in NL

Utilizzo URL Request e analizzo la pagina HTML

risultatami

(16)

NLTK – Natural Language Toolkit

'What is the capital of Australia?'

→ tokenizzazione:

['What', 'is', 'the', 'capital', 'of', 'Australia', '?']

→ rimozione stopwords e stemming:

['capital', 'Australia']

(17)

Algoritmi

Scelta del risultato da mostrare per ogni sito Web→ Algoritmo che utilizza criteri di maggior

numero di parole in comune e minor numero di parole totali

es. 'Canberra', 'Australia'

– CIA: 'Australia' →...the-world-factbook/geos/as.html

– DBpedia: 'Canberra', 'Australia' →

.../resource/Canberra,_Australia

(18)

Algoritmi

Scelta delle disambiguazioni per una data

entità → Algoritmo che utilizza criteri di 'forma' di disambiguazione: ' ( ) '

es. 'What is a mouse?' → 'mouse'

– DBpedia: 'Mouse (computing)', 'Mouse (rodent)', 'Mouse (anime)', etc.

– Freebase: 'Mouse (set theory)', 'Mouse (manga)',

etc.

(19)

➢ Sorgenti informative utilizzate

Progettazione dell'applicazione

Implementazione

Risultato

Conclusioni

(20)

...

1° esempio

(21)
(22)
(23)

2° esempio

(24)

...

(25)
(26)

➢ Sorgenti informative utilizzate

Progettazione dell'applicazione

Implementazione

Risultato

Conclusioni

(27)

Conclusioni

È stata realizzata un'applicazione che

consente l'inserimento di domande in NL

in diverse lingue e che sfrutta il QA per

ottenere validi risultati interrogando anche

Knowledge-Base eterogenee, offrendo

inoltre la possibilità di disambiguare il

risultato ottenuto.

(28)

Sviluppi futuri

Possibili ampliamenti:

Numero di Knowledge-Base utilizzate

Algoritmi specifici per il QA

Migliorare la traduzione nella lingua

inglese

(29)

GRAZIE PER L'ATTENZIONE

Riferimenti

Documenti correlati

For example in the tree of two words, and through the traversing of the first word, we put these two words in the same lexical chain as soon as we reach the first common

Additionally, all contact authors of published or completed but not published SRs will be asked the following information: whether or not each of the primary outcomes in the

Il sistema deve essere mantenuto sempre operativo e possibilmente al suo meglio. <<There are no solutions, only tradeoffs>>

This perspective article highlights the importance of establishing such collaborative frameworks using the example of Ocean4Biotech, an Action within the European Cooperation in

Che ha capacità o autorità di esercitare un determinato ufficio, di esprimersi su determinate questioni; Sono descritti diversi modelli delle competenze …… L’ISFOL - Istituto per

As already anticipated, two configurations have been proposed, respectively with m = 0.35 and 0.7 kg/s. The CFD results are in good agreement in terms of both He maximum velocity

The first terminology database of the University of Trieste – TERMit – dates back to 1996 and contains collections belonging to all sorts of specialised domains. This

In summary, our proposal is to preserve all the information of the poten- tial repairs during deployment to allow users to make informed decisions that sidestep known errors, and to