UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA
FACOLTÀ DI INGEGNERIA
CORSO DI LAUREA IN INGEGNERIA INFORMATICA
Relatore:
Chiar.mo Prof. Paolo Tiberio
Tecniche per la classificazione automatica del cittadino in uno scenario di eGovernment
Agostino Cardella Tesi di Laurea
Correlatore:
Dott. Federica Mandreoli Ing. Riccardo Martoglia
Controrelatore:
Chiar.mo Prof. Sonia Bergamaschi
Anno Accademico 2003/2004
“Tecniche di Semantic Web per la gestione dell’identità digitale e l’accesso alle norme”
(nell’ambito del progetto MIUR-PRIN denominato “e-gov”)
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Ambito di ricerca
Obiettivo
Agevolare la partecipazione del cittadino all’eGovernance Servizio scelto:
Accesso ai testi normativi Personalizzazione:
Reperimento e ricostruzione delle norme valide ed applicabili al cittadino in base alla sua identità digitale
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Obiettivi della tesi
Ontologia Ontologia
Defnizione di un’ontologia di riferimento che include
l’ontologia civica
Sviluppo di un primo prototipo software per la classifcazione del
cittadino nell’ontologia civica
Studio di un procedimento iterativo per l’eventuale richiesta di
maggiori informazioni riguardanti
il cittadino
Semantic Web
“ . . . è un’estensione dell’attuale Web in cui le
informazioni sono strutturate con un senso compiuto, migliorando il lavoro tra le persone ed il computer. ”
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Termini base
Tim Berners-Lee Direttore W3C
Ontologia
Uno schema gerarchicamente strutturato di termini che descrivono un certo dominio e delle relazioni esistenti fra gli stessi.
Ontologia Civica
Una classifcazione dei cittadini basata sulle distinzioni via via introdotte dalle norme che prevedono limitazioni della loro applicabilità.
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Termini base dell’attività di ricerca
Identità digitale del cittadino
La totalità delle informazioni che riguardano il cittadino necessarie ad una sua classifcazione all’interno di
un’opportuna ontologia civica
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Architettura multilivello del Semantic Web
Lo strato delle ontologie OWL
Vantaggi di OWL
Restrizioni locali sul tipo e sul numero di valori delle proprietà
Possibilità di defnire caratteristiche delle proprietà:
transitiva, inversa, simmetrica, funzionale e inversa funzionale
Equivalenza tra classi, proprietà e individui
Defnizione di classi complesse (mediante combinazioni booleane)
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
OWL – Web Ontology Language
Carenze di OWL
Mancanza di elementi per gestire domini concreti e intervalli di valore, eventi e processi.
OWL è disegnato per essere interpretato dagli elaboratori ed ha tre sottolinguaggi di crescente espressività:
Lite
(gerarchie di classifcazione e vincoli semplici)
DL
(maggiore espressività mantenendo la completezza computazionale e la decidibilità)
Full(massima espressività senza garanzie di completezza computazionale e di decidibilità)
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Sottolinguaggi di OWL
Non validità dell’Unique Name Assumption
È possibile che URI diverse modellino in realtà lo stesso concetto
Dal fatto che due individui abbiamo nomi diversi non necessariamente segue che siano individui differenti
Validità dell’Open World Assumption
Ciò che non può essere provato come vero, non deve necessariamente essere ritenuto falso
Mancanza d’informazione = Incompletezza
= Affermazione falsa (nei DB)
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Assunzioni nel Semantic Web
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Obiettivi della tesi
Ontologia Ontologia
Defnizione di un’ontologia di riferimento che include
l’ontologia civica
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
L’ontologia
Scelte progettuali:
Per la defnizione dell’ontologia ci si è limitati all’utilizzo di tutti e soli gli elementi dell’OWL Lite.
Le classi sono state individuate estraendole dal D.P.R. n.382 dell’11 Luglio 1980 e relative modifche
Individui appartenenti alle sole classi
“foglia” della gerarchia.
Questa scelta ha portato alla costruzione di una gerarchia di entità che avesse
condizioni necessarie e sufficienti solo per gli ultimi nodi dell’albero
<owl:onProperty rdf:resource="#ha_contratto"/>
<owl:allValuesFrom rdf:resource="#Universita"/>
<owl:maxCardinality>1</owl:maxCardinality>
<owl:onProperty rdf:resource="#ha_corsi"/>
<owl:maxCardinality>0</owl:maxCardinality>
} }
Si defnisce Personale Tecnico/Amministrativo un individuo che ha come CNS l’aver stipulato un contratto con l’università, che deve anche essere l’unico contratto frmato. Gli individui appartenenti a questa classe non devono tenere corsi.
Tecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Costruzione di una classe
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Obiettivi della tesi
Ontologia Ontologia
Sviluppo di un primo prototipo software per la classifcazione del
cittadino nell’ontologia civica
Particolare attenzione deve essere posta in questo passaggio, in quanto le restrizioni sulle proprietà del tipo owl:allValuesFrom o owl:maxCardinality richiedono
(per loro stessa natura) di realizzare una sorta di
“Mondo Chiuso” LOCALE, aggiungendo automaticamente le chiusure alle proprietà.
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Esempio di classificazione (I)
Raccogliere le informazioni sull’individuo
Tradurle in sintassi Racer (conforme alle krss)
Sottoporle al ragionatore Racer che tenterà di dedurre la classe di appartenenza
dell’individuo nell’ontologia precaricata
Informazioni caratterizzanti il cittadino sono:
avere un titolo universitario
l’essere iscritto ad un corso di studi
tenere dei corsi o delle esercitazioni
avere un contratto con l’università
usufruire di una borsa di studio
1 - “ha titolo universitario”
2 - “ha un contratto con l’università”
3 - “è l’unico contratto firmato”
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Esempio di classificazione (II)
1 - “ha titolo universitario”
2 - “ha un contratto con l’università”
3 - “è l’unico contratto firmato”
Cittadino
Studente Personale
universitario Cittadino con
titolo universitario
Cittadino senza titolo universitario
Dottorando Studente senza laurea
Studente laureato
Personale docente Personale
Tecnico/amministrativo
Ricercatore Professore universitario
Inseriamo le
informazioni:
Ontologia
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Obiettivi della tesi
Ontologia Ontologia
Studio di un procedimento
iterativo per l’eventuale richiesta di maggiori informazioni
riguardanti il cittadino
Risultato classifcazione:
Personale_docente
Classe foglia non raggiunta.
Le sottoclassi disponibili sono:
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Procedimento iterativo
Se la classe risultante non è un nodo terminale della gerarchia (ad
esempio “Personale Docente”), il software chiama nuovamente RACER, che restituisce, per ogni sottoclasse, le CNS per
l’appartenenza alle stesse.
Cittadino
Personale universitario
Personale docente
Ricercatore Professore universitario
Risultato classifcazione: Personale_docente
Classe foglia non raggiunta. Le sottoclassi disponibili sono:
|#Ricercatore| (classe foglia):
L'individuo deve avere valori per la proprietà |#ha_esercitazioni|
Almeno uno degli eventuali valori della proprietà |#ha_contratto| deve appartenere alla classe |#Universita|
Tutti gli eventuali valori della proprietà |#usufruisce| devono appartenere alla classe |#Borsa_di_studio_attivita_post_dottorato|
3 CNS su 8 condizioni caratterizzanti la classe.
|#Prof_universitario| (classe foglia):
Deve avere per lo meno "1" valore per la proprietà |#ha_corsi|
Almeno uno degli eventuali valori della proprietà |#ha_contratto| deve appartenere alla classe |#Universita|
2 CNS su 5 condizioni caratterizzanti la classe.
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Conclusioni
È stato realizzato un primo prototipo software in grado di interfacciarsi con il ragionatore Racer e di classifcare il cittadino nell’ontologia di riferimento in base ad informazioni lette da
appositi fle.
niche per la classifcazione automatica del cittadino in uno scenario di eGovernment
Sviluppi futuri
Reperire le informazioni sul cittadino tramite servizi
standard di accesso alle basi di dati on-line della Pubblica Amministrazione.
Tradurre automaticamente le stesse in sintassi Racer,
operando le necessarie chiusure delle proprietà utilizzate.
Inserire la gestione dell’elemento “Categoria del Cittadino”
estendendo lo strumento “Temporal XML Query
Processor”, sviluppato dall’Unità di Modena all’interno del progetto Nazionale MIUR 2001 “La Dinamica delle Norme nel Tempo: aspetti Giuridici ed Informatici”.
ecniche per la classifcazione automatica del cittadino in uno scenario di eGovernment