INFORMAZIONI
PERSONALI
Ermelinda Oro
ESPERIENZA
PROFESSIONALE
01/02/2013 – alla data attuale Ricercatrice
Consiglio Nazionale delle Ricerche (CNR) – Istituto di CAlcolo e Reti ad alte prestazioni (ICAR)
Via Pietro Bucci, 8-9 C, 87036 Rende (CS), Italia https://www.icar.cnr.it/
Aree e tematiche di Ricerca:
§ Artificial Intelligence
§ Machine/Deep Learning
§ Natural Language Processing and Understanding
§ Question Answering and Conversational interfaces
§ Semantic Web and Knowledge Graph
§ Web Data/Information Extraction
§ Document Layout Analysis and Understanding
§ Social Networks Analysis
§ Sentiment Analysis / Opinion Mining
§ Knowledge Representation and Reasoning
§ Big/Smart data Processing and Analysis
§ Business Intelligence
§ (Semantic) Business Process Representation and Management
01/02/2012 – 31/01/2013 Assegnista di Ricerca Post Dottorale
Consiglio Nazionale delle Ricerche (CNR) – Istituto di CAlcolo e Reti ad alte prestazioni (ICAR)
Via Pietro Bucci, 41 C, 87036 Rende (CS), Italia Attività di Ricerca
Le attività ricadono nell’ambito dei programmi di ricerca denominati CHRONIOUS-Progetto Europeo N.FP7-ICT-2007-1-216461” e “FSE: Infrastruttura tecnologica del Fascicolo Sanitario Elettronico”. Le principali attività svolte hanno riguardato lo studio, la progettazione e la rappresentazione, mediante apposito linguaggio per la descrizione di ontologie, di uno schema concettuale semantico unificante per basi di dati relazionali
eterogenee. Le tecnologie semantiche sviluppate sono state, inoltre, usate come strumento per la rappresentazione e l’integrazione di dati, servizi e processi nel contesto del patrimonio informativo di SOGEI.
01/09/2011 – 23/01/2012 Borsista Post Doc
Università della Calabria > Consiglio Nazionale delle Ricerche (CNR) – Istituto di CAlcolo e Reti ad alte prestazioni (ICAR)
Via P. Bucci, 41 C, 87036 Rende (CS), Italia http://www.unical.it/portale/
Borsa Post Doc EPR erogata dall’Università della Calabria nell’ambito del Programma Operativo Regionale (POR) Calabria FSE 2007/2013, approvato con decisione della commissione europea n. C (2007) 6711 del 17 dicembre 2007 - Asse IV Capitale Umano - Obiettivo Operativo M.2-Azione d.5.
Contratto di collaborazione ad attività di ricerca ex art. 51 legge n. 449/1997, contratto n. 991, del 08/08/2011 con l’Università della Calabria.
Attività di Ricerca
Titolo della proposta di progetto presentata, risultata vincente della borsa Post Doc:
“Learning and Querying the Web of Objects”. Le attività di ricerca hanno avuto come scopo lo studio e la definizione di approcci, metodi e algoritmi innovativi che consentono di interrogare il Web come in presenza di una base di conoscenza di enormi dimensioni, al fine di abilitare il paradigma Web of Object (WOO), anche detto Web of Concepts (WOC).
01/12/2010 – 31/08/2011 Assegnista di ricerca
Consiglio Nazionale delle Ricerche (CNR) – Istituto di CAlcolo e Reti ad alte prestazioni (ICAR)
Via P. Bucci, 41 C, 87036 Rende (CS), Italia Attività di Ricerca
Le attività ricadono nell’ambito del progetto di ricerca “PIA–Pacchetti Integrati di
Agevolazione Industria, Artigianato e Servizi”, POR FESR Calabria 2007-2013, asse VII – Sistemi Produttivi. Tematiche di ricerca: Information Extraction e Document Classification.
Le principali attività svolte hanno riguardato l’analisi e la definizione di modelli e strumenti per l’estrazione di informazioni da sorgenti non strutturate. Tali attività hanno permesso la progettazione di un sistema per la gestione semantica della conoscenza nelle pubbliche amministrazioni, e la realizzazione di un prototipo con funzioni innovative per l’estrazione automatica di dati e metadati da documenti di vario formato.
02/07/2007 – 30/11/2007 Collaboratrice (Co.Co.Co) Università della Calabria
Via P. Bucci, 30 B , 87036 Rende (CS), Italia
Contratto di Collaborazione Coordinata e Continuativa: Università della Calabria -
Dipartimento di Matematica, prot. n. 613 del 29/06/2007. Periodo della prestazione: 12 mesi da contratto (dal 02/07/2007 al 30/06/2008).
Dimissioni in quanto vincitrice della borsa di studio di Dottorato di Ricerca Ciclo XXIII in Ingegneria dei Sistemi e Informatica presso l’Università della Calabria.
Attività di Ricerca
Le attività ricadono nell’ambito del progetto di ricerca “Progetto SOGEI - Definizione e realizzazione di un dimostratore di un ambiente avanzato di Business and Information Intelligence semantico”. L’attività di ricerca ha riguardato la definizione e realizzazione di un dimostratore prototipale di un ambiente avanzato di Business and Information Intelligence semantico costituito da due livelli: il primo, detto Semantic ETL Layer, permette
l’acquisizione semantica di dati e di informazioni da sorgenti semi e non strutturate; il secondo livello, detto Business Intelligence Layer, abilita l’analisi intelligente delle
informazioni acquisite mediante il livello sottostante sfruttando tecniche di tipo OLAP e Data
Mining.
VALORIZZAZIONE
DELLA RICERCA
15/01/2010 – alla data attuale Socia Co-fondatrice Altilia s.r.l.
Impresa Spin-Off del Consiglio Nazionale delle Ricerche (CNR)
Dipartimento CNR: Ingegneria, ICT e tecnologie per l'energia e i trasporti Piazza Vermicelli, 87036 Rende (CS), Italia
http://www.altiliagroup.com/
La missione di Altilia è sviluppare tecnologie che facilitano l'elaborazione congiunta di dati strutturati e documenti. Le tecnologie di Altilia combinano algoritmi, metodi e approcci di Big Data Analytics, Machine e Deep Learning, Natural Language Processing e
Understanding, Knowledge Representation and Reasoning, allo scopo di ottenere funzioni di intelligenza aumentata grazie alle quali gli uomini e le macchine cooperano per risolvere problemi complessi.
Attualmente, Altilia ha clienti in Italia e all’estero principalmente nei settori fintech ed e- commerce. La società spin-off occupa a tempo indeterminato 25 ingegneri informatici e fattura circa 1,5 milioni di euro.
Brevetti Internazionali Patent number: US 9582494 B2
Object Extraction from Presentation-oriented Documents using a semantic and spatial approach
Inventors: Ermelinda Oro, Massimo Ruffolo Assignee: Altilia s.r.l.
Type: Grant
Date of Patent: February 28, 2017
Promozione e Marketing Partecipazione ad eventi e fiere internazionali aventi l’obiettivo di diffondere idee, nuove visioni e modelli creati dal connubio tra Ricerca e Impresa. Tra di essi:
TEDxCNR 8/10/2016, per la prima volta in Italia coinvolge il CNR. Enterprise Data World (EDW) 2015, Washington, DC - 29/03-3/04/2015. EDW 2014, Austin, TX - 27/04-1/05/2014.
EDW 2013, San Diego, CA - 28/04-02/05/2013. Altilia s.r.l. è partner degli eventi.
ISTRUZIONE E
FORMAZIONE
11/02/2011 Dottorato di Ricerca in Ingegneria dei Sistemi e Informatica SSD ING-INF/05 Ciclo XXIII
Università della Calabria – Dipartimento di Elettronica, Informatica e Sistemistica Via P. Bucci, 41 C, 87036 Rende (CS), Italia
Titolo della tesi di dottorato: “Getting Knowledge from Presentation-Oriented Documents by exploiting Spatial and Semantic Feautures”.
Supervisori: Ing. Massimo Ruffolo e Prof. Domenico Saccà.
Obiettivo principale del dottorato di ricerca: definizione di approcci, metodi, linguaggi e strumenti per l’estrazione e l’interrogazione di informazioni ricavabili da documenti orientati alla presentazione, ovvero pagine Web e documenti PDF, anche usando approcci spaziali e semantici.
Le attività di ricerca realizzate nel corso del dottorato hanno riguardato la definizione di: (i) un modello unico per la rappresentazione di documenti orientati alla presentazione, anche
aventi formato interno diverso, quali HTML e PDF; (ii) tecniche basate su algoritmi euristici e di machine learning per il riconoscimento automatico di tabelle e l’apprendimento di wrapper per documenti PDF e HTML; (iii) linguaggi formali per la descrizione e l’interrogazione di documenti orientati alla presentazione da usare come base per la costruzione di approcci di Web e PDF wrapping; (iv) metodi, linguaggi e approcci per la rappresentazione della conoscenza e il ragionamento automatico in grado di riconoscere concetti e relazioni in documenti testuali per l’estrazione e l’annotazione semantica; (v) un approccio per la gestione semantica dei processi di business fondato su linguaggi di workflow, tecniche di rappresentazione della conoscenza e metodi di reasoning finalizzate alla gestione semantica di processi in vari domini, tra i quali processi clinici.
24/05/2007 Laurea Specialistica in Ingegneria Informatica Università della Calabria
Via P. Bucci, 41 C, 87036 Rende (CS), Italia
Titolo della tesi: “Un linguaggio per l’estrazione di informazioni da documenti non strutturati”.
Relatori: Ing. Massimo Ruffolo e Prof. Domenico Saccà, Correlatore: Ing. Marco Manna.
Il prototipo realizzato è stato testato e sfruttato nell’ambito di progetti di ricerca.
Voto di laurea: 110 e Lode
VISITING RESEARCHER
Marzo 2012 Visiting Researcher
Università di Oxford, Oxford, Inghilterra – Computer Science Department Le attività di ricerca sono state svolte all’interno del gruppo DIADEM (http://diadem.cs.ox.ac.uk/).
Topic della ricerca: “Table Analysis and Understanding”. Principale attività svolta: studio e definizione di una metodologia standard per la valutazione di algoritmi di riconoscimento e comprensione di tabelle in documenti PDF.
Aprile – Giugno 2009 e Febbraio – Marzo 2010
Visiting Researcher
Università di Koblenz-Landau, Coblenza, Germania – Institute for Web Science and Technologies (WeST)
Le attività di ricerca sono state svolte sotto la supervisione del Prof. Steffen Staab
(http://userpages.uni-koblenz.de/~staab/) e in congiunzione con il gruppo di ricerca “WeST - Institute for Web Science and Technologies”. Tale gruppo di ricerca è ampiamente
riconosciuto come uno dei più importanti nel settore delle tecnologie semantiche.
Topic della ricerca: “Approaches for querying and extracting web information”. Tra i risultati di ricerca raggiunti vi sono: la definizione della sintassi e della semantica del linguaggio SXPath, lo studio della complessità del linguaggio stesso, l’implementazione del sistema SXPath, la pubblicazione di un articolo di giornale PVLDB 2010 e di un articolo alla conferenza SEBD 2011.
L’esperienza è stata finanziata mediante voucher per la realizzazione di programmi intensivi di alta formazione rivolti a ricercatori universitari e dei centri di ricerca pubblici calabresi (POR Calabria 2000/2006 - Asse IV capitale umano - Misura 3.7, Azione 3.7.b).
COMPETENZE
LINGUISTICHE
Lingua madre italiano
Lingue straniere COMPRENSIONE PARLATO PRODUZIONE SCRITTA
Ascolto Lettura Interazione Produzione orale
inglese C1 C2 C1 C2 C2
Livelli: A1 e A2: Utente base - B1 e B2: Utente autonomo - C1 e C2: Utente avanzato Quadro Comune Europeo di Riferimento delle Lingue
PROGETTI DI RICERCA
Supporto nella presentazione di diverse proposte di progetto e partecipazione alle attività dei progetti di ricerca approvati, tra i quali:
2018 - 2019 APPIA – Altilia Price and Product Intelligence Advisor POR CALABRIA FESR-FSE 2014-2020
Obiettivi: Creazione prototipale di un sistema innovativo di market and price intelligence per operatori di commercio elettronico. Il sistema fornisce capacità di accedere ai siti di
commercio elettronico, estrarre automaticamente dati, informazioni e commenti dei prodotti, analizzare i dati estratti per produrre dei report in grado di supportare la definizione delle politiche di prezzo e di promozione da parte degli store manager.
Attività svolte e Risultati: La ricercatrice Oro sta svolgendo attività di ricerca che riguardano la definizione di modelli e algoritmi per la comprensione del linguaggio naturale, l’estrazione e l’analisi delle opinioni da testi (quali, ad esempio, post di social media, commenti e recensioni di prodotti nei siti di commercio elettronico e blog) sfruttando approcci di deep learning. Queste attività sono svolte di concerto ad altre attività di ricerca e sviluppo previste dal progetto riguardanti: l’acquisizione automatica delle informazione e commenti sui prodotti, l’analisi e la predizione dei prezzi dei prodotti. Il progetto è in corso e terminerà nel mese di luglio del 2019. Per il primo SAL del progetto, sono stati prodotti gli stati dell’arte delle tematiche di interesse. Si sta procedendo con la fase di definizione dei metodi, dei modelli e degli algoritmi innovativi che costituiranno la base scientifica e tecnologica del prototipo di sistema che si intende costruire.
2015 EASY CAT – Easy Catalogue POR FESR CALABRIA 2007-2013
Obiettivi: Creazione di un sistema innovativo e altamente automatizzato per la costruzione di un catalogo online dedicato ad operatori di vendita al dettaglio. Il sistema ha la capacità di accedere alle informazioni disponibili sul Web, estrarre in modo coerente da diverse fonti le informazioni e le immagini necessarie alla costruzione di un catalogo Web, facilitare la consultazione del catalogo da parte degli utenti.
Attività svolte e Risultati: La ricercatrice Oro ha definito e sviluppato metodi, modelli e algoritmi per l’estrazione automatica e semantica dal Web. I metodi e gli algoritmi definiti hanno prodotto ottimi risultati sperimentali permettendo l'estrazione di una grande mole di dati in parallelo, in ambiente cloud e in maniera performante.
2015 SOCIAL COMMERCE
POR FESR CALABRIA 2007-2013
Obiettivi: Sviluppo di una piattaforma di social commerce capace di sfruttare i meccanismi compartecipativi degli utenti, tipici delle piattaforme di social network, a fini promozionali e analitici in contesti di commercio elettronico.
Attività svolte e Risultati: La ricercatrice Oro si è occupata di attività di ricerca relative ai settori Web information extraction e social network analysis, sviluppando tecniche e modelli necessari per la realizzazione del modulo software denominato Search, Promotional e Recommendation Engine. In particolare, ha definito dei metodi, degli algoritmi e una metodologia per l’identificazione degli influencer e della percezione dei prodotti su reti sociali utilizzando un approccio basato su reti multilayer.
2013 – 2015 INMOTO – INformation and MObility for TOurism – OR2
Programma Operativo Nazionale Ricerca e Competitività (PON R&C) 2007-2013
Progetto Integrato Cultura e Turismo: PON04a2_00029 “DiCeT-InMoTo-ORCHESTRA”
Obiettivi dell’OR2-INMOTO: L'OR è stato diviso in quattro macro aree finalizzate alla realizzazione e sperimentazione di tecniche e strumenti per: (a) l’estrazione di informazioni relative al settore turistico dal Web; (b) la rappresentazione strutturata mediante linguaggi logici della conoscenza turistica; (c) la gestione della terminologia e dell'informazione nel dominio del turismo, quali lessici, glossari e thesaurus; (d) la definizione di tecniche di estrazione di informazioni del settore turistico da social media.
Risultati: La ricercatrice Oro ha partecipato proattivamente alle attività di tutte e quattro le macro aree occupandosi di definire e applicare nuovi linguaggi, metodi, approcci e strumenti per: (i) l'estrazione di informazioni relative al settore turistico in Calabria da siti e-commerce (es.: booking.com, venere.it) e social media (es.: Twitter, Facebook, blog turistici
specializzati), (ii) la rappresentazione ontologica di concetti e terminologia del dominio turistico e (iii) il processamento del linguaggio naturale. Inoltre, si è occupata di integrare e presentare durante le varie fasi di revisione del progetto i contributi provenienti dai vari partner in modo da inquadrare le diverse tecnologie in un unico framework.
2014 CAPTURE DOC
POR FESR CALABRIA 2007-2013
Obiettivi: Gestione automatica di fatture passive in formato di documenti elettronici per studi commerciali mediante tecniche di document understanding, page segmentation, table recognition e data capture.
Risultati: La ricercatrice Oro, dopo aver studiato lo stato dell’arte sulle tecniche di document understanding e correzione di errori OCR, si è occupata di: (i) progettare l’architettura logica e funzionale del modulo di riconoscimento dei dati e correzione di errori OCR; (ii) definire i metodi spaziali e semantici in grado di riconoscere relazioni tra label testuali e valori ottenuti come combinazioni di tecniche di natural language processing e spatial reasoning; (iii) implementare il prototipo del modulo per l'estrazione semantica di informazioni da documenti spaziali e la correzione automatica degli errori.
2012 – 2013 CNR-SOGEI
Ristrutturazione Ontologica del Dizionario Fiscale Integrato: Strumenti e Processi
Obiettivi: Studio e sperimentazione dell’utilizzo delle tecnologie semantiche come strumento per la rappresentazione e l’integrazione di dati, servizi e processi nel contesto del patrimonio informativo di SOGEI. In particolare, gli obiettivi di ricerca sono stati due: (i) la definizione di una ontologia di riferimento che consentisse la creazione di una vista globale, integrata e standardizzata dei modelli di business SOGEI; (ii) la modellazione semantica dei processi di business SOGEI sfruttando l’ontologia definita.
Risultati: L’ontologia di riferimento è stata realizzata attraverso la ristrutturazione ontologica del Dizionario Fiscale Integrato (glossario con definizione dei termini) e sfruttando gli schemi concettuali dei domini applicativi, i quali rappresentavano la mappa del patrimonio
informativo della fiscalità, contenuti nel Repository SOGEI. I processi sono stati modellati in BPMN e annotati semanticamente. La ricercatrice Oro si è occupata di: (i) analizzare il Dizionario Fiscale Integrato; (ii) analizzare e modellare in BPMN i processi significativi indicati da SOGEI; (iii) annotare i processi mediante l’Ontologia derivata dal Dominio Fiscale Integrato e sfruttando Protegè; (iv) definire metodologia per l’elicitazione e annotazione di processi di business.
ATTIVITÀ DIDATTICA
CORSI UNIVERSITARI
Anno Accademico 2019 / 2020 Docente
Università della Calabria - Dipartimento Matematica e Informatica (DEMACS) SSD INF/01 Corso di Laurea Magistrale in Informatica
12 ore di insegnamento del corso Business Intelligence and Analytics (Data Warehouse) Anno Accademico 2018 / 2019 Docente
Università della Calabria - Dipartimento Matematica e Informatica (DEMACS) SSD INF/01 Corso di Laurea Magistrale in Informatica
12 ore di insegnamento del corso Business Intelligence and Analytics (Data Warehouse) Anno Accademico 2012 / 2013 Docente
Università della Calabria - Dipartimento di Ingegneria Informatica, Modellistica, Elettronica e Sistemistica (DIMES)
SSD ING-INF/05 Corso di Laurea Magistrale in Ingegneria Informatica, Facoltà di Ingegneria
6 ore di didattica svolta in qualità di esercitatrice per l’insegnamento di Informatica grafica e analisi di immagini modulo 2: laboratorio di informatica grafica e analisi
Anno Accademico 2011 / 2012 Docente
Università della Calabria
SSD ING-INF/05 Corso di Laurea Magistrale in Ingegneria Informatica, della Facoltà di Ingegneria
(contratto dal 22/03/2012 al 16/06/2012) Didattica svolta in qualità di esercitatrice per l’insegnamento di Informatica grafica e analisi di immagini: laboratorio di informatica grafica e analisi
Anno Accademico 2010 / 2011 Docente
Università della Calabria
SSD ING-INF/05 Corso di Laurea Magistrale in Ingegneria Informatica, della Facoltà di Ingegneria
Didattica svolta in qualità di esercitatrice per l’insegnamento di Linguaggi Formali Anno Accademico 2009 / 2010 Docente
Università della Calabria
SSD ING-INF/05 Corso di Laurea Magistrale in Ingegneria Informatica, della Facoltà di Ingegneria
Didattica svolta in qualità di esercitatrice per l’insegnamento di Linguaggi e Sistemi Formali Anno Accademico 2008 / 2009 Docente
Università della Calabria
SSD INF/01 Corso di Laurea in Informatica, Facoltà di scienze Matematiche, Fisiche e Naturali
Didattica svolta in qualità di esercitatrice per l’insegnamento di Gestione della Conoscenza – Docente
Università della Calabria
SSD ING-INF/05 Corso di Laurea in Ingegneria Informatica, Facoltà di Ingegneria Didattica svolta in qualità di esercitatrice per l’insegnamento di Basi di Dati e Sistemi Informativi sul Web
Anno Accademico 2007 / 2008 Docente
Università della Calabria
SSD ING-INF/05 Corso di Laurea in Ingegneria Informatica, Facoltà di Ingegneria
Didattica svolta in qualità di esercitatrice per l’insegnamento di Linguaggi e Sistemi Formali – Università della Calabria
SSD ING-INF/05 Corso di Laurea in Ingegneria Informatica, Facoltà di Ingegneria Didattica svolta in qualità di esercitatrice per l’insegnamento di Basi di Dati e Conoscenza – Docente
Università della Calabria
SSD INF/01 Corso di Laurea in Informatica, Facoltà di scienze Matematiche, Fisiche e Naturali
Didattica svolta in qualità di tutor per l’insegnamento di Redazione e Presentazione di Progetti Informatici
CORSI DI MASTER
02/03/2016–04/03/2016 Docente
LUISS Business School – Libera Università Internazionale degli Studi Sociali “Guido Carli”
Viale Pola, 12, 00198 Roma (RM), Italia
http://businessschool.luiss.it/adv/marketing-management-retailing-ecommerce
11 ore di didattica svolta in qualità di docente per l’insegnamento di “Statistica e Big Data per il Marketing” nell’ambito del Master “Luiss BS - M3 Master in Marketing Management”
09/07/2014–23/07/2014 Docente
Università della Calabria - Dipartimento di Ingegneria Informatica, Modellistica, Elettronica e Sistemistica (DIMES)
Presso le aule del Centro di Competenza ICT-SUD – Polo Tecnologico UNICAL
20 ore di didattica svolta in qualità di docente per l’insegnamento del modulo B6 – Business Intelligence per il Turismo - sottomodulo B6.1 - Tecniche di estrazione di informazioni da Sorgenti Informative per il Turismo su WEB; casi di studio per il Turismo del corso di formazione per Esperto di Tecnologie per al Valorizzazione del Turismo, in relazione al progetto di ricerca “PON04A2_D – DIGET-INMOTO-ORganization of Cultural HEritage for Smart Tourism and Real-time Accessibility (OR.C.HE.S.T.R.A.)”
09/07/2014–23/07/2014 Docente
Centro di Competenza ICT-SUD – Polo Tecnologico UNICAL
30 ore di didattica svolta in qualità di esercitatrice per l’insegnamento del modulo “Sistemi Informatici per il Turismo” del corso di formazione per Esperto di Tecnologie per al Valorizzazione del Turismo, in relazione al progetto “DIGET-INMOTO-ORganization of Cultural HEritage for Smart Tourism and Real-time Accessibility (OR.C.HE.S.T.R.A.)”
04/04/2013–28/06/2013 Docente
Università della Calabria - Dipartimento di Ingegneria Meccanica, Energetica e Gestionale (DIMEG)
13 ore di didattica svolta in qualità di esercitatrice per l’insegnamento del modulo “MA2.1-3 – Conoscenza biomedica, clinica, sanitaria. acquisizione, rappresentazione, organizzazione, uso” nell’ambito del progetto di ricerca PON01_02934-HEALTHSOAF- Framework di architettura di servizi per la sanità formazione
10/12/2012–25/01/2013 Docente
Università della Calabria – Dipartimento di Elettronica, Informatica e Sistemistica
13 ore di didattica svolta in qualità di esercitatrice per l’insegnamento del modulo “MA2.1-3 – Conoscenza biomedica, clinica, sanitaria. acquisizione, rappresentazione, organizzazione, uso” nell’ambito del progetto di ricerca PON01_02934-HEALTHSOAF- Framework di architettura di servizi per la sanità CUP_B28J11000560005
29/04/2010–28/05/2010 Docente
Università della Calabria - SSD INF/01 Corso di Laurea in Informatica, Facoltà di scienze Matematiche, Fisiche e Naturali
Didattica svolta in qualità di esercitatrice per l’insegnamento del modulo B2.4 PROG.
“Gestione delle Ontologie” del Corso di Master “OpenKnowTech”
PUBBLICAZIONI
SCIENTIFICHE
§ Ermelinda Oro, Massimo Ruffolo, Fausto Pupo: “A Cognitive Automation Approach for a Smart Lending and Early Warning Application”. DARLI-AP EDBT Workshop 2020.
§ Ermelinda Oro, Clara Pizzuti, Nicola Procopio, Massimo Ruffolo: “Detecting Topic Authoritative Social Media Users: A Multilayer Network Approach”. IEEE Trans.
Multimedia 20(5): 1195-1208 (2018)
§ Udo Bub, Ajantha Dahanayake, Jérôme Darmont, Claudia Diamantini, Fabio Fassetti, Eduardo Fermé, Nadia Kabachi, Ilaria Matteucci, Bálint Molnár, Sham Navathe, Ermelinda Oro, Marinella Petrocchi, Simona E. Rombo, Massimo Ruffolo, Angelo Spognardi, Bernhard Thalheim, Domenico Ursino: Contributions from ADBIS 2018 Workshops. ADBIS (Short Papers and Workshops) 2018: 91-102
§ Ermelinda Oro, Massimo Ruffolo, Mostafa Sheikhalishahi: “Language Identification of Similar Languages using Recurrent Neural Networks”. ICAART (2) 2018: 635- 640
§ Ermelinda Oro, Clara Pizzuti, Massimo Ruffolo: “A Methodology for Identifying Influencers and their Products Perception on Twitter”. ICEIS (1) 2018: 577-584
§ Ermelinda Oro, Massimo Ruffolo: “Object Extraction from Presentation-oriented Documents using a semantic and spatial approach” Brevetto Internazionale.
Publication number: US9582494 B2, 28 Feb 2017
§ Ermelinda Oro, Massimo Ruffolo: “A Method forWeb Content Extraction and Analysis in the Tourism Domain”. ICEIS (1) 2017: 365-370
§ Ermelinda Oro, Massimo Ruffolo: “A Method for Querying Touristic Information Extracted from the Web”. NLDB 2017: 218-221
§ Max C. Göbel, Tamir Hassan, Ermelinda Oro, Giorgio Orsi, Roya Rastan: “Table Modelling, Extraction and Processing”. DocEng 2016: 1-2
§ Ermelinda Oro, Massimo Ruffolo: “Towards a Big Data Solution for Analyzing the Reputational Impact of the Tennis Italian Open” KDD 2016 Workshop on Large Scale Sports Analytics Objectives 2016 (http://www.large-scale-sports-
analytics.org/Large-Scale-Sports-Analytics/Home.html)
§ Ermelinda Oro, Massimo Ruffolo: “Using apps and rules in contextual workflows to semantically extract data from documents”. iiWAS 2015: 42:1-42:5
§ Ermelinda Oro, Massimo Ruffolo: “Large-Scale Extraction of Product Information on the Web”. Technical Report ICAR-CNR 2015
§ Ermelinda Oro, Massimo Ruffolo: “A Natural Language Interface for Querying RDF and Graph Databases”. Technical Report ICAR-CNR 2015
§ Ermelinda Oro, Massimo Ruffolo, Pietro Gentile, Giuseppe Bartone: “Towards a Language for Representing and Managing the Semantics of Big Data”. ICAART (1) 2014: 651-656
§ Max C. Göbel, Tamir Hassan, Ermelinda Oro, Giorgio Orsi: “ICDAR 2013 Table Competition”. ICDAR 2013: 1449-1453
§ Marco Manna, Ermelinda Oro, Massimo Ruffolo, Mario Alviano, Nicola Leone:
“The HiLeX System for Semantic Information Extraction”. Trans. Large-Scale Data- and Knowledge-Centered Systems 5: 91-125 (2012)
§ Max C. Göbel, Tamir Hassan, Ermelinda Oro, Giorgio Orsi: “A methodology for evaluating algorithms for table understanding in PDF documents”. ACM Symposium on Document Engineering 2012: 45-48
§ Sergio Flesca, Tim Furche, Linda Oro: “Reasoning and Ontologies in Data Extraction”. Reasoning Web 2012: 184-210
§ Massimo Ruffolo, Ermelinda Oro: “Information Extraction from Presentation- Oriented Documents”. ERCIM News 2012(89) (2012)
§ Ermelinda Oro, Massimo Ruffolo: “A Knowledge Representation Formalism for Semantic Business Process Management”. Book: Advances in Knowledge
Representation DOI: 10.5772/38421 (https://www.intechopen.com/books/advances- in-knowledge-representation/a-knowledge-representation-formalism-for-semantic- business-process-management) 2012
§ Ermelinda Oro, Massimo Ruffolo: “SILA: a spatial instance learning approach for deep webpages”. CIKM 2011: 2329-2332
§ Ermelinda Oro, Francesco Riccetti, Massimo Ruffolo: “A Spatial Query Language for Presentation-oriented Documents”. ICAART (1) 2011: 306-312
§ Ermelinda Oro, Massimo Ruffolo: “Towards a Spatial Instance Learning Method for Deep Web Pages”. ICDM 2011: 270-285
§ Ermelinda Oro, Massimo Ruffolo, Steffen Staab: “SXPath: a Spatial Extension of XPath”. SEBD 2011: 267-274
§ Ermelinda Oro. Tesi di dottorato: Getting Knowledge from Presentation-Oriented Documents (by exploiting Spatial and Semantic Feautures). Relatori: Ing. Massimo Ruffolo, Prof. Domenico Saccà, 2011
§ Ermelinda Oro, Massimo Ruffolo, Steffen Staab: “SXPath - Extending XPath towards Spatial Querying on Web Documents”. PVLDB 4(2): 129-140 (2010)
§ Ermelinda Oro, Francesco Riccetti, Massimo Ruffolo: “ViQueL: A Spatial Query Language for Presentation-Oriented Documents”. ICTAI (2) 2010: 345-346
§ Ermelinda Oro, Massimo Ruffolo, Francesco Valentini: “SILA: A Spatial Instance Learning Approach from Deep Web Pages”. Technical Report ICAR-CNR 2010
§ Ermelinda Oro, Massimo Ruffolo, Domenico Saccà: “Ontology-Based Information Extraction from PDF Documents with Xonto”. International Journal on Artificial Intelligence Tools 18(5): 673-695 (2009)
§ Ermelinda Oro, Massimo Ruffolo, Domenico Saccà: “A Semantic Clinical Knowledge Representation Framework for Effective Health Care Risk Management”. BIS 2009: 25-36
§ Ermelinda Oro, Massimo Ruffolo: “PDF-TREX: An Approach for Recognizing and Extracting Tables from PDF Documents”. ICDAR 2009: 906-910
§ Ermelinda Oro, Massimo Ruffolo: “Towards a Semantic System for Managing Clinical Processes”. ICEIS (2) 2009: 180-187
§ Ermelinda Oro, Massimo Ruffolo, Domenico Saccà: “Combining Attribute
Grammars and Ontologies for Extracting Information from PDF Documents”. SEBD 2009: 153-160
§ Ermelinda Oro, Massimo Ruffolo: “Description Ontologies”. ICDIM 2008: 369-374
§ Ermelinda Oro, Massimo Ruffolo: “XONTO: An Ontology-Based System for Semantic Information Extraction from PDF Documents”. ICTAI (1) 2008: 118-125
§ Ermelinda Oro, Massimo Ruffolo: “Towards a System for Ontology-Based Information Extraction from PDF Documents”. OTM Conferences (2) 2008: 1482- 1499
§ Ermelinda Oro, Massimo Ruffolo, Marco Manna, Antonio Scudiero, Patrizia Mancini: “Un linguaggio per l'estrazione di informazioni da documenti non strutturati”. Technical Report ICAR-CNR 2007
§ Oro Ermelinda. Tesi Laurea Specialistica: Un Linguaggio per l’estrazione di informazioni da documenti non strutturati. Relatori: Ing. Massimo Ruffolo, Prof.
Domenico Saccà, Correlatore: Ing. Marco Manna, 2007
TUTORIAL
INTERNAZIONALI
21-24/03/2018 Tutorial “Give me the Answer: Question Answering with Deep Learning and Applications in the Financial Domain”
20th International Conference on Enterprise Information Systems (ICEIS 2018) Funchal, Madeira – Portogallo
http://www.iceis.org/Tutorials.aspx?y=2018
13-16/09/2016 Tutorial “Table Modelling, Extraction and Processing”
ACM Symposium on Document Engineering (DocEng 2016) Università Tecnica di Vienna (TU Wien), Vienna (Austria) https://doceng2016.cvl.tuwien.ac.at/?page_id=412
02-08/09/2012 Tutorial “Reasoning and Ontologies in Data Extraction”
Summer School “Reasoning Web 2012”
Università di Vienna, Vienna (Austria)
http://www.kr.tuwien.ac.at/events/rw2012/Lecturers.html
ATTIVITÀ DI REVISIONE Revisioni di giornali,
conferenze e workshop
Attività di revisione di numerosi articoli sottomessi a giornali, conferenze e workshop, tra i quali: IEEE Access, International Conference Database and Expert Systems Applications (DEXA), International Conference Business Information System (BIS), International Conference on Business Process Management (BPM), International Conference on
Information and Knowledge Management (CIKM), International Database Engineering and Applications Symposium (IDEAS), International Conference on Extending Database Technology (EDBT), Journal of Parallel and Distributed Computing (JPDC), Association for Information Systems (ITAIS), Symposium On Applied Computing (SAC), Association for the Advancement of Artificial Intelligence (AAAI), ACM Symposium on Document
Engineering (DocEng), International Conference on Enterprise Information Systems (ICEIS), ecc.
PARTECIPAZIONE A CONFERENZE E
SUMMER SCHOOL
Partecipazione e Presentazioni Partecipazione e presentazione di articoli, seminari, tutorial a diverse conferenze e workshop internazionali e nazionali. Alcuni esempi: ICEIS 2018, ICAART 2018, ICEIS 2017, NLDB 2017, DocEng 2016, iiWAS 2015, ICAART 2014, Reasoning Web 2012, VLDB 2011, SEBD 2011, workshop DIADEM 1.0 e di istituto ICAR-CNR, seminari tenuti presso le università di Koblenza e Oxford, ICTAI 2008, OTM 2008, ecc.
Partecipazione e presentazione di risultati di ricerca alla summer school “Reasoning Web 2012”, 2-8 settembre 2012 (http://www.kr.tuwien.ac.at/events/rw2012/Lecturers.html) tenutasi presso l’università di Vienna, Vienna (Austria). Titolo della lezione presentata:
“Reasoning and Ontologies in Data Extraction”.
Partecipazione e presentazione di risultati di ricerca al DIADEM 1.0 workshop e kick-off meeting (http://diadem.cs.ox.ac.uk/vienna/?page_id=7), tenutosi a Vienna (Austria) 1-4 Ottobre 2011. Titoli degli interventi: “Spatial Relations in Data Extraction” e “Data Extraction with Context Knowledge”. La partecipazione al workshop è stata finanziata da DIADEM.
Session Chairing Session Chair in varie conferenze, ad esempio: Session “E-Learning and E-Teaching” at ICEIS 2018, Session “AI Business Aplications” at ICAART 2018, Session “Feature Engineering” at NLDB 2017, Session “Project Management” at ICEIS 2017, Session
“Artificial Intelligence” at ICAART 2014, ecc.
ORGANIZZAZIONE DI
CONFERENZE
2-5 Settembre 2018 1st International Workshop Artificial Intelligence for Question Answering (AI*QA 2018) Budapest, Ungheria
http://aiqa2018.icar.cnr.it/
Lo scopo principale del Workshop AI*QA 2018 è di riunire ricercatori, ingegneri e professionisti interessati agli aspetti teorici e pratici relativi al problema del Question Answering (QA) utilizzando tecniche di Artificial Intelligence (AI).
Nei prossimi anni, l’AI sarà sempre più un importante motore trainante di innovative
tecnologie e soluzioni capaci di risolvere problemi di ricerca rimasti irrisolti per lungo tempo.
La sottoscritta dichiara di essere informato, ai sensi del Regolamento (UE) 2016/679, che i dati personali raccolti saranno trattati, anche con strumenti informatici, esclusivamente nell’ambito del procedimento per il quale la presente dichiarazione viene resa.
Rende, 06/02/2020 ERMELINDA ORO
Porterà ulteriori grandi trasformazioni in molti settori, come ad esempio nei trasporti, produzione, sanità, comunicazioni, servizi finanziari e in altro ancora. Il QA è un compito complesso che richiede la capacità di comprendere il linguaggio naturale (NLU) e di ragionare sfruttando i contesti rilevanti. Quasi tutte le attività di elaborazione del linguaggio naturale (NLP) possono essere viste come un problema di QA (ad esempio: l’estrazione di entità, l’analisi delle opinioni, la traduzione automatica, la comprensione automatica dei testi).
L'obiettivo del workshop organizzato è comprendere meglio i vantaggi e i limiti delle soluzioni e dei sistemi proposti in diversi domini e situazioni stimolando e facilitando un attivo scambio e confronto di idee, approcci, metodi, modelli e strumenti capaci di offrire nuove soluzioni agli sfidanti problemi di ricerca.