• Non ci sono risultati.

Risultati e osservazioni conclusive

Nel documento CLUB Working Papers in Linguistics Volume 2 (pagine 129-133)

Classi di nomi tra semantica e ontologia Elisabetta Jezek

6. Risultati e osservazioni conclusive

Abbiamo illustrato le principali caratteristiche del sistema di tipi semantici bottom-up sviluppato nel progetto T-PAS a partire dall’analisi di evidenza linguistica empirica, e lo abbiamo messo a confronto con l’ontologia fondazionale DOLCE, le cui categorie sono definite sulla base di assiomi formali.

Nell’esperimento di allineamento descritto nel paragrafo 5, DOLCE ha fornito numerosi spunti di riflessione e miglioramento dell’architettura generale del sistema di tipi in T-PAS. Viceversa, come si nota dalla Figura 5, T-PAS fornisce le “foglie” che DOLCE non possiede – essendo DOLCE una ontologia fondazionale – e ne valida la struttura da un punto di vista linguistico. Il vantaggio dell’esperimento può essere confermato come reciproco.

9 Si noti che T-PAS contiene anche un tipo semantico chiamato ROLE (nodo child di PROPRIETÀ),

utilizzato per le parole e espressioni che denotano cariche o funzioni, ad esempio presidente del consiglio nell’espressione: “Mattarella ha nominato Giovanni Conte presidente del consiglio”.

10 Quest’ultimo caso di polisemia è trattato diversamente da quello di bottiglia nella letteratura di

semantica lessicale (si veda Cruse 1994; Pustejovsky 1995). È un caso specifico di polisemia sistematica denominato “inerente” (si veda Jezek 2016: capitolo 3 per una sintesi e discussione delle distinzioni).

In generale lo studio mostra che l’analisi bottom-up a partire da evidenza linguistica induce tipi semantici che possono essere facilmente collegati alle categorie generali di una ontologia top-down come DOLCE. Inoltre, lo studio mostra che l’inventario data- driven risulta popolato da tipi semantici facenti riferimento a categorie cognitive rilevanti per la comunicazione umana, che non necessariamente combaciano con quelle su cui si fondano le classificazioni scientifiche: di qui il carattere definito “antropico” della lista.

Per quanto riguarda le prospettive di ricerca, un primo passo riguarda il completamento dell’allineamento per i rami di NonPhysicalEndurant, Perdurant e Quality di DOLCE, qui non inclusi. Un secondo passo riguarda la valutazione dei casi di polisemia inerente e l’opportunità di un loro trattamento distinto rispetto agli spostamenti metonimici (Jezek & Vieu 2014). In presenza di risorse per tale scopo, sarà interessante inoltre tentare di estrarre in modo automatico i tipi semantici a partire dai set lessicali presenti nelle posizioni argomentali, in linea con lavori quali Snow et al. (2005) e confrontare il risultato ottenuto con i due sistemi qui analizzati.

Per quanto riguarda le applicazioni computazionali, una porzione dei tipi del sistema in T-PAS è stata utilizzata nella campagna di valutazione Semeval-2010 Task 7: Argument Selection and Coercion (Pustejovsky et al. 2010). In prospettiva intendiamo valutare l’utilità del sistema di tipi semantici in T-PAS per il task di word sense disambiguation (WSD); la predizione è che le T-pas con i tipi semantici possano rendere più facile la previsione del senso di un verbo nel contesto. Riteniamo che i sistemi di tipi semantici fondati nell’uso linguistico – più che non le tassonomie scientifiche – contribuiscano a ridurre il divario tra ontologia, semantica e linguistica computazionale.

Bibliografia

Arapinis, Alexandra & Vieu, Laure. 2015. A plea for complex categories in ontologies. Applied Ontology 10(3–4). 285–296.

Baker, Collin F. & Fillmore, Charles J. & Lowe, John B. 1998. The Berkeley Framenet Project. In Proceedings of the 17th International Conference on Computational Linguistics, 86–90. Association for Computational Linguistics.

Baroni, Marco & Kilgarriff, Adam. 2006. Large linguistically-processed web corpora for multiple languages. In Proceedings of the Eleventh Conference of the European

Chapter of the Association for Computational Linguistics (EACL), 87–90.

Association for Computational Linguistics.

Bonial, Claire & Hargraves, Orin & Palmer, Martha. 2013. Expanding VerbNet with Sketch Engine. In Proceedings of the 6th International Conference on Generative Approaches to the Lexicon. Pisa, ILC-CNR.

Chiari, Isabella & De Mauro, Tullio. 2014. The New Basic Vocabulary of Italian as a linguistic resource. In Basili, Roberto & Lenci, Alessandro & Magnini, Bernardo (a cura di), Proceedings of the First Italian Conference on Computational Linguistics CLiC-it 2014: 9-10 December 2014, Pisa, 113–116. Pisa: Pisa University Press. Cruse, D. Alan. 1995. Polysemy and related phenomena from a cognitive linguistic

viewpoint. In Saint-Dizier, Patrick & Viegas, Evelyne (a cura di), Computational lexical semantics, 33–49. Cambridge: Cambridge University Press.

Gaio, Silvia & Borgo, Stefano & Masolo, Claudio & Oltramari, Alessandro & Guarino, Nicola. 2010. Un’introduzione all’ontologia DOLCE. AIDA informazioni 28(1–2). 107–125.

Gangemi, Aldo & Guarino, Nicola & Masolo, Claudio & Oltramari, Alessandro & Schneider, Luc. 2002. Sweetening ontologies with DOLCE. In International Conference on Knowledge Engineering and Knowledge Management, 166–181. Berlin-Heidelberg: Springer.

Gangemi, Aldo & Alam, Mehwish & Asprino, Luigi & Presutti, Valentina & Reforgiato Recupero, Diego. 2016. Framester: A wide coverage linguistic linked data hub. In European Knowledge Acquisition Workshop (EKAW 2016), 239–254. Cham: Springer.

Guarino, Nicola & Welty, Christopher A. 2002. Evaluating ontological decisions with OntoClean. Communications of the ACM 45(2), 61–65. New York: ACM Press.

Guarino, Nicola & Welty, Christopher A. 2009. An overview of OntoClean In Staab, Steffen & Studer, Rudi (a cura di), Handbook on ontologies, 151–171. Berlin- Heidelberg: Springer.

Hanks, Patrick. 2004. Corpus Pattern Analysis. In Williams, Geoffrey & Vessier, Sandra (a cura di), Proceedings of the XI EURALEX International Congress, vol. 1, 87–98. Lorient, France: Université de Bretagne-Sud.

Hanks, Patrick. 2013. Lexical analysis: Norms and exploitations. Cambridge: The MIT Press.

Hanks, Patrick & Pustejovsky, James. 2005. A pattern dictionary for Natural Language Processing. In Revue Française de Linguistique Appliquée 10(2). 63–82.

Jezek, Elisabetta. 2016. The lexicon: An introduction. Oxford: Oxford University Press. Jezek, Elisabetta & Magnini, Bernardo & Feltracco, Anna & Bianchini, Alessia &

Popescu, Octavian. 2014. T-PAS: A resource of Typed Predicate-Argument Structures for linguistic analysis and semantic processing. In Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC 2014), 890–895. Parigi: European Language Resources Association (ELRA).

Jezek, Elisabetta & Vieu, Laure (2014). Distributional analysis of copredication: Towards distinguishing systematic polysemy from coercion. In Basili, Roberto & Lenci, Alessandro & Magnini, Bernardo (a cura di), Proceedings of the First Italian Conference on Computational Linguistics CLiC-it 2014: 9-10 December 2014, Pisa, 219–223. Pisa: Pisa University Press.

Kilgarriff, Adam & Rychlý, Pavel & Smrz Pavel & Tugwell, David. 2004. The Sketch Engine. Information Technology Research Institute (ITRI) Technical Report Series. 105–116.


Kilgarriff, Adam & Baisa, Vít & Bušta, Jan & Jakubíček, Miloš & Kovář Vojtěch & Michelfeit Jan & Rychlý, Pavel & Suchomel, Vít. 2014. The Sketch Engine: Ten years on. Lexicography 1(1). 7–36.

Kipper-Schuler, Karin. 2005. VerbNet: A broad coverage, comprehensive verb lexicon. Philadelphia, University of Pennsylvania. (Tesi di Dottorato).

Lenci, Alessandro & Lapesa Gabriella & Bonansinga, Giulia. 2012. LexIt: A computational resource on Italian argument structure. In Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC 2012), 3712– 3718. Parigi: European Language Resources Association (ELRA).

Masolo, Claudio & Borgo, Stefano & Gangemi, Aldo & Guarino, Nicola & Oltramari, Alessandro. 2003. WonderWeb Deliverable D18: Ontology Library (final). IST Project 2001-33052 WonderWeb: Ontology Infrastructure for the Semantic Web.

Miller, George A. 1998. Nouns in Wordnet. In Fellbaum, Christiane (a cura di), WordNet: An electronic lexical database, 24–45. Cambridge: The MIT Press.

Navigli, Roberto & Ponzetto, Simone. 2010. BabelNet: Building a very large multilingual semantic network. In Proceedings of the 48th annual meeting of the

association for computational linguistics, 216–225. Association for Computational Linguistics.

Pianta, Emanuele & Bentivogli, Luisa & Girardi, Christian. 2002. MultiWordNet: Developing an aligned multilingual database. In Proceedings of the First

International Conference on Global WordNet: 55–63.

Pustejovsky, James. 1995. The Generative Lexicon. Cambridge: The MIT Press.

Pustejovsky, James & Hanks, Patrick & Rumshisky, Anna. 2004. Automated induction of sense in context. In Proceedings of the 20th international conference on Computational Linguistics (COLING 2004), 924–931.

Pustejovsky, James & Rumshisky, Anna & Plotnick, Alex & Jezek, Elisabetta & Batiukova, Olga & Quochi, Valeria. 2010. SemEval-2010 Task 7: Argument selection and coercion. In Proceedings of the 5th International Workshop on Semantic Evaluation (SemEval) 27–32. Association for Computational Linguistics.

Snow, Rion & Jurafsky, Daniel & Ng, Andrew Y. 2006. Semantic taxonomy induction from heterogenous evidence. In Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics, 801–808. Sydney: Association for Computational Linguistics.

Sabatini, Francesco & Coletti, Vittorio. 2007. Dizionario della lingua italiana 2008. Milano: Rizzoli Larousse.

Alberto Manco. Qualche nuova riflessione su individuazione e metalinguaggio di tipi testuali nella letteratura scritto-disegnata

Nel documento CLUB Working Papers in Linguistics Volume 2 (pagine 129-133)