• Non ci sono risultati.

Il progetto ATLAS

N/A
N/A
Protected

Academic year: 2022

Condividi "Il progetto ATLAS"

Copied!
67
0
0

Testo completo

(1)

Il progetto ATLAS

traduzione automatica da Italiano a Lingua Italiana dei Segni (LIS)

Alessandro Mazzei

Dip. Informatica Università di Torino

[email protected]

21-12-2010

(2)

Machine Translation

The spirit is willing, but the flesh is weak

Водка сильна,

но мясо гнило

(3)

Semantic Structure

Syntactic Structure

Words

Semantic Structure

Syntactic Structure

Words

Triangolo di Vauquois

Interlingua

Analisi Generazione

(4)

Semantic Structure

Syntactic Structure

Words

Semantic Structure

Syntactic Structure

Words

Source Sentence Target Sentence

Triangolo di Vauquois

Interlingua

Analisi Generazione

Direct

Transfer

(5)

Semantic Structure

Syntactic Structure

Words

Semantic Structure

Syntactic Structure

Words

The KANT Project

Triangolo di Vauquois

Interlingua

Analisi Generazione

Direct

Transfer

(6)

Il progetto ATLAS

Traduzione automatica da Italiano a Lingua Italiana dei Segni

(7)

La Lingua Italiana dei segni

 La LIS è “segnata” da migliaia di persone

 È una lingua a tutti gli effetti: lessico, morfologia, sintassi

 Ha anche elementi di iconicità

 Spesso è l'unica lingua conosciuta dai sordi

 Paesi diversi, lingue dei segni diverse

(8)

Linguistica della LIS

 Diversi articolatori: parallelismo

 Organizzazione spaziale della frase

 No preposizioni, genere, articoli

 Plurale

 SOV

 Dialetti regionali

 Ancora pochi studi linguistici

 Non ha una forma scritta (!!!)

Meteo19-3

(9)

Semantic Structure

Syntactic Structure

Words

Semantic Structure

Syntactic Structure

Words

Triangolo di Vauquois

Interlingua

Analysis Generation

Direct

(10)

Outline

 Rule-Based Translation Architecture in ATLAS

 Analisi dell'Italiano

– Turin University Parser (TUP)

– Turin University Semantic Interprete (TUSI)

 Generazione in LIS

 Conclusioni

(11)

Outline

 Rule-Based Translation Architecture in ATLAS

 Analisi dell'Italiano

– Turin University Parser (TUP)

– Turin University Semantic Interprete (TUSI)

 Generazione in LIS

 Conclusioni

(12)

Rule-Based Translation Architecture

OpenCCG

TUrin Linguistic Enviroment

ITALIANO

Logica dei Predicati

Analisi Generazione

GLOSSE+Feats

(AEW-LIS)

(13)

Architecture details

(14)

Outline

 Rule-Based Translation Architecture in ATLAS

 Analisi dell'Italiano

– Turin University Parser (TUP)

– Turin University Semantic Interprete (TUSI)

 Generazione in LIS

 Conclusioni

(15)

Turin University Parser

 A wide-coverage rule-based dependency parser

 Rule-Based: chunking + coord + verb-sub-cat

 Morpho-syntatctic dependency annotation

(16)

Dependency-chunking

...

(ART def BEFORE

(NOUN (TYPE COMMON) ) DET+DEF-ARG )

...

... le nuvole ...

nuvole le

det-def-arg

(17)

VerbSubCat taxonomy

VERBS

TRANS INTRANS

... aumenteranno

trans-dir-disc-indobj ... intrans-indobj-ssubj

...

...

... ...

...

...

(18)

Turin University Parser

Domani aumenteranno

2 1

Domani le nuvole aumenteranno

nuvole le

det-noun

nuvole le

aumenteranno

verb-sbj

det-def-arg

domani

advb-rmod-time

(19)

Anatomy of the TUP

I. Grammar: CFG, TAG, Dependency grammar … II. Algorithm:

i. Search strategy: top-down, bottom-up, L2R, … ii. Memory organization: depth-first, back-tracking,

dynamic programming, all-paths, ...

III.Oracle: Probabilistic, heuristic, ...

(20)

Domani le nuvole sono in aumento al nord

(21)

Outline

 Rule-Based Translation Architecture in ATLAS

 Analisi dell'Italiano

– Turin University Parser (TUP)

– Turin University Semantic Interprete (TUSI)

 Generazione in LIS

 Conclusioni

(22)

DepTree ⇝ Logica dei Predicati

First Order Formulas

Predicate-Argument relations

Semantic Roles

TUSI Ontologies

(23)

Ontologies: world + domain

(24)

Ontologies: language

(25)

Computing Meaning by Recursion

(26)

Ontological Connection Paths

(27)

Ontological Path ⇝ Logica dei Predicati

Per domani quindi nubi in aumento al nord ...

[meteo 19-F4]

event(E=cloud-increase') AGENT(E,cloud')

LOC(E,north') ⋀ TIME(E,tomorrow')

(28)

Outline

 Rule-Based Translation Architecture in ATLAS

 Analisi dell'Italiano

– Turin University Parser (TUP)

– Turin University Semantic Interprete (TUSI)

 Generazione in LIS

 Conclusioni

(29)

Generazione

Logica dei Predicati

GLOSSE+Feats (AEW-LIS)

OpenCCG

LIS-CCG

(30)

OpenCCG

 Combinatory Categorial Grammar

 Bidirectional: speed-up in grammar development

 Syntax / Semantics: Features Unification with Hybrid Logic

 Chart – Agenda

 Statistical pruning: symbolic-statistical chart

(31)

LIS-CCG

LEX SynCAT SemCAT

nuvola

U

NP

[position=U X]

X=cloud'

domani

N

S

[position=N E]

/ S

[position=N E]

TIME(E,tomorrow')

nord

U

S

[position=U E]

/ S

[position=U E]

LOC(E,north')

nuvola-

aumentare

U

S

[E]

\ NP

[position=U Y]

event(E=cloud-increase') ⋀

AGENT(E,Y)

(32)

CCG derivation

S :

event(E=cloud-increase')⋀AGENT(E,cloud')⋀LOC(E,north')⋀TIME(E,tomorrow')

(33)

CCG derivation

domani

N

S :

S

E

/ S

E

>

S :

TIME(E,tomorrow')

event(E=cloud-increase')⋀AGENT(E,cloud')⋀LOC(E,north')⋀TIME(E,tomorrow')

event(E=cloud-increase')⋀AGENT(E,cloud')⋀LOC(E,north')

(34)

CCG derivation

S

E

/ S

E

>

S : S :

S

E

/ S

E

>

S :

LOC(E,north') TIME(E,tomorrow')

event(E=cloud-increase')⋀AGENT(E,cloud') event(E=cloud-increase')⋀AGENT(E,cloud')⋀LOC(E,north')⋀TIME(E,tomorrow')

event(E=cloud-increase')⋀AGENT(E,cloud')⋀LOC(E,north')

domani

N

nord

U

(35)

CCG derivation

S

E

/ S

E

NP

X

S

E

\ NP

Y

>

<

S : S :

S

E

/ S

E

>

S :

event(E=cloud-increase')AGENT(E,Y) LOC(E,north') X=cloud'

TIME(E,tomorrow')

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

event(E=cloud-increase')⋀AGENT(E,cloud') event(E=cloud-increase')⋀AGENT(E,cloud')⋀LOC(E,north')⋀TIME(E,tomorrow')

event(E=cloud-increase')⋀AGENT(E,cloud')⋀LOC(E,north')

(36)

Proprietà Glosse+Feats

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

(37)

Glosse+Feats: posizione

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

Neutral = N

Up = U Posizione nello Spazio

(38)

Glosse+Feats: ordine segni

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

L'ordine dei segni nella frase è S(O)V

(39)

Glosse+Feats: verbo-argomenti

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

Soggetto e Verbo sono segnati nella stessa posizione

(40)

Glosse+Feats: pragmatica

Le nuvole vengono segnate al “nord”: Up

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

(41)

Sintesi in LIS

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

(42)

Outline

 Rule-Based Translation Architecture in ATLAS

 Analisi dell'Italiano

– Turin University Parser (TUP)

– Turin University Semantic Interprete (TUSI)

 Generazione in LIS

 Conclusioni

(43)

Conclusioni

 Traduzione interlingua = analisi profonde

 Basi di conoscenza

– Grammatiche: Italiano (Dipendenze), LIS (CCG) – Ontologie: mondo e lingua, meteo

– Semantic Interpretation

 Work in Progress:

– Topic/Focus

(44)

Considerazioni “politiche” sulla ricerca

 Quanta ricerca di base c'è in ATLAS?

 L'applicazione è una conseguenza, non un obiettivo

 Il "sapere del fare" non esiste, esiste la conoscenza

 Dovere dell'Università è farlo capire a tutti

(45)

Grazie per l'attenzione :)

ATLAS project is co-funded by Regione Piemonte

within the “Converging Technologies - CIPE

2007” framework (Research Sector: Cognitive

Science and ICT).

(46)
(47)

Evoluzione della MT

 1930: Troyanskii's “translating machines”

 1947: Guerra fredda

 1956: Dartmouth Seminar

 1966: ALPAC report

 1990: La rinascita

 2000: On-line MT

(48)

Logica XML Generazione

domani_N nord_U nuvola_U nuvola-aumentare_U ...

<?xml version="1.0" encoding="UTF-8"?>

<xml>

<lf>

<satop nom="c1:meteo-status-situation">

<prop name="cloud-increase"/>

<diamond mode="AGENT">

<nom name="c2:clouds"/>

<prop name="cloud"/>

</diamond>

<diamond mode="LOCATION">

<nom name="n1:it-northern-region"/>

<prop name="north"/>

</diamond>

<diamond mode="TIME">

<nom name="t1:deictic-day-description"/>

<prop name="tomorrow"/>

</diamond>

</satop>

</lf>

</xml>

OpenCCG LIS-CCG

(49)

Logica dei Predicati ⇢ Logica XML

<?xml version="1.0" encoding="UTF-8"?>

<xml>

<lf>

<satop nom="c1:meteo-status-situation">

<prop name="cloud-increase"/>

<diamond mode="AGENT">

<nom name="c2:clouds"/>

<prop name="cloud"/>

</diamond>

<diamond mode="LOCATION">

<nom name="n1:it-northern-region"/>

<prop name="north"/>

</diamond>

<diamond mode="TIME">

<nom name="t1:deictic-day-description"/>

<prop name="tomorrow"/>

</diamond>

</satop>

</lf>

∃ (ev1 t1 l1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2) ⋀ id(t2,tomorrow) ⋀ location(ev1, l1) ⋀

id(l1, nord) ⋀ agent(ev1, x1) ⋀ cloud(x1))

(50)

 Time flies like an arrow. Fruit flies like a banana.

 Every time I fire a linguist, the performance of our speech

recognition system goes up. (Fred Jelinek)

(51)

Ontological Path ⇝ Logica dei Predicati

Per domani quindi nubi in aumento al nord ...

[meteo 19-F4]

∃ (ev1 t1 l1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2) ⋀ id(t2,tomorrow) ⋀ location(ev1, l1) ⋀ id(l1, nord) ⋀ agent(ev1, x1) ⋀ cloud(x1))

(52)

CCG derivation

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

S / S NP S \ NP

>

<

S S

S / S

>

S

(53)

LIS-CCG

DOMANI_N NUVOLA_U NUVOLA-AUMENTARE_U

S/S NP S\NP

>

<

S S

∃ (ev1 t1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2)

⋀ id(t2,tomorrow) ⋀ agent(ev1, x1) ⋀ cloud(x1))

(54)

LIS-CCG

DOMANI_N NUVOLA_U NUVOLA-AUMENTARE_U

S/S NP S\NP

>

<

S S

∃ (ev1 t1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2)

⋀ id(t2,tomorrow) ⋀ agent(ev1, x1) ⋀ cloud(x1))

(55)

LIS-CCG

DOMANI_N NUVOLA_U NUVOLA-AUMENTARE_U

S/S NP S\NP

>

<

S S

∃ (ev1 t1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2)

⋀ id(t2,tomorrow) ⋀ agent(ev1, x1) ⋀ cloud(x1))

(56)

LIS-CCG

DOMANI_N NUVOLA_U NUVOLA-AUMENTARE_U

S/S NP S\NP

>

<

S S

∃ (ev1 t1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2)

⋀ id(t2,tomorrow) ⋀ agent(ev1, x1) ⋀ cloud(x1))

(57)

LIS-CCG

DOMANI_N NUVOLA_U NUVOLA-AUMENTARE_U

S/S NP S\NP

>

<

S S

∃ (ev1 t1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2)

⋀ id(t2,tomorrow) ⋀ agent(ev1, x1) ⋀ cloud(x1))

(58)

Italiano ⇝ Logica dei Predicati

Per domani quindi nubi in aumento al nord, con

precipitazioni a carattere sparso anche

temporalesche, tendenza poi a schiarite dalla serata.

[meteo 19-F4]

I. ∃ (ev1 t1 l1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2) ⋀ id(t2,tomorrow) ⋀ location(ev1, l1) ⋀ id(l1, nord) ⋀ agent(ev1, x1) ⋀ cloud(x1)) II. ∃ (ev2) (rain(ev2) ⋀

has-event-width(ev2,local-phenomenon))

⋀ ∃ (ev3) (storm(ev3))

III. ∃ (ev4,x4, t4, d4) (cloud-decrease(ev4) ⋀ agent(ev4, x4) ⋀ cloud(x4) ⋀ time(ev4, t4) ⋀ time-ref(t4, e4) ⋀ afternoon(d4))

(59)

Italiano ⇝ Logica dei Predicati

Per domani quindi nubi in aumento al nord, con

precipitazioni a carattere sparso anche

temporalesche, tendenza poi a schiarite dalla serata.

[meteo 19-F4]

I. ∃ (ev1 t1 l1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2) ⋀ id(t2,tomorrow) ⋀ location(ev1, l1) ⋀ id(l1, nord) ⋀ agent(ev1, x1) ⋀ cloud(x1)) II. ∃ (ev2) (rain(ev2) ⋀

has-event-width(ev2,local-phenomenon))

⋀ ∃ (ev3) (storm(ev3))

III. ∃ (ev4,x4, t4, d4) (cloud-decrease(ev4) ⋀ agent(ev4, x4) ⋀ cloud(x4) ⋀ time(ev4, t4) ⋀ time-ref(t , e ) ⋀ afternoon(d ))

(60)

LIS-CCG

LEX SynCAT SemCAT

nuvola

U

NP

[position=U X]

X=cloud'

domani

N

S

[position=N E]

/ S

[position=N E]

E <TIME> tomorrow'

nord

U

S

[position=U E]

/ S

[position=U E]

E <LOC> north'

nuvola-

aumentare

U

S

[E]

\ NP

[position=U Y]

E=cloud-increase'<AGENT>Y

(61)

CCG derivation

S

E=cloud-increase'(<AGENT>cloud' <LOC>north' <TIME>tomorrow')

(62)

CCG derivation

domani

N

S

S / S

>

S

E<TIME>tomorrow'

E=cloud-increase'(<AGENT>cloud' <LOC>north' <TIME>tomorrow')

E=cloud-increase'(<AGENT>cloud' <LOC>north')

(63)

CCG derivation

domani

N

nord

U

S / S

>

S S

S / S

>

S

E<LOC>north' E<TIME>tomorrow'

E=cloud-increase'(<AGENT>cloud') E=cloud-increase'(<AGENT>cloud' <LOC>north') E=cloud-increase'(<AGENT>cloud' <LOC>north' <TIME>tomorrow')

(64)

CCG derivation

domani

N

nord

U

nuvola

U

nuvola-aumentare

U

S / S NP S \ NP

>

<

S S

S / S

>

S

E=cloud-increase'<AGENT> Y E<LOC>north' cloud'

E<TIME>tomorrow'

E=cloud-increase'(<AGENT>cloud') E=cloud-increase'(<AGENT>cloud' <LOC>north') E=cloud-increase'(<AGENT>cloud' <LOC>north' <TIME>tomorrow')

(65)

Ontological Path ⇝ Logica dei Predicati

Per domani quindi nubi in aumento al nord ...

[meteo 19-F4]

∃ (ev1 t1 l1 x1) (cloud-increase(ev1) ⋀ time(ev1, t1) ⋀ deictic-descr(t1, t2) ⋀ id(t2,tomorrow') ⋀ location(ev1, l1) ⋀ id(l

1, nord') ⋀ agent(ev1, x1) ⋀ cloud(x1))

Ecloud-increase<AGENT> cloud' ⋀ Ecloud-increase<LOC> north' ⋀ Ecloud-increase<TIME> tomorrow'

(66)

1. Dependency-chunking

...

(ADJ-QUALIF BEFORE

(ADV (TYPE MANNER) ) ADVMOD-MANNER )

...

... davvero veloce ...

davvero veloce

ADVMOD-MANNER

nuvole le

aumenteranno

sbj-verb

det-noun

domani

mod-adv

(67)

1. Dependency-chunking

...

(ART def BEFORE

(NOUN (TYPE COMMON) ) DET+DEF-ARG )

...

... le nuvole ...

nuvole le

aumenteranno

sbj-verb

det-noun

domani

mod-adv

Riferimenti

Documenti correlati

Le Dicastère pour le Service du Développement Humain Intégral informe au sujet de l’avancement de son projet WASH (accès à l'eau potable, à l'assainissement et à l'hygiène) dans

Il Piano triennale 2021-2023 “Disposizioni per l’inclusione sociale, la rimozione delle barriere alla comunicazione e il riconoscimento e la promozione della lingua dei segni

Bricolage per i più piccoli BAMBINI 6-10 ANNI arte ITA. CANI BAMBINI 6-10

Al momento dell’accettazione dell’incarico e della sottoscrizione del contratto, il vincitore di cui alla presente selezione rilascia apposita dichiarazione ai sensi del DPR

Alle ore 11:50 del 3 maggio 2021 il Presidente dichiara chiusa la seduta, aggiornandola alle ore 10:00 del giorno 12.05.2021, sempre in modalità telematica via Microsoft Teams,

In conclusion, this article introduced an automatic system of cell counting based mainly on algorithms of image analysis and neural nets. The results show a good accuracy

Nel ripresentare il progetto formativo rivolto a tutte le scuole Statali e Paritarie di ogni ordine e grado della provincia di Verona, in collaborazione con l’Università Cà Foscari

RIPPOL ORIOL Giochi di tutto il Mondo BAMBINI 6-10 ANNI mondi e.