• Non ci sono risultati.

26 1.3.2 Il Word Predictor

N/A
N/A
Protected

Academic year: 2021

Condividi "26 1.3.2 Il Word Predictor"

Copied!
4
0
0

Testo completo

(1)

Indice

Introduzione 12

1 Comunicazione e Predizione 15

1.1 La Linguistica Computazionale . . . . 16

1.1.1 Il Trattamento Automatico del Linguaggio Naturale . 18 1.1.2 Linguaggio Naturale e Ambiguit`a . . . . 20

1.2 Gli Studi Statistici . . . . 22

1.2.1 I Corpora . . . . 22

1.2.2 Chomsky e la Rinascita della Linguistica dei Corpora 24 1.3 La Predizione . . . . 25

1.3.1 La Word Prediction . . . . 26

1.3.2 Il Word Predictor . . . . 27

1.3.3 Gli Utenti di un Word Predictor . . . . 28

1.4 Il Progetto Precedente e il Nuovo Modulo di Predizione . . . 30

1.5 Organizzazione della Tesi . . . . 33

3

(2)

2 Predizione e Statistica 35 2.1 Metodi Formali per il Trattamento del Linguaggio Naturale . 35

2.2 Modelli Probabilistici . . . . 40

2.2.1 Modelli Frequency-based . . . . 41

2.2.2 Modelli Basati su Media e Varianza . . . . 44

2.2.3 Frequenza di Sequenze di Parole . . . . 46

2.3 Inferenza Statistica ed n-gram . . . . 47

2.3.1 Modelli n-gram . . . . 50

2.3.2 Smoothing . . . . 53

2.3.3 Modelli di Markov . . . . 54

2.3.4 Hidden Markov Models . . . . 57

2.4 Part-of-Speech Tagging . . . . 59

2.4.1 Introduzione al Part-of-Speech Tagging . . . . 60

2.4.2 Classificazione dei Part-of-Speech Tagger . . . . 62

2.4.3 Part-of-Speech Tagging con Metodi Statistici . . . . . 66

2.4.4 Markov Model Taggers . . . . 67

2.4.5 L’Algoritmo di Viterbi . . . . 72

3 Risorse Linguistiche 77 3.1 Il Sistema di Gestione di Basi di Dati Lessicali . . . . 78

3.2 Il Dizionario . . . . 80

3.2.1 Organizzazione Logica del Dizionario . . . . 81

3.2.2 La Struttura del Dizionario . . . . 83 4

(3)

3.2.3 Generazione e Gestione dei Dizionari . . . . 87

3.3 Il Linguaggio . . . . 88

3.3.1 Modalit`a di Flessione: Declinazione e Coniugazione . . 88

3.3.2 Modalit`a di Alterazione . . . . 89

3.3.3 Enclitici . . . . 91

3.3.4 Propriet`a Sintattiche e Semantiche . . . . 92

3.3.5 La Grammatica . . . . 93

3.4 Il Parser Sintattico . . . . 97

3.4.1 Caratteristiche del Parser Synthema . . . 100

3.5 Il Lemmatizzatore . . . 101

3.5.1 La Grammatica Statistica . . . 107

4 Il Progetto 112 4.1 Contributi di Questa Tesi . . . 112

4.2 Descrizione Generale . . . 113

4.2.1 Il Predittore: Architettura del Sistema . . . 115

4.2.2 Strumenti Utilizzati . . . 121

4.3 Analisi e Scelte di Implementazione . . . 122

4.3.1 Dizionario e Dimensioni . . . 123

4.3.2 Gestione dei Suggerimenti . . . 125

4.4 L’Algoritmo di Predizione . . . 128

4.4.1 Schema delle Funzioni Principali . . . 128

4.4.2 Descrizione Logica . . . 131 5

(4)

4.5 L’Interfaccia Utente . . . 135

4.5.1 Esempio di Funzionamento del Predittore . . . 138

4.6 Fase di Verifica e Test Effettuati . . . 146

4.6.1 Risultati Ottenuti . . . 147

4.6.2 Metodologia di Test . . . 148

4.6.3 Valutazione dei Risultati . . . 149

5 Conclusioni e Sviluppi Futuri 153

Appendice A 156

Appendice B 166

Bibliografia 180

6

Riferimenti

Documenti correlati

6 Anno Settore economico Numero occupati. (Valore

dotata di sistema per l'apertura automatica. L'arresto ai piani deve avvenire con autolivellamento con tolleranza massima 2 cm. Lo stazionamento della cabina ai piani

Quest’ultimo avrà l’onere di elaborare, relativamente ai costi della sicurezza afferenti all’esercizio della propria attività, il documento di valutazione dei rischi e

9.1 Si procederà all’aggiudicazione della gara in presenza almeno di due offerte valide. La procedura di valutazione delle offerte si interrompe quando resta una sola

Al datore di lavoro, titolare delle attività svolte nei luoghi in cui verrà espletato l’appalto, la norma pone l’obbligo di integrare il predetto documento

“Quando va a fare la spesa, secondo lei, quali fra gli ALIMENTI che compra fanno meglio alla salute?”. “In quest’ultimo anno le è mai capitato di cercare informazioni sul

dalle 9,00 alle 11,30 Attività ludico – ricreative: i bambini, divisi per gruppi di 5 unità per età omogenea, alla presenza di un educatore, svolgeranno le

GL WDOL FRQFHWWL DOOD SUHVD LQ FDULFR GHOOH SHUVRQH FRQ GLVDELOLWj JUDYLVVLPH WUD FXL OH. SHUVRQH LQ 69 H 60& ,O FRQFHWWR GL FXUD LQWHVR