• Non ci sono risultati.

SVILUPPO DI UN CONTENT MANAGEMENT SYSTEM PER LA GESTIONE DI WEB AVATAR

N/A
N/A
Protected

Academic year: 2021

Condividi "SVILUPPO DI UN CONTENT MANAGEMENT SYSTEM PER LA GESTIONE DI WEB AVATAR"

Copied!
19
0
0

Testo completo

(1)

Facoltà di Ingegneria

Laurea in Ingegneria Informatica

Tesi di laurea

SVILUPPO DI UN CONTENT

MANAGEMENT SYSTEM PER LA

GESTIONE DI WEB AVATAR

Candidato:

Carini Andrea

Relatori:

Prof. Prete Cosimo Antonio

Prof. Foglia Pierfrancesco

Ing. Zanda Michele

(2)
(3)

Introduzione

5

1.

Le interfacce Multimodali

7

1.1 La comunicazione vocale e visiva

9

1.2 Gli web avatar : un esempio di IM

11

1.3 Informazioni multimodali trasmesse da un web avatar

14

1.4 Rappresentazione delle emozioni tramite una IM

18

2.

Strumenti utili per la realizzazione di una IM

20

2.1 Speech Engine

20

2.2 Avatar Animati

27

2.3 Linguaggio lato client : Javascript

38

3.

Case Study : Integrazione di web avatar su siti di Pubbliche

Amministrazioni

39

3.1 Il progetto EasyGov

39

3.2 La realizzazione

40

4.

Il Content Management System

44

4.1 Stato dell’Arte

44

4.2 Gli strumenti utilizzati: Web Application Server e JSP

46

4.3 Struttura di un CMS

49

4.4 Il funzionamento

50

4.4.1 Scelta del file da modificare

51

4.4.2 Caricamento della pagina web di front-end

53

4.4.3 Interazione con la copia di front-end della pagina web

55

(4)

4.5 Risultato Finale

61

4.6 Cenni implementativi del progetto

63

4.7 Le innovazioni e i possibili sviluppi

63

5. Conclusioni

64

APPENDICE A

65

APPENDICE B

66

APPENDICE C

67

APPENDICE D

68

BIBLIOGRAFIA

70

(5)

5

Introduzione

Oggigiorno la ricerca nel settore del software mira ad ottenere sistemi capaci di raggiungere gli scopi richiesti dall’utente, senza che questi debbano specificare il modo in cui il sistema deve muoversi, ma semplicemente istruendo delle linee guida o degli obbiettivi di massima.

L’evoluzione che si vuole raggiungere, però, non riguarda esclusivamente la capacità di un computer di svolgere determinate operazioni, ma piuttosto il tipo di interazione che coinvolge l’utente e il sistema. La comunicazione tra utenti e macchine è sempre stato un argomento complesso e difficile da sviluppare, a causa del fatto che la struttura interna dei computer è sempre stata progettata per adattare gli utenti al modo di funzionamento delle macchine e mai avvicinare le macchine al modo di operare degli utenti.

A tal fine la Human Computer Interaction (HCI) ha creato una nuova area di studio e cioè quella sulle interfacce multimodali, una nuova specie di interfacce il cui obiettivo è quello di consentire una migliore comunicazione tra l’uomo e il computer attraverso una sorta di antropomorfizzazione di quest’ultimo.

Analizzando la comunicazione umana si vede come l’approccio vocale venga integrato da altri canali come la tonalità di voce, le espressioni facciali, la postura e i gesti per trasportare emozioni, atteggiamenti e tratti personali. Questo ha portato gli studi verso una direzione ben precisa: “Creare un’interfaccia capace di trasmettere emozioni ”.

Questa tesi vuole mostrare come sia già tecnologicamente fattibile la realizzazione di interfacce multimodali specifiche per un contesto , capaci di interagire con l'uomo tramite il linguaggio naturale e le emozioni.

(6)

Sviluppo di un Content Management System per la gestione di web avatar Carini Andrea

6

La tesi ha quindi tre obbiettivi :

1. Riassumere il corpo teorico contenente tutti gli elementi necessari per le varie funzionalità che una Interfaccia Multimodale ( web avatar ) richiede e definire l'architettura software e hardware generica per la realizzazione di un web avatar.

2. Descrivere un esempio di applicazione dell'architettura individuata in un contesto reale.

3. Realizzare un Content Management System che permetta di integrare una IM in un sito web generico anche a utenti poco esperti in materia.

Nel primo capitolo ( Cap. 1 ) l'elaborato introduce i concetti chiave che inquadrano l'ambito del progetto e prosegue ( Cap. 2 ) illustrando gli strumenti utili per la realizzazione di tale tecnologia.

Nel capitolo 3 viene presentato il case-study dell'assistente virtuale CrazyTalk integrato nel nuovo sito del Comune di San Giuliano Terme.

Vi è un'ultima parte applicativa ( Cap. 4 ) nella quale vengono illustrate tutte le fasi di realizzazione del Content Management System .

L'ultimo capitolo ( Cap. 5 ) è destinato alle conclusioni e ad alcune riflessioni su quali possano essere gli eventuali sviluppi futuri di tali tecnologie.

(7)

7

1. Le interfacce Multimodali

Si parla di multimodalità quando un qualsiasi tipo di interazione coinvolge più di un canale percettivo o input di comunicazione. L’esempio più eclatante è senz’altro la comunicazione umana durante la quale vengono stimolati più sensi contemporaneamente : la vista, l'udito, il tatto e anche l'olfatto.

Rimanendo nell’ambito della Human Computer Interaction con multimodalità si intende “la

comunicazione con sistemi di computer attraverso le modalità di input percettivi comunemente utilizzate dall’uomo per interagire con il mondo” ; quindi non più ristretta all’uso della tastiera o

del mouse ma anche attraverso la parola, i gesti o la scrittura ( in questo caso non si intende la videoscrittura, ovvero quella mediata da una tastiera, ma piuttosto la tradizionale scrittura a mano). E' utile fare una precisazione: distinguere la multimodalità dalla multimedialità .

La prima è usata specificatamente per riferirsi alle modalità di input dell’interazione, mentre la seconda sottolinea la presenza contemporanea di più meccanismi di output (audio, video etc.).

L’essere umano percepisce il mondo attraverso i cinque sensi, tre dei quali (vista, udito, tatto) sono indispensabili per comunicare. La comunicazione attraverso un senso è definita come “modo” (di comunicazione).

Le Interfacce Multimodali, come dice il termine stesso, integrano più modi di comunicazione, esattamente come fa l’uomo nella sua vita quotidiana.

Analizzando la comunicazione monomediale (che viene realizzata utilizzando un solo modo di comunicazione) , possiamo affermare che essa è generalmente imposta agli utenti dalle restrizioni tecnologiche. Si pensi al telefono ad esempio: non tutti i generi di informazioni sono facili da veicolare e assimilare quando la parola è l’unica modalità a disposizione. Anche l’interfaccia grafica di Windows, tanto comune e impiegata dalla maggior parte degli utilizzatori di PC, subisce le restrizioni imposte dal fatto che solitamente lo schermo, la tastiera e il mouse siano gli unici dispositivi disponibili.

L’utilizzo del computer necessita la conoscenza e la capacità di utilizzare una serie di strumenti sia hardware che software. Gli utenti più esperti spesso si stupiscono davanti ai neofiti che si trovano impacciati nel manovrare in modo coordinato uno strumento tanto comune come il mouse, o che non hanno idea di come si raggiungano e ottengano le informazioni ad esempio sulla disponibilità di un volo senza dover necessariamente mettersi in contatto con una agenzia di viaggi.

(8)

Sviluppo di un Content Management System per la gestione di web avatar Carini Andrea

8

Chi utilizza un computer da tempo quasi non si rende più conto che per fare uso di tutti questi strumenti, occorre servirsi di un preciso standard di comunicazione tra utente e macchina, standard che è tipicamente costituito sia da comandi inseriti in un linguaggio formale profondamente strutturato, che da azioni tipo "seleziona e rilascia" gestite dal mouse.

Attualmente queste modalità sono molto evolute e continuano a perfezionarsi, ma comunque non raggiungono i livelli del linguaggio naturale che porterebbero ad una migrazione verso un approccio multimodale della comunicazione tra uomo e macchina. Ciò non significa che sia necessario soppiantare totalmente gli attuali sistemi di interazione, anche perché studi in merito hanno evidenziato l’efficacia non solo del linguaggio sia scritto che parlato, ma anche delle indicazioni grafiche e delle selezioni via mouse che si effettuano direttamente sul video. Piuttosto sembra adeguata una comunicazione a più livelli.

Gli studi nel settore stanno procedendo con la consapevolezza che alcune tecnologie saranno presto possibili, mentre altre potranno vedere la luce solo nel medio - lungo periodo.

Sussiste comunque il desiderio di creare un ambiente intelligente: una situazione in cui gli utenti potranno comunicare con reti e sistemi come se stessero parlando con altri esseri umani.

Se si riuscisse davvero a contrastare i limiti che attualmente vigono sulla tecnologia, molti servizi diverrebbero più semplici da fruire e di conseguenza più attraenti per un pubblico più ampio.

Per raggiungere un tale obiettivo, l’interfaccia tra l’utente e l’ambiente intelligente dovrebbe essere completamente trasparente e la comunicazione dovrebbe essere multimodale come quella tra esseri umani. Certi livelli potranno essere raggiunti solo quando il computer "avrà imparato" piuttosto bene il linguaggio dell’utente.

Inoltre il “bisogno” di multimodalità è accresciuto dalla tendenza attuale che tenta di miniaturizzare tutti i sistemi computerizzati (computer, palmari, telefoni cellulari etc.). Basti pensare alla tecnologia wireless, con schermi sempre più piccoli e più comodi da trasportare: la tastiera, il classico sistema di input, dovrà trovare un valido sostituto in grado di offrire le stesse funzioni in dimensioni molto ridotte.

(9)

9

1.1 La comunicazione vocale e visiva

La comunicazione vocale è il trasferimento di informazione da una persona all'altra attraverso il parlato e consiste nella variazione di pressione che viene dalla bocca del parlante. Tali variazioni di pressione si propagano come onde attraverso l'aria e raggiungono le orecchie dell'ascoltatore, il quale decifra le onde nel messaggio ricevuto.

La concatenazione di eventi che vanno dal concepimento del messaggio nel cervello del parlante all'arrivo del messaggio alle orecchie dell'ascoltatore è chiamata “catena del parlato”.

La generazione di parlato sintetico cioè attraverso un computer, può svolgere il ruolo del parlante e avviene normalmente attraverso un testo e un motore software capace di riconoscere le frasi dettate. La comunicazione vocale tra umani e computer include la sintesi del parlato dal testo ( Text-To-Speech) e il riconoscimento automatico del parlato (Automatic Speech Recognition, ASR). La progettazione di algoritmi per eseguire questi due compiti è stata più efficace per la sintesi che per il riconoscimento, a causa delle asimmetrie nella produzione e nell'interpretazione del parlato umano. Attualmente esistono in commercio sintetizzatori che riescono a riprodurre quasi perfettamente la voce umana dei quali vedremo le caratteristiche nei paragrafi successivi.

La vista è il più importante sistema sensoriale dell'uomo, dal quale otteniamo il maggior numero di informazioni sull'ambiente che ci circonda. Lo studio di questo settore rappresenta uno degli argomenti più importanti delle Scienze Cognitive e dell'Intelligenza Artificiale in quanto, per poter costruire macchine artificiali capaci di eseguire compiti adattivi complessi, in ambienti in continuo mutamento, sicuramente devono essere dotate di capacità visive.

Il volto è il luogo dove si concentra la maggior parte delle informazioni sensoriali sia che un soggetto le esibisca come emittente o che le "legga" come ricevente sul volto dell'altra persona, all'interno di un processo comunicativo.

Inoltre il volto è l'area di maggiore interesse per lo studio delle emozioni principali quali la sorpresa, la paura, il dolore, il disgusto, il disprezzo, la tristezza e la felicità che sono registrate da cambiamenti dei muscoli della fronte, delle sopracciglia, delle palpebre, delle guance, del naso, delle labbra e del mento.

(10)

Sviluppo di un Content Management System per la gestione di web avatar Carini Andrea

10

Il bisogno di vedere in faccia il nostro interlocutore indica l'importanza di questa parte del corpo nel veicolare messaggi. Infatti, l'espressione del volto muta col mutare della posizione degli occhi, del naso, della bocca, delle sopracciglia, dei movimenti dei muscoli facciali.

Tale segnale è usato per comunicare atteggiamenti ed emozioni e si adopera anche in stretta combinazione con il linguaggio verbale, in entrambi gli interlocutori. Il parlante accompagna il suo discorso con alcune espressioni facciali che servono a interpretare, inquadrare, modificare, e attribuire valore a ciò che sta dicendo. L'ascoltatore esprime le sue reazioni a ciò che gli viene detto con piccoli movimenti delle sopracciglia, delle labbra, della fronte, che indicano l'atteggiamento (positivo o negativo) verso quello che il suo interlocutore sta dicendo: si possono manifestare accordo o disaccordo e una gamma molto varia di emozioni che vanno dalla sorpresa all'incredulità, dal dolore all’indifferenza ecc.

In conclusione possiamo dire che vista e udito sono i sensi che meglio replicano il concetto di multimodalità nella comunicazione uomo-macchina ; nei capitoli successivi vedremo come sono stati impiegati al meglio tali sensi per la progettazione di una interfaccia multimodale.

(11)

11

1.2 Gli "web avatar" : un esempio di IM

Sebbene negli ultimi anni la sintesi automatica da testo, cioè la riproduzione di un testo scritto tramite una voce sintetica (Text-To-Speech, TTS), abbia raggiunto un grado di qualità tale da poter essere utilizzata proficuamente in moltissime applicazioni , l’interesse degli studiosi di speech

communication, degli specialisti in speech technology ed in computer graphics, come pure del

mondo industriale e commerciale che ruota intorno alle utilizzazioni della rete nell'accesso a banche dati, nell' e-commerce e nell' e-learning si è rivolto, più recentemente, all'implementazione di sistemi di sintesi automatica bimodale audio-visiva che prevedono la messa a punto di Web Avatar ( più comunemente chiamate Facce Parlanti ) capaci di emulare il comportamento di un essere umano.

Da un punto di vista grafico sono rappresentati come persone umane, generalmente come mezzo busto, in grado di parlare, muoversi, ridere, piangere, ecc.. Lo scopo è chiaro: trasportare su web le emozioni e le interazioni derivate da una conversazione diretta fra due persone ; rendere cioè un’operazione su un sito il più simile possibile a quella eseguita nella realtà, senza per questo perdere i vantaggi derivati dall’uso della rete.

(12)

Sviluppo di un Content Management System per la gestione di web avatar Carini Andrea

12

Questo tipo di sintesi si propone come:

• più naturale (o ecologica), perché riproduce le condizioni di trasmissione di informazione multimodale (extra-linguistica, paralinguistica e linguistica) e multicanale (acustico - uditiva e ottico visiva) che caratterizzano l’atto di comunicazione orale faccia-a-faccia;

• più robusta, perché le informazioni visive interagiscono nella decodificazione del messaggio in modo complesso, dato che possono essere ripetitive, integrative o sostitutive delle informazioni acustico - uditive con cui sono coprodotte. Il loro ruolo diventa ovviamente più rilevante nelle condizioni in cui il segnale acustico risulta disturbato, ridotto o danneggiato in situazioni particolari.

• più amichevole, perché la trasmissione di emozioni e di atteggiamenti interpersonali tramite le espressioni facciali, oltre a quella dell’informazione linguistica, rende più soddisfacente, piacevole, stimolante l’interazione con la macchina e sembra determinare nell’utente una maggiore attenzione e motivazione;

rispetto alla sintesi unimodale acustico - uditiva, ma per essere implementata necessita di tutte le conoscenze linguistiche e psicologiche sulle informazioni trasmesse o trasmissibili nei diversi canali sensoriali in situazioni di comunicazione faccia-a-faccia.

Gli web avatar sono rappresentati come persone in grado di sostenere una conversazione unilaterale con l’utente. Con la loro voce e con i loro movimenti possono indicare all’utente la strada corretta per portare a termine una determinata operazione oltre a fornire informazioni aggiuntive rispetto a quelle già apprese da quest'ultimo all’interno del contesto nel quale vengono inserite.

Dunque la grande innovazione delle Interfacce Multimodali è data dall’interazione voce/animazione; difatti la faccia può emulare il comportamento di un essere umano, può ridere, piangere, arrabbiarsi e così via.

Ovviamente le varie espressioni che l'avatar assume devono essere contestualizzate correttamente con le operazioni che l’utente compie (ad es. arrabbiarsi in caso di errore o sorridere in caso di operazione corretta ).

(13)

13

Le potenzialità degli Avatar sono estremamente ampie, in quanto si prevede che possano essere applicate in vari tipi di interazione uomo-macchina sia per soggetti normali che patologici.

Vediamo qualche esempio:

• Recupero Informazioni: Possono permettere il recupero delle informazioni da una base dati sia interna che esterna. Questo perché il linguaggio naturale ha un potere espressivo maggiore rispetto alle attuali “query” effettuate sui motori di ricerca e quindi è possibile ricercare informazioni in modo più preciso.

• Guida : Un web avatar può fornire la giusta dose di informazioni , contestualizzate , a riguardo di un percorso specifico o di un ambiente. Sono efficaci quelli strutturati per fornire assistenza nei siti web ( che è lo scopo di questo lavoro ) con il ruolo di assistenti

alla navigazione.

• Risoluzione Problemi : è un processo solitamente iterativo composto da una serie di bivi lungo cui procedere per arrivare a capire ove si possa intervenire efficacemente. Accoppiando un assistente virtuale con un sistema esperto che agisce in un preciso contesto, è possibile utilizzarli per fornire supporto tecnico , anche molto specialistico, ove il parlato viene fortemente valorizzato da un processo che richiede una serie sequenziale di domande e risposte per procedere.

• Insegnamento : possono essere impiegate per l’insegnamento della fonetica della lingua materna e di lingue straniere.

• Handicap : un'altra applicazione interessante è quella di essere utilizzate per fornire supporto a soggetti ipoacustici o ipovedenti che attraverso esse potrebbero utilizzare ugualmente il web senza alcuna restrizione.

(14)

Sviluppo di un Content Management System per la gestione di web avatar Carini Andrea

14

1.3 Informazioni multimodali trasmesse da un web avatar

E' ormai diffusa in tutti gli studiosi di speech communication la consapevolezza che tanto il segnale acustico quanto quello visivo trasmettono contemporaneamente informazioni extralinguistiche, paralinguistiche e linguistiche e quindi per mettere a punto una faccia parlante adattabile a vari compiti e utilizzabile in situazioni diverse si dovrà essere in grado di scegliere l'informazione non solo indispensabile, ma anche più adatta.

Oltre alle informazioni extralinguistiche relative a razza, sesso ed età dell'ipotetico parlante e quelle idiosincratiche (morfologia della faccia, degli occhi, del naso, ecc., frequenza di vibrazione delle corde vocali, intensità del parlato, ecc) che pure sono importanti dal punto di vista sociale e sociolinguistico per tutte le applicazioni prima citate (si pensi agli attori virtuali, alle protesi per la comunicazione aumentata per soggetti handicappati, ecc.), un web avatar deve trasmettere correttamente informazioni linguistiche e paralinguistiche, selezionabili a seconda degli scopi e delle applicazioni.

Le Interfacce Multimodali quali le Facce Parlanti espressive si propongono di sintetizzare parlato emotivo in cui i segnali acustici e visivi che trasmettono le informazioni linguistiche sono coprodotte con i movimenti facciali e labiali corrispondenti a emozioni e ad atteggiamenti.

A tal proposito, in una situazione di interazione faccia-a-faccia vengono trasmesse contemporaneamente, tramite i segnali acustici e visivi, informazioni di vario tipo:

- informazioni extralinguistiche relative a razza, sesso, età, stato di salute e identità del soggetto. Queste informazioni vengono veicolate nella modalità visiva dalla dimensione e forma della testa e degli organi che la costituiscono, dal colore di pelle, occhi, capelli, dalla presenza o assenza di rughe, ecc. e nella modalità acustica principalmente dai valori della frequenza fondamentale (F0) a cui vibrano le corde vocali.

- Informazioni paralinguistiche, relative agli stati affettivi e alle emozioni che i soggetti vogliono trasmettere. Queste informazioni sono veicolate nella modalità visiva da specifiche configurazioni della bocca e delle sopracciglia, dallo sguardo, da aggrottamenti della fronte, arricciamenti del naso, ecc., come è descritto con grande precisione dal FACS (Facial Action Coding System) di Ekman e Friesen 1978, elaborato per illustrare le azioni muscolari sottostanti le configurazioni delle emozioni. Nella modalità acustica le emozioni sono veicolate da specifiche gamme di variazione dei

(15)

15

valori della frequenza fondamentale, dell’intensità e della durata rispetto a quelli che caratterizzano le produzioni non emotive ed enunciative.

- Informazioni linguistiche, relative alla realizzazione articolatoria e acustica delle unità segmentali e soprasegmentali che costituiscono gli enunciati linguistici. Nella modalità visiva i movimenti articolati visibili di labbra, mandibola, lingua permettono di individuare i visemi, gruppi di fonemi vocalici e consonantici omofoni, cioè le cui caratteristiche visibili sono simili mentre le informazioni relative alla prosodia e all’intonazione vengono veicolate anche da movimenti della testa, innalzamenti delle sopracciglia, battiti delle palpebre, cioè dalla cosiddetta visual prosody . Nella modalità acustico - uditiva le informazioni linguistiche segmentali relative a consonanti e vocali vengono trasmesse dalle caratteristiche spettrali delle onde periodiche, aperiodiche e transienti generate dai diversi modi e luoghi di articolazione, mentre le variazioni dell’F0, dell’intensità e della durata dei singoli foni, come pure la produzione delle pause dipendono dalla struttura sintattica, dalla struttura dell’informazione e dalle caratteristiche pragmatiche degli enunciati.

(16)

Sviluppo di un Content Management System per la gestione di web avatar Carini Andrea

16

Detto ciò, potremo esprimere tutte queste informazioni tramite:

• movimento delle spalle e del collo: vengono usati per fornire movimento laterale alla interfaccia. È possibile, infatti, far ruotare la faccia di qualche grado a sinistra o a destra e conseguentemente di piegare la testa in basso o in alto. Con questa possibilità si cerca di aiutare l’utente indicandogli una sezione del sito, una scritta (un collegamento) o un’immagine;

• movimento degli occhi e delle sopracciglia: insieme al movimento delle spalle e del collo forniscono un’indicazione spaziale all’interno della pagina web. Inoltre occhi e sopracciglia sono gli elementi fondamentali per imprimere un’espressione facciale particolare all’interfaccia. Ad esempio occhi molto aperti possono fornire un’espressione di sorpresa, oppure sopracciglia molto strette possono simulare un momento di rabbia;

• movimento della bocca, del naso e del mento: questi tre elementi sono utilizzati in modo particolare in presenza di uno script audio. Il movimento della bocca e del mento simula l’evento della conversazione, il naso invece fornisce un’espressione più realistica;

In figura è riportato un esempio di avatar animato creato tramite uno dei programmi disponibili in commercio e che vedremo in seguito. Come si può notare, i tratti somatici della nostra IM vengono ben definiti per mezzo di rette e punti necessari per specificare quali zone del viso devono subire deformazioni per emulare al meglio i movimenti classici del viso di un essere umano durante il processo di conversazione.

(17)

17

Le linee continue nere rappresentano i contorni degli elementi descritti in precedenza: queste informazioni devono essere fornite preventivamente al programma che esegue l’animazione dell’interfaccia.

I punti bianchi consentono allo sviluppatore di modificare il percorso delle linee in modo tale da approssimarle a delle curve; in questo modo i movimenti del viso risulteranno più fluidi e si noterà meno il fenomeno dello spostamento asimmetrico del volto.

I punti gialli invece indicano le zone "statiche" ovvero le parti della retta che devono subire una fluttuazione minima ( parte centrale della bocca e parte superiore degli occhi ad esempio).

Come si può notare la densità maggiore di punti è negli occhi e nella bocca, proprio perché il movimento delle labbra e delle palpebre sono fondamentali per imprimere una certa espressione facciale.

(18)

Sviluppo di un Content Management System per la gestione di web avatar Carini Andrea

18

1.4 Rappresentazione delle emozioni tramite una IM

Dovendo applicare le emozioni ad un sistema complesso, l’obiettivo del nostro punto di vista su questi studi comprende la ricerca delle emozioni primarie cioè quelle emozioni che non sono ulteriormente scomponibili in impulsi più semplici.

Queste sono molto utili perché una volta definite, è possibile utilizzarle come metro di riferimento sia per la comprensione degli stati emotivi, sia per la corretta espressione dell’assistente virtuale. Inoltre, essendo primarie significa che sarà possibile comporle in modo da generare un più ampio spettro di emozione, a partire da pochi valori.

Secondo uno studio condotto nel 1980 da Plutchik, analogamente a quanto avviene per i colori, le emozioni primarie sono sei :

1. Felicità 2. Sorpresa 3. Disgusto 4. Rabbia 5. Paura 6. Tristezza

e vengono rappresentate per mezzo di un cerchio diviso in tante sezioni: ognuno di esse individua una emozione primaria . Tutte le altre emozioni possono essere viste come combinazione lineare fra due o più primarie.

(19)

19

Le Interfacce Multimodali rappresentano le varie emozioni per mezzo delle espressioni facciali e della tonalità di voce ; è possibile modificare opportunamente i vari parametri relativi al viso e alla voce di una "faccia parlante" per poter esprimere al meglio uno specifico stato d'animo.

Per quanto riguarda le espressioni facciali vediamo due esempi.

Figura 5 Espressione Triste

Figura 6 Espressione Felice

Nelle due figure sopra sono rappresentante le due situazioni limite: dispiacere e gioia. Nella prima figura gli occhi semichiusi e le labbra rivolte verso il basso indicano un senso di tristezza, mentre nell’immagine successiva si possono notare gli occhi molto aperti e le labbra rivolte verso l’alto in segno di felicità.

Figura

Figura 1 Esempio Web Avatar ( software CrazyTalk )
Figura 3 Tratti somatici Interfaccia Multimodale Base e Dettagliata
Figura 4 Cerchio delle emozioni di Plutchik
Figura 5 Espressione Triste

Riferimenti

Documenti correlati

Quando si utilizza FrontPage Explorer per aprire un Web situato su un server che dispone delle estensioni di FrontPage, tutte le informazioni relative al Web di FrontPage, ad

30] (including assistive technologies) render side-by-side text correctly, provide a linear text alternative (on the current page or some other) for all tables that lay out text

La valorizzazione via mercato delle razze locali (costituite dal germoplasma ma anche dai saperi e dalle modalità di organizzazione della produzione ad esse collegate) attraverso

In particolare, sono state definite tre tipologie di tabelle: le tabelle degli allegati, che contengono tutti i dati riguardanti le configurazioni d’impianto; la tabella stato

Lo storico delle versioni viene rappresentato con dei cerchi sovrapposti di diverse tonalit`a, ogni tonalit`a `e una revisione del nodo che pu`o essere fatta indifferentemente da

essendo dedicato alla realizzazione di siti e portali, è “general purpose”, cioè non indirizzato ad una particolare tipologia di contenuti. Esistono, prescindendo dalle

A system for tissue microarray data management has been developed, tested on in thyroid proliferative lesions microarrays, and made available to the public in the form of

italian journal of management Vol. In this way, the French legislation seems to have supported the development of investors’ specific skills, allowing them to consciously