Come le imprese
possono usare i discorsi
Perché distinguere dati fattuali e opinioni
Fabrizio Sebastiani Gruppo Human Language Technologies – NeMIS Lab Istituto di Scienza e Tecnologie dell’Informazione Consiglio Nazionale delle Ricerche 56124 Pisa
Cos’è la Corporate Reputation?
“Corporate reputation affects the way in which various stakeholders behave towards an
organization, influencing, for example, employee retention, customer satisfaction and customer
loyalty.”
Corporate reputation: Meaning and measurement, Volume: 7, Issue: 2, Pages: 91-109, First published: 25 November 2005, DOI: (10.1111/j.1468- 2370.2005.00109.x)
User Generated Content
Net-consumatori
Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.
Anche se il negozio fisico resta ancora un luogo importante,
• il 62% degli utenti su scala mondiale commenta un prodotto o servizio online dopo l’acquisto.
• se si aggiungono post e tweet il dato arriva al 69%
• il 55% degli utenti ibridi (coloro che si informano in rete ma poi effettuano l’acquisto in un punto vendita) postano commenti.
www.globalwebindex.com
Net-consumatori
Della Volpe, M. (2013). Imprese tra web 2.0 e big data. Nuove frontiere per innovazione e competitività, CEDAM.
Anche se il negozio fisico resta ancora un luogo importante,
dobbiamo prendere seriamente in considerazione il modello di impresa che emerge dall’adozione strategica
dei social media.
www.globalwebindex.com
Filtrare l’informazione automaticamente
Fatti Opinioni
Gli spinaci sono ricchi di ferro Gli spinaci hanno un brutto sapore
Filtrare l’informazione automaticamente
Fatti Opinioni
Gli spinaci sono ricchi di ferro
• Oggettivi
• Ritraggono la realtà
• Possono essere verificati
• Presentati con obiettività
Gli spinaci hanno un brutto sapore
• Soggettive
• Interpretano la realtà
• NON possono essere verificate
• Presentate attraverso una valutazione
Filtrare l’informazione automaticamente
Fatti Opinioni
• Data Mining
• Information Retrieval
• Information Extraction
• Opinion Mining
• Sentiment Classification
• Feature-based Sentiment Analysis
Filtrare l’informazione automaticamente
Metodi Rule-Based
cercano di imitare il modo in cui l’uomo utilizza e comprende il linguaggio, riproducendo le strutture
sintattiche che sono alla base di questo processo di comprensione, costruendo
risorse lessicali come i dizionari elettronici, le tassonomie, le ontologie
Metodi Stocastici
trattano la lingua come un insieme di parole, quantificando queste in
modo matematico e cercando di estrarre informazioni senza la necessità di individuare le
strutture sintattiche o, addirittura, cercando di
rendere capace la macchina stessa di imparare la sintassi.
Filtrare l’informazione automaticamente Quali Vantaggi?
• Ads placement
• Text summarization
• Recommendation systems
• Flame and cyberbullying detection
• Literary reputation tracking
• Political texts analysis
Cos’è l’Analisi dei Sentimenti
La Sentiment Analysis (SA) consiste nel trattamento automatico di opinioni e sentimenti espressi all’interno di testi non strutturati.
Sono sinonimi della SA opinion mining, subjectivity analysis, or appraisal extraction.
Alcune sfide nella ricerca sulla SA
:• Sentiment and Subjectivity Classification,
• Feature-based Sentiment Analysis,
• Sentiment Analysis of comparative sentences,
• Opinion search and retrieval,
• Opinion holders, Opinion features and opinion targets extraction.
12
Cos’è un’opinione?
o j , f jk , oo ijkl , h i , t l
dove
o
j è l’oggetto sul quale viene espressa l’opinionef
jk rappresenta le caratteristiche (features) dell’oggettooo
ijkl è l’orientamento (positivo o negativo) dell’opinioneh
i è opinion holder, colui che esprime l’opinionet
l rappresenta il tempo in cui l’opinione viene espressa13
Liu, B. (2010). Sentiment analysis and subjectivity. Handbook of natural language processing, 2, 568.
Cos’è un’opinione?
Cos’è un’opinione?
Cos’è un’opinione?
Cos’è un’opinione? o j
Cos’è un’opinione? o j, f jk
Cos’è un’opinione? o j, f jk, oo ijkl
Cos’è un’opinione? o j, f jk, oo ijkl, h
iCos’è un’opinione? o j, f jk, oo ijkl, h
i,t
lCos’è un’opinione? I dati non strutturati
Cos’è un’opinione? I dati non strutturati
Cos’è un’opinione? I dati non strutturati
Indicatori di Sentimento
• Parole dotate di Orientamento
Semantico
1. gentile +2
2. pulito +2
3. abbondante +
4. buono +2
5. esagerato +
6. spettacolare +3
7. lussuoso +2
8. bene +2
Cos’è un’opinione? Strutturare i dati
Indicatori di Sentimento
• Espressioni dotate di Orientamento Semantico
Contextual Valence Shifters:
1. molto gentile 2. non spettacolare 3. non lussuoso
4. avere da ridire sul prezzo
Dipendenza dal dominio:
1. hotel molto caratteristico 2. Colazione abbondante 3. arredo con tutto
l’occorrente 4. prezzo esagerato
Cos’è un’opinione? Strutturare i dati
Sentiment Polarity Classification
Correzione. Polarity Switching: 4 stars → 2 stars
Ridimensionamento. Polarity Shifting : 4 stars → 3 stars
Sentiment Polarity Classification
Correzione. Polarity Switching: 4 stars → 2 stars
Ridimensionamento. Polarity Shifting : 4 stars → 3 stars