• Non ci sono risultati.

Il DataBase che contiene le informazioni dei Forum analizzati dallo strumen- to SentiEngine è stato interrogato per ottenere un elenco degli argomenti su cui orientare la metrica. L'estrazione è stata eseguita per ottenere un con- fronto tra i forum sulla base degli stessi soggetti di ricerca, per determinare quello con maggior inuenza nell'argomento. Il risultato di questa azione è stato quello di ottenere una quantità estremamente elevata di voci divise in category, brand, subject su cui poter eettuare il confronto dei siti e selezionare quelle più signicative per proseguire nell'individuazione di una metrica adatta. La metrica non può essere determinata in base alla scelta delle voci estratte poiché riguardano molto specicatamente prodotti farma- ceutici e non si otterrebbe una misurazione generale dei forum, si aggiunge anche il fattore limitante del numero del campione che rende ogni osserva- zione priva di signicato statistico. L'idea che è stata alla base della ricerca è quella di assegnare il punteggio di inuenza semantico al forum in base al numero di occorrenze che si registrano per le parole relative alla category, al brand e al subject e di comporre la metrica pesando il risultato dei tre parametri. La grande specializzazione dello strumento SentEngine ha reso dicoltosa l'operazione di confronto tra forum poiché l'osservazione di un prodotto in particolare riferita a una categoria di disturbi e argomenti sani- tari non è abbastanza esauriente ed esaustiva riguardo all'argomento stesso, perché non si tiene conto di altri prodotti che concorrono nella trattazione del disturbo. A causa di questi problemi non è stata prodotta alcuna me- trica riferita ai contenuti semantici, lasciando però lo spunto per chi volesse proseguire nella sua determinazione suggerendo un ampliamento del campio- ne e lo sviluppo di un modello di dominio farmaceutico orientato all'ambito customer.

Conclusioni

A partire dalle ricerche già eettuate sulla ricerca delle fonti, la loro impor- tanza e conseguente evoluzione tramite internet hanno portato allo studio mirato delle comunità virtuali, i forum, concentrando le osservazioni attorno ad un ampio argomento che è la farmaceutica e la cura del paziente. Questa specicazione ha permesso di raggiungere l'obiettivo pressato e cioè deter- minare un metodo per classicare i forum in ordine di inuenza e portata visiva da parte degli utenti online, creando alle aziende interessate delle op- portunità di tipo pubblicitario e divulgativo.

Una prima fase di analisi qualitativa delle fonti ha permesso di determinare 5 parametri fondamentali in grado di descrivere l'attività degli utenti e il traco di informazioni di ogni forum solo basandosi sui contenuti numerici ricavabili dal sito, tra cui il numero degli utenti iscritti, il numero di utenti attivi, il numero di post totali, la distanza in giorni tra l'apertura di una discussione e la prima risposta, la media di post per ogni discussione. Per ritenere il punteggio attuale, la scansione dei forum ha preso in conside- razione gli ultimi sei mesi, approttando della caratteristica dei forum che mantengono in memoria le discussioni e disponibili per la consultazione in ogni momento.

Qualora non sia possibile determinare alcuni dei 5 termini sono state pro- poste varianti della metrica principale denendo superui alcuni termini,

CAPITOLO 6. CONCLUSIONI 83 poiché considerati ridondanti nello studio di correlazione statistica, tra di essi: il numero di utenti attivi, il numero di post totali e la distanza tra apertura thread e prima risposta.

Il punteggio dei forum può assumere diverso valore informativo se vengo- no modicati i pesi della metrica, inducendo a privilegiare il contributo di determinati parametri. Nel caso di pesi equivalenti e metrica denita solo numericamente sono stati classicati molto inuenti i seguenti forum: U.S. MessageBoard, ThreeFatChicks, HealthBoard e WomensHealth. Utilizzando le metriche dopo lo studio statistico non ci sono state riclassicazioni ecces- sive, mantenendo l'ordine di importanza con poche sorprese. Oltre l'analisi numerica dei forum è stata determinata la metrica che rileva il traco nu- merico in base a parole chiave, cercando di avvicinarsi ad una classicazione orientata al signicato. Come ipotizzato i dati ricavati tramite parole ltro hanno permesso di rivalutare alcuni forum, assegnando loro un punteggio su- periore rispetto a quello ottenuto in precedenza. In questo scenario i forum più inuenti relativi alla parola chiave diet sono stati: ThreeFatChicks, Lo- wCarbFriends, HealthBoard; per la parola chiave diabete: ThreeFatChicks, LowCarbFriends, U.S. MessageBoard; mentre per la parola ltro choleste- rol: ThreeFatChicks, LowCarbFriends ed HealthBoard exequo, LowCarber. Un ulteriore passo è stato quello di determinare precisamente il traco re- lativo ad un argomento sfruttando uno strumento in grado di determinare semanticamente ogni messaggio contenuto nei forum, ma a causa della man- canza di materiale suciente dovuta all'analisi dello strumento di soli 2 forum non è stato possibile ipotizzare un metodo generale per poi accertare la sua verità.

6.1 Problemi e soluzioni

Non tutti i forum condividono al pubblico le stesse informazioni, a volte è suciente iscriversi al sito per ottenerle in maniera diretta. Nel caso in esa-

me solo i forum di Diabetesdaily e Womenshealth non hanno reso pubblico il numero degli utenti iscritti, l'informazione necessaria è stata approssimata conteggiando tutti gli utenti intervenuti nell'ultimo anno.

Documenti correlati