• Non ci sono risultati.

Recensioni ingannevoli, come riconoscerle

4.3 Indicatori di spam

I segnali che evidenziano un comportamento da considerarsi spam sono diversi. Un gruppo di recensori è più facile che vengano accusati di falsa testimonianza se pubblicano tutti un'opinione in un lasso di tempo breve. Grazie al Group Time Window (GTW) si è in grado di calcolare la durata della finestra temporale nella quale gli utenti di questo gruppo hanno compiuto assieme, realizzando recensioni per più servizi o prodotti.

L'indicatore di spam risulterà nullo solo se la distanza tra la prima e l'ultima recensione di un componente dello stesso gruppo supererà circa tre mesi. La quantità di tempo è variabile dal sistema, in quanto siamo noi che durante la fase iniziale decideremo le caratteristiche assunte dall'algoritmo in base alle caratteristiche dell'insieme di recensioni da valutare.

GTW, amalgama assieme, anche risultati di oggetti o servizi recensiti in settimane differenti e analizza il gruppo indagato in tutti i suoi movimenti.

Un altro indicatore è chiamato Group Deviation (GT), calcola quando un feedback rilasciato dal gruppo, distanzia di molto dalla valutazione rilasciata dagli utenti che non appartengono a tale gruppo.

Non viene presa in considerazione la media dei feedback rilasciati ma la deviazione massima ricavata dall'osservazione di tutte le altre recensioni del prodotto, cioè il picco più alto di differenziazione.

Group Content Similarity (GCS) calcola la somiglianza tra i testi delle

recensioni e coloro che posseggono una percentuale alta di similarità tra le recensioni rilasciate saranno considerati spam. Questo indicatore nasce dal fatto

11A. Mukherjee, B. Liu, N. Glance, Spotting Fake Reviewer Groups in Consumer Reviews,UIC, 2012

che molte volte per ridurre costi e fatica, i gruppi spam, realizzano recensioni partendo da opinioni già rilasciate da altri utenti differenziandole di poco.

Un indicatore molto simile a quello appena descritto è il Group Member

Content Similarity (GMCS). Vengono presi in considerazione tutti i testi

pubblicati da un unico utente e le similarità tra essi. Alta similarità uguale soggetto considerato dubbio. In parole povere riciclano testi già realizzati per recensire nuovi servizi. Quando un gruppo invece rilascia opinioni su un elemento appena inserito nel database, si utilizza il metodo antispam chiamato

Group Early Time Frame (GETF). Questo metodo ha fatto emergere che molti

prodotti vengono giudicati da un gruppo spam subito dopo esser stati pubblicati online. È un indicatore molto debole rispetto agli altri, in quanto non è sicuro che il gruppo segua sempre questo meccanismo e le recensioni fittizie, siamo in grado di sintonizzarle solamente dopo la realizzazione di altre vere.

In ogni caso l'indicatore GETF può portare ad un riduzione dello spam.

Group Size Ratio (GSR) se un prodotto viene valutato solo da un gruppo falsi

utenti, allora il gruppo viene definito controllore del successo del prodotto. Mentre se il prodotto verrà valutato anche da altri utenti (veri) l'intendo degli spammer avverrà solo in parte. L'intento è quello di dirottare i lettori verso una direzione ben precisa, positiva o negativa che sia.

L'indicatore GSR, considera più accusabile un gruppo di utenti se essi hanno contribuito attivamente con la maggior parte delle recensioni, riguardanti il prodotto.

Molto simile a GSR vi è Group Size (GS). GS ritiene indiziati i gruppi con un maggior numero di componenti.

Group Support Count (GSUP) altro indicatore simili a quelli citati, in quanto

si dedica a gruppi di persone che hanno giudicato gli stessi servizi e prodotti. L'algoritmo GSRank considererà anch'esso degli spammer gli utenti del gruppo.

Gli spammer non lavorano sempre in gruppo ma lavorano anche soli, compiendo un lavoro individuale. E per questo ci sono indicatori utili per scovare

il singolo utente. Uno di questi è l'Individual Rating Deviation prende in considerazione quanto il feedback di un utente su un determinato servizio o bene si allontani dalla media ricavata dalle altre recensioni. Più si distanzia dalla media dei voti degli altri soggetti più è considerato spammoso.

Se un utente, in particolare, produce più di una recensione per lo stesso prodotto, un indicatore utile è l'Individual Content Similarity (ICS). Se i testi scritti sono simili tra loro verrà etichettato come spam.

L'Individual Early Time Frame (IETF) è uguale all'indicatore utilizzato per i gruppi. Se viene rilasciata una valutazione subito dopo che il prodotto compare nel portale.

L'ultimo indicatore viene siglato con le lettere IMC, che stanno ad abbreviare

Individual Member Coupling in a Group. Se i feedback vengono rilasciati in date

vicine a quelli di altri componenti del gruppo viene considerata recensione falsa. L'IMC è l'unico che si dedica alla relazione tra singolo utente e gruppo, perché un gruppo di spammer potrebbe appoggiarsi a singoli utenti pensando di dare meno nell'occhio.

L'algoritmo con tutti i suoi indicatori svolgerà un lavoro sufficientemente adeguato ma difficilmente avrà un effetto del cento per cento.

I valori degli indici di spammosità per ciascun gruppo vengono aumentati in base al risultato, di dialogo, degli altri due elementi del sistema: i prodotti e i singoli membri.

Gli elementi vengono confrontati tra di essi, in fondo da quanto compare nell'immagine 4.1.2 le frecce nello schema sono bilaterali. Tramite i singoli comportamenti si giunge ad un comportamento generale (punto di forza dell'algoritmo, a mio parere). Oltre agli elementi teorici spiegati fino ad ora, l' algoritmo compirà il suo lavoro tramite lo svolgimento di calcoli matematici (che non tratterò nella mia tesi).

GSRank riesce ad individuare interi falsi contesti, non solo una singola recensione.

nel quale hanno operato e le loro recensioni eliminate.

Un singolo individuo riuscirà a svolgere ancora il ruolo di spam, svolgendo un'attività più moderata. In definitiva le false recensioni si trasformeranno ma compariranno comunque.

I casi di recensioni fasulle sono continui.

Parlando dei siti web d'opinione e della situazione attuale si può citare il

premio nobel George Akerlof12 e la sua famosa asimmetria informativa: ”The

Market for Lemons”13. Questa teoria si realizza, in particolar modo, quando il venditore gode di un maggior quantitativo di informazioni sul bene proposto all'acquirente. L'interazione fra una qualità eterogenea dei prodotti offerti e un'asimmetria informativa tra gli attori coinvolti conduce alla scomparsa di un mercato, le cui garanzie non sono definite. Partendo dal presupposto che la qualità dei prodotti non possa essere valutata dall'acquirente (a causa dell'asimmetria informativa), il venditore è incentivato a proporre beni di bassa qualità spacciandoli come di qualità elevata. In questo caso, il venditore può in realtà produrre dei buoni prodotti ma l'opinione dell'utente, spam, lo potrà stroncare.

L'utente con le false recensioni ha la capacità di innalzare la domanda verso un prodotto che non è in grado d'offrire ciò che cerca l'acquirente. Si ha un picco della domanda verso un'offerta scarsa, qualitativamente parlando, a discapito di altri prodotti eccellenti.

La teoria appena citata si sposa perfettamente con ciò che sta avvenendo nel campo delle recensioni online. Avviene una “corruzione” del mercato online, da coloro che creano il mercato. I beni “peggiori” spiazzeranno i beni “migliori” sul mercato. Grazie alle false recensioni i “bidoni” raggiungono un ampio raggio d'azione.

Negli ultimi anni sono comparsi molti casi di false recensioni con annesse 12 George Arthur Akerlof (New Haven, 17 Giugno 1940) è un economista e accademico statunitense, professore di economia all'Università di Berkeley. Ha vinto il Premio Nobel per l'economia nel 2001.

13 G.A. Akerlof, The Market for "Lemons": Quality Uncertainty and the Market Mechanis, in The Quarterly Journal of Economics [PDF], Vol. 84, No. 3., Agosto 1970, pp. 488-500

http://www.iei.liu.se/nek/730g83/artiklar/1.328833/AkerlofMarketforLemons.pdf http://it.wikipedia.org/wiki/Il_mercato_dei_limoni

denunce. Tanti da volerne citare alcuni.