• Non ci sono risultati.

4.6 Definizione del task del programma ed elementi di input e output

4.7.9 Ricerche correlate e restituzione della matrice

La funzione scrap viene infine invocata ricorsivamente per ogni ricerca cor- relata che viene trovata in fondo alla pagina (se richiesto). Come parametro matrix viene fornita la matrice già riempita con i dati raccolti precedente- mente. Tra un invocazione e l’altra della funzione vengono lasciati passare 22 secondi: questo impedisce che Google Search sia “bombardato” da richieste HTTP e blocchi l’indirizzo IP da cui vengono inviate.

Infine, la matrice completa viene restituita con istruzione return. if corr > 0:

corr -= 1

for p in correlate: sleep(22)

scrap(p.get_text(), keywords, results, corr, matrix)

Capitolo 5

Strategia reputazionale

sottrattiva

5.1

Cancellare contenuti dal Web è possibile?

Applicare l’oblio significa in via ideale cancellare ricordi digitali dalla me- moria del Web, quindi, in altre parole, eliminare fisicamente le informazioni sulla Rete. Le società che si occupano di reputazione online, usano spesso termini come “identity cleaning”, a volte associando immagini di gomme da cancellare, come se esistesse effettivamente una tecnica per ripulire l’identità digitale raschiando via le informazioni scomode che la imbrattano.

Da un punto di vista pratico, rimuovere un’informazione dal Web significa cancellare il documento che la contiene, che esso sia una pagina HTML (o anche una sola parte di essa), un file immagine, un video, un PDF ecc., dal server in cui è ospitato. Di per sé il processo è banale, di gran lunga più facile che rimuovere un ricordo “analogico”, visto che un modo per annientare un ricordo dal cervello di un essere umano non risulta essere ancora stato trovato.

Il problema non è come cancellare contenuti dal Web, ma chi può farlo. Le informazioni sono contenute nei server e solo chi è autorizzato al loro accesso può rimuoverle. Di fatto, il potere esecutivo dell’applicabilità del- l’oblio risiede nel proprietario del server e di chi ne ha affittato lo spazio, cioè il webmaster (con cui si intende il proprietario del sito o chi è incaricato di gestirlo, due figure che possono coincidere). Il primo passo da fare per rimuovere un contenuto dal Web è chiedere al webmaster di eliminarlo dal

suo sito. Questo può essere fatto sostanzialmente i tre modi, ognuno dei quali ha una variabile probabilità di successo:

a in via amichevole e informale, b per vie legali,

c tramite estorsione.

Il metodo c) è semplicemente illegale, indipendentemente dalle aspettative di successo della strategia. Il metodo a) è sicuramente il più veloce ed eco- nomico. Basta una telefonata o un e-mail, al massimo può valere il costo di un caffè o di una cena nell’improbabile eventualità che si incontri personal- mente il webmaster e si cerchi di farselo amico. Le probabilità di successo dipendono molto dalla propensione del webmaster ad accettare la richiesta e dalla sua comprensione del problema. Se pensa che quel contenuto abbia tutti i diritti di stare sul suo sito e che la rimozione limiterebbe la sua libertà di espressione o quella dei suoi utenti non c’è niente da fare, il contenuto resterà lì dov’è.

Diverso è il caso del metodo b), in cui la decisione del webmaster è subor- dinata alla Legge del Paese in cui vive e si rifà alle responsabilità dell’internet content provider. Il successo dipende da che tipo di azione legale è stata fat- ta: denunciare il sito o fargli causa tramite avvocati può essere sufficiente a persuadere il webmaster ad accogliere la richiesta, ma può anche innesca- re una battaglia legale dagli esiti incerti, un’ingiunzione del tribunale non lascerebbe scampo al content provider, salvo eventuali ricorsi. L’applicabi- lità della legge dipende inoltre anche dalla posizione geografica della parte offesa, del webmaster e persino del server che ospita il contenuto: se siamo in Italia e il proprietario del sito è americano (e il server anche) non si può pensare di far valere la legge italiana per un soggetto che vive in America; se il webmaster vive e opera in Italia sottostà alle leggi italiane e quindi, se deciso dalle istituzioni giuridiche, dovrà rimuovere il contenuto. Tuttavia, se il sito si trova su un server in America il suo proprietario potrebbe non essere tenuto a eliminare alcun contenuto qualora vi restasse per qualche motivo.

Vanno inoltre considerati i tempi e i costi dell’azione legale: processi che durano anni e le spese per eventuali avvocati.

Per ultimo, è bene non sottovalutare le possibili reazioni del webmaster nel momento in cui si trovasse costretto a rimuovere controvoglia il contenuto,

magari dopo aver pagato una multa e delle spese legali: potrebbe vendicarsi, trovare il modo di diffondere nuovamente notizie lesive e magari in modo del tutto legale, scatenare una tempesta mediatica che metterebbe sotto i riflettori proprio quello che si cercava di celare. Nell’eventualità (remota) che il contenuto interessato venga rimosso, la sua presenza nel Web potrebbe non essersi ancora estinta del tutto. Una parte o l’intero contenuto potrebbe essere stato quotato in un altro sito, la pagina potrebbe trovarsi nella cache di qualche motore ricerca, o potrebbe rimanere indicizzata per molto tempo dopo la sua eliminazione, comparendo comunque nei motori di ricerca.

Rimuovere un’informazione alla sua fonte è dunque un’operazione non banale, con scarsissime possibilità di successo e a volte non del tutto riso- lutiva per l’oblio. Se un contenuto non può essere rimosso è sempre vero che limitare la sua accessibilità agli utenti potrebbe ridurre notevolmente la possibilità che questo venga trovato. Gli utenti difficilmente visitano pagine web conoscendo le directory in cui sono allocate a memoria, ma lo fanno at- traverso i link. Se non è possibile rimuovere link da una pagina web, perché ricondurrebbe agli stessi problemi che sono stati descritti per la rimozione di un contenuto, è invece possibile fare richiesta di rimozione di un link dai risultati di un motore di ricerca. Ottenere la deindicizzazione di una pagina web in relazione a keyword specifiche.

5.2

Rimuovere link dai motori di ricerca: le linee