A NALISI DELLA FUNZIONALITÀ DI RICERCA

2. B IBLIOTECHE E SOFTWARE

2.3 A NALISI DELLA FUNZIONALITÀ DI RICERCA

Osservando gli OPAC delle biblioteche pubbliche di capoluogo, sono emersi svariati errori di usabilità come quelli descritti sopra: chi più chi meno, ogni sistema avrebbe qual- cosa da migliorare nel modo in cui porge le informazioni, nelle possibilità di azione che offre, nelle scelte comunicative che propone. Eppure non è l'insieme di questi fattori a costituire la più grave mancanza di usabilità di questi sistemi: a impedire un uso piena- mente soddisfacente e piacevole degli OPAC sono alcune pecche nelle loro funzionalità di ricerca. Le biblioteche pubbliche, come già detto, annoverano fra i propri utenti indi- vidui dal bagaglio culturale sempre più variegato e non necessariamente preparato alla ricerca bibliografica. Compito dell'OPAC di una biblioteca pubblica, perciò, dovrebbe essere quello di fornire guida e aiuto anche agli utenti meno esperti in bibliografia, ma co- munque avvezzi a usare il web, in modo tale che costoro possano percepire l'OPAC come un ambiente confortevole e stimolante piuttosto come uno strumento dal funzionamen- to poco chiaro. L'utente che sbaglia intenzionalmente il cognome di un autore, convinto che si scriva effettivamente così, desidera essere corretto dal proprio OPAC; se invece il sistema restituisce un risultato nullo, l'utente potrebbe convincersi che in biblioteca non vi siano libri di quell'autore o, peggio ancora, dovrebbe uscire dall'OPAC e accertar- si della grafia del cognome da un'altra parte (probabilmente Google), rendendo di fatto l'OPAC una fonte di ricerca subordinata alle altre. L'utente che lancia una ricerca con le parole chiave “castelli medievali” può benissimo ignorare che il sistema gli restituirà solo una parte delle risorse che gli interessano, ossia quelle contenenti quelle due esatte parole, tralasciando invece i documenti contenenti “castello medievale” o “castelli me- dioevo”. L'utente che cerca un classico della letteratura, specie se di grande successo, può rimanere a dir poco spiazzato nel vedersi restituire un elenco di venti, trenta, qua- ranta risultati dai titoli perfettamente identici. Questo genere di situazioni era più che accettabile da parte di un pubblico che solo poco tempo prima effettuava ricerche nei cataloghi a cassettoni: d'altronde, ricontrollare la grafia dei cognomi o gestire molteplici edizioni dello stesso libro erano il pane quotidiano di ogni utente di biblioteca, per non parlare poi della ricerca per argomenti, che andava fatta adattando il proprio voca-

bolario di ricerca a quello del soggettario (ossia l'elenco dei termini di soggetto), secondo cui erano ordinate le schede. I termini di soggetto, le edizioni di un libro erano ele- menti concreti, che venivano toccati e sfogliati fin dal primo approccio col catalogo; ogni scheda era un'edizione diversa, ogni stringa di soggetto era posta in rigoroso ordi- ne alfabetico.

L'OPAC ha sconvolto questo tipo di rapporto materiale e sequenziale: da un insieme di termini, l'utente pretende che il sistema faccia comparire tutto ciò che a essi può essere ricollegato. E se dieci o venti anni fa i frequentatori della biblioteca potevano già dirsi soddisfatti così, continuando a ricontrollare i termini di ricerca utilizzando fonti esterne, consapevoli che una ricerca per argomento vada impostata secondo i termini del soggettario, ora questo non funziona più: gli utenti più giovani chiedono che il sistema venga loro incontro, che corregga gli errori, che capisca il loro bisogno di ricerca e provi a soddisfarlo anche se utilizzano parole di ricerca sconosciute al soggettario.

Agli albori dell'era dei cataloghi informatizzati fu subito chiaro che la scienza biblio- teconomica non bastava più per strutturare e gestire lo strumento per eccellenza della biblioteca: le tecniche di information retrieval divennero quindi le fondamenta su cui im- plementare l'interrogazione dei database e le possibilità di ricerca offerte dai primi si- stemi. È grazie all'information retrieval che i primi OPAC si sono presto evoluti da mere trasposizioni digitali dei loro antenati cartacei a sistemi indipendenti in grado di fornire modalità di interrogazione mai concepite prima. Con l'avvento del web e con una conti- nua ricerca orientata alla qualità e alla rilevanza dei risultati restituiti nei sistemi di ri- cerca, le tecniche di information retrieval sono evolute; gli OPAC, invece, sono rimasti un po' più indietro.

I cataloghi attuali sono basati su sistemi di ricerca booleana, ossia quella che espri- me le proprie query attraverso un linguaggio fondato sugli operatori booleani AND, OR e NOT. Nel corso dell'evoluzione degli OPAC, questo linguaggio è diventato via via sempre più invisibile agli utenti (e ai bibliotecari); ciò non significa che non ci sia. Il progressivo accostamento delle interfacce OPAC all'interfaccia di Google, se da un lato ha reso più amichevole il primo contatto col catalogo, dall'altro lato ha instaurato l'erronea convin-

zione che il catalogo funzioni più o meno come il famoso motore di ricerca48_{. Nulla di} più sbagliato. Google e gli altri motori di ricerca web funzionano grazie a sistemi di ran- ked retrieval, in cui i termini di ricerca, anziché essere collegati da operatori booleani, vengono normalizzati, confrontati col lexicon dell'intera collezione e a quel punto con- ducono ai documenti che presentano un punteggio maggiore calcolato in base a indici di similitudine fra la ricerca impostata e i documenti della collezione, senza tra l'altro che il documento in questione debba per forza contenere tutti i termini usati in fase di ricerca [Manning-Raghavan-Schütze 2008, pp. 74 e 113-114]. In questo sistema, i docu- menti della collezione e la query stessa vengono rappresentati come vettori in uno spa- zio di N dimensioni, dove N sono i termini dell'intero lexicon; data una query, il ranked re- trieval individua i vettori più vicini e simili a essa e li restituisce ponendo i best matches (i risultati più attinenti) in cima e scendendo via via fino ai documenti meno rilevanti [Kinstler, Making search work for the library user, in Catalogue 2013, p. 24].

Per fare un esempio, prendiamo un caso tratto proprio dall'indagine sull'usabilità di un catalogo [Bianchini 2017a]. Un utente vorrebbe consultare Archeologia del libro mano- scritto di Marilena Maniaci e inserisce la stringa di ricerca “archeologia del libro mano- scritto”: non ottiene alcun risultato, poiché in realtà il libro si intitola semplicemente Archeologia del manoscritto. Questa situazione è spiegabile tramite la ricerca booleana: il sistema ha accolto come input i termini inseriti dall'utente e ha posto un invisibile AND fra l'uno e l'altro. Ha quindi lanciato la query nel database cercando un risultato che contenesse “archeologia AND del AND libro AND manoscritto”: nessun record del database contiene tutti i termini insieme, e da qui deriva il risultato nullo. Se invece l'OPAC adottasse un sistema basato sul ranked retrieval, la ricerca avrebbe esiti ben diversi: i ter- mini in input verrebbero normalizzati e ricercati nel vocabolario della collezione; a quel

48 Il progressivo avvicinamento delle due interfacce è un dato di fatto che desta qualche preoccupazione fra i bibliotecari; il timore (giustificato) è che gli utenti percepiscano gli OPAC come semplici sottoprodotti della tecnologia dei motori di ricerca e non abbiano contezza delle molteplici tecniche che potrebbero sperimentare attraverso questi strumenti [Sardo 2017, pp. 95-96]. L'attenzione a questo tipo di approccio “Google-like” si ritrova anche in [Bianchini 2017a] che, con il suo titolo «Funziona come Google, vero?», sem- bra voler lanciare una scherzosa provocazione per incoraggiare il mondo bibliotecario alla battaglia con- tro questa confusione sempre più diffusa fra gli utenti.

punto verrebbe stabilita una graduatoria di record simili almeno in parte alla ricerca impostata e verrebbero restituiti quelli in cima alla lista. In assenza di un record identi- co alla query, ecco dunque comparire al primo posto Archeologia del manoscritto, ossia il record che più ci si avvicina anche se non contiene tutti i termini ricercati.

Applicare il ranked retrieval a un OPAC è un'opzione possibile49_{, già suggerita e teoriz-} zata dalla letteratura; si tratta tuttavia di una rivoluzione di portata quasi copernicana che, specie in ambito italiano, non sembra essere prossima a realizzarsi, se mai lo farà50_. D'altra parte provare a fondere i due metodi in un unico sistema di ricerca, per quanto teoricamente possibile, sembra uno sforzo non del tutto controbilanciato dai vantaggi [Manning-Raghavan-Schütze 2008, p. 136].

Diventa quindi necessario puntare al miglioramento della qualità della ricerca nei sistemi booleani affinché, pur non funzionando come Google, gli OPAC possano conti- nuare a comunicare con generazioni per le quali l'universo bibliografico è sempre più distante mentre la parte più semplice (e, se vogliamo, banale) della ricerca online è il pane quotidiano. Pur nella consapevolezza che un OPAC non è e non sarà mai assimila- bile a un motore di ricerca web, né per le sue finalità e contenuti, né per le tecnologie che servono a implementarlo, ritengo sia necessario che l'OPAC vada incontro alla tipo- logia di utenti descritta sopra. Se le biblioteche vogliono aiutare i cittadini più inesperti a diventare via via sempre più capaci di muoversi fra testi, risorse e ricerche, non penso

49 Gli OPAC più usati in Italia (SBN Web e Sebina You) sfruttano il motore di ricerca Apache Lucene che, sfruttando le librerie più avanzate, offre funzioni di ranked retrieval e garantisce un'esperienza «similar to that of popular search engines such as Google» (Apache Solr Reference Guide: https://lucene.apache.org/ solr/guide/6_6/overview-of-searching-in-solr.html). Ciò potrebbe indurre a pensare che i nostri OPAC funzionino effettivamente attraverso il ranked retrieval; i fatti, però, contraddicono questa ipotesi. Se si lancia una ricerca su uno qualsiasi degli OPAC citati, verranno restituite solo le schede che contengono tutti i termini immessi in input. Questo comportamento dimostra che, a prescindere dal motore di ricer- ca usato, gli OPAC italiani (e non solo loro) sono ancora lontani dall'applicare il ranked retrieval.

50 Forse a causa del fraintendimento descritto nella nota precedente, il ranked retrieval non pare godere di grande successo fra i bibliotecari attualmente: la principale obiezione è che esso, pensato in realtà per la ricerca di documenti full text, non garantisca un buon ranking per le schede di catalogo, poiché sono testi molto più brevi di quelli solitamente elaborati dal motore [Deana 2019b, p. 25]. In realtà alla base dello studio del ranked retrieval c'è la consapevolezza che la differenza di lunghezza fra i documenti possa costi- tuire un ostacolo all'individuazione dei best matches. Perciò i vettori che rappresentano i documenti ven- gono normalizzati sui loro valori di lunghezza che, quindi, non diventano più un fattore discriminante [Manning-Raghavan-Schütze 2008, p. 111].

possano riuscirci limitandosi a mostrare qual è la montagna da scalare; ci riusciranno fornendo mappe, mezzi, passaggi e tutto l'appoggio che può servire per scalarla. I bibliotecari appassionati e coscienziosi mettono già in atto le strategie necessarie per assi- stere gli utenti più spaesati e permettere loro di percepire la biblioteca come un servizio accogliente e alla portata di tutti; se però l'OPAC non assiste l'utente che compie errori di battitura, non permette una ricerca efficace per parole chiave anche non controllate e presenta un'interfaccia poco accattivante e ricca di testo, gli sforzi dei bibliotecari an- dranno in parte perduti.

Prima di approfondire le possibili soluzioni, vediamo dunque quali sono alcuni dei problemi di usabilità dei sistemi adottati dalle biblioteche pubbliche italiane e quanto sono diffusi.

Nel documento Esplorare la biblioteca (pagine 44-48)