• Non ci sono risultati.

La tolleranza degli errori di battitura

Nel documento Esplorare la biblioteca (pagine 48-51)

Attualmente, quasi tutti gli utenti di una biblioteca usano Google (o qualche altro motore di ricerca web) molto più spesso di quanto usino il catalogo della loro biblioteca. È inevitabile, perciò, che alcune delle loro aspettative 'in stile Google' confluiscano nella ricerca bibliografica, incoraggiate anche dalla progressiva emulazione delle interfacce. Ovviamente Google è un impero che ha basato la sua fortuna proprio sulle sue rivoluzio- narie tecnologie di ricerca, grazie alle quali si sta trasformando sempre più in un inter- locutore piuttosto che in un semplice strumento. Se dunque non mi meraviglio troppo quando inserisco la stringa “vazce mladve” e ottengo risultati per “vacanze maldive”, non mi aspetterò di certo che un OPAC sia in grado di fare lo stesso. E tuttavia, se cerco i libri di “jo nesboo”, inesistente autore con una “o” di troppo, sarebbe molto piacevole se l'OPAC riuscisse suggerirmi i libri di Jo Nesbø, famoso autore norvegese di thriller e gial- li51. Dopotutto, se è vero che Google, per tentare di correggere la mia ricerca, ha dalla

51 Il numero di operazioni necessarie a trasformare l'accozzaglia di lettere cercate in Google in una stringa sensata è chiamato edit distance. Il valore di edit distance fra “vazce mladve” e “vacanze maldive” è 7; ciò significa che occorrono sette operazioni di inserimento, eliminazione o sostituzione per passare da una stringa all'altra. L'edit distance fra “nesboo” e “nesbo” è 1 (viene richiesta solo un'operazione di elimina- zione), un valore piuttosto frequente quando vi sono errori di battitura.

sua la possibilità di analizzare il comportamento di milioni di utenti e il contenuto di miliardi di pagine e di imparare da questi dati, l'OPAC ha invece la possibilità di cercare in vocabolari controllati di grandezza spesso modesta, rispetto ai numeri gestiti da un motore di ricerca web: potrebbe dunque considerare l’erronea stringa “jo nesboo”, ac- corgersi che nel proprio authority file c'è una voce estremamente simile e presentare i ri- sultati relativi a quella voce o, per lo meno, fornire all’utente un link che punti a tali ri- sultati.

Per verificare come i vari sistemi gestiscono l'errore di battitura da parte dell'utente sono state lanciate svariate ricerche che ponevano l'errore all'inizio, alla fine oppure in mezzo alla stringa, e che contenevano errori per addizione, per difetto o per sostituzio- ne. Le stringhe di ricerca su cui sono stati svolti gli esperimenti di errore sono principal- mente tre: “jo nesbo”, “addestramento cani” e “storia d'italia”. Le tre ricerche sono sta- te pensate per essere sufficientemente ampie da fornire almeno qualche risultato in tut- ti gli 11 OPAC analizzati e corrispondono a effettive ricerche che sono state svolte in au- tonomia da parte degli utenti della Biblioteca Civica di Pordenone. Inoltre i termini usa- ti non sono solo semplici stringhe di caratteri che il motore di ricerca può trovare nelle descrizioni delle schede bibliografiche ma, se presi singolarmente, appartengono anche a vocabolari controllati e, in quanto tali, potrebbero essere destinatari di un trattamen- to più accurato che una semplice stringa (rinvii, forme alternative, …)52.

Per quanto riguarda gli errori per addizione, il panorama dei software OPAC consi- derato in questa ricerca non è molto incoraggiante: eccetto tre, tutti i sistemi di ricerca non trovano alcun risultato per la ricerca contenente lettere in più e, cosa più grave, non forniscono alcun suggerimento all'utente, nello stile del “Forse cercavi…?”53. I tre sistemi che invece hanno fornito maggiore aiuto all'utente sono SebinaYou di DM Cultu-

52 Nella fattispecie, “jo nesbo” dovrebbe condurre, in tutti i sistemi, alla voce Nesbø, Jo dell’authority file; le altre due ricerche contengono termini presi dal Thesaurus del Nuovo Soggettario della Biblioteca Nazio- nale Centrale di Firenze e, se invertiti, costituiscono le teste di due soggetti precisi: Cani – Addestramento e

Italia – Storia.

53 Le ricerche per addizione hanno comportato solo la ripetizione di lettere già contenute nella parola: “jo nesboo”, “addestramento canni” e “sstoria d'italia”.

ra, Primo di Ex Libris (usato dalla Biblioteca Civica di Bolzano) e la versione VuFind im- plementata da Lombardia Informatica.

SebinaYou merita di essere esaminato a parte: la sua funzionalità di correzione dell'errore è relativamente recente54 e forse per questo non è ancora stata molto diffusa. Attualmente, sono solo quattro gli OPAC implementati da DM Cultura che presentano la funzionalità “Forse cercavi…?”, per un totale di 9 biblioteche di capoluogo servite: gli OPAC sono Biblioest (Friuli Venezia Giulia, 3 biblioteche), BinP (Veneto, 2 biblioteche), ScopriRete (Romagna, 3 biblioteche) e il Polo SBN di Bologna (1 biblioteca)55. La corre- zione degli errori garantita da DM Cultura è spesso estremamente precisa, e sembra venga calcolata anche in base al posseduto delle biblioteche.

Per quanto riguarda Ex Libris e Lombardia Informatica, entrambi i loro sistemi pre- sentano i suggerimenti “Forse cercavi…?” che, il più delle volte, si rivelano coerenti con il supposto bisogno informativo delle ricerche corrette. Entrambi tuttavia non riescono sempre a gestire al meglio la scelta del suggerimento da dare. Ex Libris, per esempio, prova a rielaborare la stringa “addestramento canni” scegliendo forse la strada più sem- plice (l’eliminazione della prima lettera) e suggerisce dunque “addestramento anni”. Per la stessa ricerca, anche Lombardia Informatica dà suggerimenti lontani dal supposto bisogno informativo (addestramento + “anno”, “carri”, “armi”), anche se la scelta di presentare più di un suggerimento per una singola ricerca erronea è sicuramente lode- vole. Nel sistema lombardo, poi, è sufficiente invertire l'ordine dei due termini di ricer- ca, ricalcando così l'ordine della stringa di soggetto, per ottenere i suggerimenti corretti “cani addestramento” e “cane addestramento”.

Primo e VuFind brillano particolarmente nei casi di ricerche con errori per difetto o per scambio: entrambi gli OPAC correggono correttamente le varie versioni degli errori, pur presentando due approcci diversi nei confronti dell’utente (Primo tende a presenta- re sempre almeno un paio di risultati che corrispondono al suggerimento fornito, Vu-

54 All'inizio della stesura di questo lavoro (agosto 2019), Biblioest presentava la funzione “Forse cercavi...?” ma essa restituiva suggerimenti tendenzialmente estranei al contesto della ricerca e talvolta perfino as- surdi (v. nota 26); nel corso di alcune settimane la funzione è stata radicalmente migliorata.

Find invece dà sempre 'nessun risultato' e mostra i suggerimenti da cliccare). Anche Se - binaYou si difende bene in questo ambito, nonostante il suo cavallo di battaglia rimanga la correzione degli errori per addizione e per difetto, nella quale rimane un passo avanti rispetto agli altri due sistemi considerati56.

Nel documento Esplorare la biblioteca (pagine 48-51)