• Non ci sono risultati.

2. Gli indicatori bibliometrici nella valutazione della ricerca scientifica

2.2. I database citazionali

Punto di partenza per l’analisi bibliometrica, e quindi del calcolo del valore degli indicatori bibliometrici, sono i database citazionali e i dati in essi contenuti. Infatti, come sostenuto da Baccini (2010), l’utilizzabilità e l’affidabilità degli indicatori bibliometrici nell’ambito della valutazione della ricerca dipendono soprattutto dalle caratteristiche dei dati contenuti negli archivi citazionali. Quindi, per svolgere un’adeguata analisi bibliometrica è necessaria la presenza di un’ampia base di dati accurati.

L’unità informativa elementare dei database citazionali sono le citazioni, che costituiscono un legame citazionale tra due articoli (Baccini, 2010). In particolare, la citazione può essere definita come “l’unità minima informativa, codificata attraverso stili internazionali

condivisi, indispensabile per individuare in maniera univoca una pubblicazione scientifica”

(Cassella & Bozzarelli, 2011, p. 68). Di conseguenza, un database citazionale può essere definito come un archivio contenente una serie di dati riguardanti le informazioni bibliografiche descrittive di un insieme di opere citanti, le informazioni relative ai legami citazionali in esse contenute e tutte le informazioni bibliografiche relative alle opere citate (Baccini, 2010). Dunque, gli archivi citazionali rappresentano la base dati per l’analisi bibliometrica, in particolare quella citazionale, e quindi per il calcolo degli indicatori bibliometrici.

39

La nascita dei database citazionali, come anticipato nel paragrafo precedente, è dovuta all’intuizione di Eugene Garfield che nel 1950 sviluppò lo Science Citation Index (SCI), che rappresenta la base dell’odierna struttura del database citazionale ISI (Baccini, 2010). È stata proprio la diffusione dei database citazionali che ha favorito lo sviluppo degli indicatori bibliometrici e il loro utilizzo nell’ambito della valutazione della ricerca: soprattutto negli anni tra il 1990 e il 2000, grazie allo sviluppo delle nuove tecnologie e il maggior utilizzo di internet che hanno consentito di contenere un’enorme quantità di dati, il grado di copertura dell’ISI aumentò notevolmente e cominciarono ad apparire sul mercato i primi competitori. Oggi, sono numerosi i database citazionali disponibili, ma i più importanti e utilizzati nell’ambito della valutazione della ricerca scientifica sono tre, ovvero: Web of Science (WoS), Scopus e Google Scholar (Mingers & Leydesdorff, 2015; Wouters, et al., 2015; Waltman, 2016).

L’archivio WoS (Web of Science) di proprietà della Thomson Reuters, precedentemente posseduto dall’Institute for Scientific Information (ISI), è un database a pagamento contenente diversi citation index o piattaforme, come lo Science Citation Index Expanded, il Social Sciences Citation Index e l’Arts & Humanities Citation Index, e rappresentava la principale fonte dei dati citazionali del passato. Oggi, WoS copre gli articoli di circa 12.000 riviste, atti di convegno e di recente ha cominciato a coprire anche i libri.

Altro database a pagamento è Scopus, di proprietà dell’Elsevier, lanciato nel 2004 ed oggi rappresenta uno dei principali competitor di WoS. In particolare, Scopus copre 20.000 riviste e, a differenza di WoS, contiene anche serie di libri, riviste professionali, libri e gli atti di convegno. Altra differenza tra i due database è rappresentata dal fatto che Scopus assicura la copertura dei dati a partire dal 1996, mentre WoS copre tutti gli anni a partire dal 1900. Infine, di natura differente rispetto ai precedenti è Google Scholar, lanciato nel 2004 da

40

scholar, rispetto agli altri due database, è disponibile gratuitamente e indicizza tutta la

letteratura scientifica disponibile online sul Web piuttosto che basandosi sui dati provenienti dalle riviste. In particolare, oltre alle riviste scientifiche, Google Scholar (GS) indicizza anche gli atti di convegno, i libri e anche le tesi e i report tecnici. Inoltre, è possibile accedere a tali informazioni tramite il software gratuito Publish or Perish.

In letteratura, la discussione su tali archivi citazionali è focalizzata soprattutto su due questioni: da un lato, la questione dell’accuratezza dei dati in essi contenuti, e quindi la loro qualità; dall’altro lato, la questione del loro grado di copertura, inteso come rapporto tra la quantità di pubblicazioni incluse in un dato archivio e la quantità complessiva di pubblicazioni prodotte in un determinato ambito disciplinare (Baccini, 2010).

Numerosi studi (Meho & Yang, 2007; Visser & Moed, 2008; Harzing & Van Der Wal, 2009; Amara & Landry, 2012; Harzing & Alakangas, 2016) sono stati condotti in letteratura con l’obiettivo di investigare il diverso grado di copertura dei differenti database citazionali e la qualità dei dati in essi contenuti. Tali studi, indicano un elevato grado di copertura di WoS e Scopus che, tuttavia, differisce significativamente tra le differenti discipline3, e un elevato

grado di copertura generale in tutte le discipline in Google scholar dove, tuttavia, l’affidabilità e la qualità dei dati in esso contenuta è scarsa.

In particolare, secondo Mingers e Leydesdorff (2015) le conclusioni generali dei diversi studi condotti su tale tematica possono essere sintetizzate nei seguenti punti:

 in generale, il grado di copertura dei prodotti di ricerca, inclusi libri e altri documenti, è maggiore in Google scholar (intorno al 90%) rispetto a WoS e Scopus.

 Il numero di citazioni varia a seconda della base dati di riferimento. In particolare, GS genera un maggior numero di citazioni rispetto a Scopus e WoS, in quanto le

3 In particolare, i diversi studi sul tema mostrano un buon grado di copertura dei due database per le scienze

naturali, un grado di copertura moderato, ma variabile per le scienze sociali, e un grado di copertura basso per le scienze umanistiche.

41

citazioni derivano da un’ampia gamma di fonti (non solo riviste, ma anche atti di convegno, report ecc.).

 Nonostante il maggiore grado di copertura, GS soffre di una scarsa qualità dei dati rispetto a WoS e Scopus, dovuta a errori nel calcolo delle citazioni, presenza di citazioni “fantasma” e mancanza di trasparenza, inclusioni di citazioni non accademiche ecc. (Harzing & Van Der Wal, 2009).

Dunque, nell’ambito della valutazione della ricerca scientifica, oltre alla scelta dell’indicatore bibliometrico più adeguato per catturare la qualità/impatto di un ricercatore o di un suo prodotto di ricerca, di una rivista ecc., altro problema fondamentale è la scelta della base dati di riferimento su cui calcolare il valore dell’indice. In particolare, da un lato ci sono gli archivi WoS e Scopus che assicurano un’elevata qualità e affidabilità dei dati e un grado di copertura buono per alcune discipline come le scienze naturali, ma scarso per altre discipline come le scienze sociali (tra cui quelle economico-aziendali); dall’altro lato, c’è l’archivio Google Scholar che assicura una grado di copertura maggiore (non solo per le riviste ma anche per i libri e altri documenti) anche per quelle discipline come le scienze sociali dove gli altri due database sono deboli, ma l’affidabilità e la qualità dei suoi dati in esso contenuta è bassa.