• Non ci sono risultati.

Obiettivi di apprendimento

1. Essere in grado di condividere il software con la licenza più appropriata (cioè, sapere scegliere sia gli strumenti che la licenza).

2. Essere in grado di caricare, modificare e registrare un elemento di codice con un identificativo permanente.

32

Letture integrative

 Balasegaram et al. (2017). An open source pharma

roadmap. doi.org/10.1371/journal.pmed.1002276

 Dryden et al. (2017). Upon the Shoulders of Giants: Open-Source Hardware and Software in Analytical Chemistry. doi.org/10.1021/acs.analchem.7b00485

 Ince et al. (2012). The case for open computer programs.doi.org/10.1038/nature10836

 Iskoujina and Roberts (2015). Knowledge sharing in open source software communities: motivations and management. PDF

 Jimènez et al. (2017).Four simple recommendations to encourage best practices in research software. doi.org/10.12688/f1000research.11407.1

 Martinez-Torres and Diaz-Fernandez (2013).Current issues and research trends on open-source software communities PDF

 Morin et al. (2012). Shining Light into Black Boxes. PDF

 Oishi et al. (2018). Perspectives on Reproducibility and Sustainability of Open-Source Scientific Software from Seven Years of the Dedalus Project. arXiv:1801.08200v1 [astro-ph.IM]

 Scacchi (2010). The Future of Research in Free/Open Source Software Development. PDF

 Sandve et al. (2013). Ten simple rules for reproducible computational research doi.org/10.1371/journal.pcbi.1003285

 Shamir et al. (2013).Practices in source code sharing in astrophysics. arXiv:1304.6780v1 [astro- ph.IM]

 Steinmacher et al. (2014). A systematic literature review on the barriers faced by newcomers to open source software projects. PDF

 Stodden (2010). The Scientific Method in Practice: Reproducibility in the Computational Sciences.PDF

33

4. La riproducibilità della ricerca e l’analisi dei dati

Di che cosa si tratta?

Per riproducibilità della ricerca si intende la possibilità di mettere a disposizione i dati grezzi e il codice della ricerca in modo che altri possano conseguire gli stessi risultati così come sono stati presentati nelle conclusioni del lavoro di ricerca. Strettamente connesso è il concetto di replicabilità il quale consente di riprodurre una metodologia scientifica per raggiungere analoghe conclusioni. Entrambi i due concetti sono componenti cruciali della ricerca empirica.

Migliorare la riproducibilità comporta maggior rigore e qualità dei prodotti scientifici e di conseguenza un maggior grado di affidabilità della scienza. Sempre di più si percepiscono il bisogno e la volontà di esporre il flusso della ricerca, dal momento cioè in cui un progetto inizia, passando per la raccolta dei dati fino all’interpretazione e alla presentazione dei risultati. Tali sviluppi implicano naturalmente delle sfide inclusa la creazione di flussi di lavoro integrati della ricerca che possono essere adottati dai collaboratori mantenendo al tempo stesso standard di integrità molto elevati.

Il concetto di riproducibilità è direttamente applicabile al metodo scientifico, cardine della scienza, e in particolare attraverso le seguenti cinque fasi:

1. Formulazione di un’ipotesi 2. Pianificazione dello studio

3. Conduzione dello studio e raccolta dei dati 4. Analisi dei dati

5. Presentazione dei risultati dello studio

Per ognuna di queste fasi si dovrebbe riuscire a produrre una documentazione chiara e aperta in modo da rendere lo studio trasparente e riproducibile.

34

Fondamenti

Alcuni fattori generali possono contribuire ulteriormente alla causa della non-riproducibilità ma possono anche condurre all’adozione di misure specifiche che rispondono direttamente a queste cause. La cultura e l’ambiente in cui la ricerca ha luogo è un importante fattore generale, dall’alto verso il basso. Da una prospettiva “dal basso verso l’alto”, l’educazione continua e la formazione per ricercatori può far accrescere la consapevolezza nonchè la divulgazione di buone prassi.

Se da una parte è importante capire l’ampia gamma di fattori che contribuiscono alla riproducibilità, è però altrettanto difficile scomporre questi fattori in fasi che possono essere adottate immediatamente in un programma di ricerca esistente e migliorare immediatamente la sua riproducibilità. Uno dei primi passi è determinare lo stato dell’arte corrente e tenerne costantemente monitorato il miglioramento dato che per aumentare sempre di più la riproducibilità vengono prese in continuazione nuove misure. Alcune delle problematiche più comuni in merito alla riproducibilità della ricerca sono illustrate nella figura sottostante:

35

Fonte: Symposium report, October 2015. Reproducibility and reliability of biomedical research: improving research practice PDF.

Goodman, Fanelli, & Ioannidis (2016) evidenziano come in epidemiologia, biologia computazionale, economia e sperimentazione clinica, per riproducibilità si intende spesso

“l’abilità di un ricercatore di duplicare i risultati di uno studio precedente utilizzando gli stessi materiali utilizzati dal primo ricercatore. In questo modo, il secondo ricercatore può utilizzare gli stessi dati grezzi e ricostruire le stesse analisi e utilizzare la stessa analisi statistica nel tentativo di ottenere gli stessi risultati”. Si tratta di qualcosa di diverso dalla replicabilità: “che si riferisce all’abilità di un ricercatore di duplicare i risultati di uno studio precedente se segue le stesse procedure ma raccoglie nuovi dati”. Per semplicità si può pensare che la riproducibilità è orientata al metodo mentre la replicabilità è orientata al risultato.

La riproducibilità può essere valutata su diversi livelli: a livello di progetto individuale (ad esempio di articolo, sperimentazione, metodo o set di dati), a livello di ricercatore individuale, laboratorio o gruppo di ricerca, istituzione o perfino ambito di ricerca. Per ciascuno di questi diversi livelli possono essere applicati criteri o punteggi di valutazione leggermente diversi. Ad esempio, un’istituzione sostiene le pratiche di riproducibilità se introduce delle politiche con le quali finanzia/premia il ricercatore che fa scienza riproducibile. D’altro canto, un ambito di ricerca può essere considerato avere un maggiore o minore livello di riproducibilità se sviluppa risorse -della cui manutenzione si occupa la comunità- che promuovono e facilitano delle pratiche di ricerca riproducibile, come archivi di dati o standard di condivisione dei dati comuni.

36

Finalità didattiche

Sono tre gli obiettivi principali che è necessario menzionare in questa sede: 1. Comprendere quanto sia importante creare ricerca riproducibile.

2. Comprendere in generale il sistema della ricerca riproducibile (compresa la progettazione del flusso di lavoro, la gestione dei dati e una reportistica dinamica).

3. Conoscere i singoli passaggi che compongono il processo di riproducibilità nonchè le risorse corrispondenti che possono essere impiegate.