Python - Sviluppo di un Geodatabase e di una StoryMap per lo studio e la disseminazione del r

L'esser pseudo-interpretato rende Python un linguaggio portabile. Una volta scritto uno script, esso può essere interpretato ed eseguito sulla gran parte delle piattaforme attualmente in commercio, siano queste di casa Apple (Mac) che PC (Microsoft Windows e GNU/ Linux)

Questo linguaggio supporta diversi paradigmi della programmazione, come quello Object-Oriented (con supporto all’ereditarietà multipla), la programmazione strutturata, quella imperativo, funzionale e riflessionale.

L’Object-Oriented Programming (programmazione orientata agli oggetti) permette di definire degli oggetti software in grado di interagire gli uni con gli altri scambiando dei messaggi. È particolarmente adatta nei contesti in cui si possono definire delle relazioni di interdipendenza tra i concetti da modellare.

La programmazione ad oggetti prevede di riunire in una zona circoscritta del codice sorgente (chiamata classe), la dichiarazione delle strutture dati e delle procedure che operano su di esse. Le classi, quindi, costituiscono dei modelli astratti, che a tempo di esecuzione vengono invocate per istanziare o creare oggetti software relativi alla classe invocata. Questi ultimi sono dotati di attributi (dati) e metodi (procedure) secondo quanto definito/dichiarato dalle rispettive classi.

Un altra caratteristica che contraddistingue il linguaggio Python fra quelli più diﬀusi è il suo sistema di indentazione della sintassi dove invece di usare parentesi, come nel linguaggio C, usa l'indentazione stessa per indicare i blocchi nidificati in congiunzione col carattere "due punti" (:). Si può usare indiﬀerentemente sia una tabulazione, attraverso il tasto dedicato “TAB”, sia un numero arbitrario di spazi, ma per convenzione lo standard Python è di 4 spazi.

Questo si rivela molto vantaggioso, perché risulta conciso e obbliga a scrivere sorgenti indentati correttamente, aumentando così la leggibilità del codice, rendendo la sua sintassi semplice, chiara e lineare. Infatti Python, nelle intenzioni di Guido van Rossum, è stato creato per essere un linguaggio da subito intuibile per essere appreso, utilizzato e capito.

La libreria built-in fornita assai ricca, unita alla gestione automatica della memoria e a robusti costrutti per la gestione delle eccezioni fanno di Python uno dei linguaggi più ricchi e comodi da usare. Di fatto le librerie disponibili sono innumerevoli e in continua crescita, sia quelle standard che quelle di terze parti, le quali permettono di scrivere dei software ben strutturati che favoriscono lo sviluppo di applicazioni anche molto complesse, come da esempio il machine learning o anche lo sviluppo mobile.

Python utilizza la tipizzazione dinamica per le variabili, ovvero in compilatore in base al valore assegnato alla variabile, ne decide e interpreta il tipo.

Il dinamismo della tipizzazione è dato dal fatto che le variabili non devono essere dichiarate in anticipo, come accade con altri linguaggi di programmazione, ma verranno assegnati nomi variabili dietro ai quali si nasconderanno solamente un tipo di entità di programmazione. Infatti solo al momento dell'esecuzione del codice appena scritto vengono verificati i valori assegnati ad ogni variabile.

Python tutt’ora è disponibile in due versioni. La 2.x (oggi release 2.7) ha rappresentato per lungo tempo la piattaforma “standard” per gli sviluppatori, quella che si doveva conoscere e usare anche se esistevano già le versioni 3.x. Il motivo che portava la convivenza delle due macroversioni è quello di usare due sintassi diverse, il che rendeva incompatibile una grande quantità di codice; infatti non esistevano per Python 3.x molte librerie che invece c’erano per la versione 2.7.

Oggi però le cose sono diverse e Python 3.x (oggi release 3.7) ha tutti gli strumenti che servono in quanto a librerie. In più porta diverse funzioni utili che a Python 2.7 mancano, per questi motivi da gennaio 2020 cesserà il supporto e gli aggiornamenti per la seconda versione del linguaggio, costringendo gli sviluppatori a programmare con la nuova release. 

Per concludere Python è free software: non solo il download dell'interprete per la propria piattaforma, così come l'uso di Python nelle proprie applicazioni, è completamente gratuito; ma in aggiunta a questo Python può essere facilmente e liberamente modificato e così ridistribuito, secondo le regole di una licenza pienamente open-source. 

Queste caratteristiche hanno fatto di Python il protagonista di un enorme diﬀusione in tutto il mondo, e anche in Italia, negli ultimi anni.

5.3. Librerie

Python ha il grande vantaggio, essendo un linguaggio open-source, di possedere molteplici librerie sviluppare da diversi programmatori, al fine di ampliare le possibilità di usabilità del codice.

Per fare in modo che Python possa quindi interpretare parti di script che senza librerie interromperebbero l’esecuzione del codice, una volta installata la libreria stessa sul computer, tramite il comando “import” seguito dal nome del modulo, scritto antecedente allo script, fa in modo che Python iniziando a leggere i comandi dall’inizio riesca a caricare le librerie necessarie per interpretare le righe successive.

Le librerie impegnate più frequentemente, servite anche per scrivere lo script che è stato utilizzato per questo lavoro sono:

• math: contenitore di funzioni matematiche

• numpy: aggiunge supporto a grandi matrici e array multidimensionali insieme a una vasta collezione di funzioni matematiche di alto livello per poter operare eﬃcientemente su queste strutture dati

• matplotlib: utilizzata per generare grafici 2D sia a barre che a dispersione, come anche istogrammi, spettri, e diagrammi di errore. Il tutto è controllabile, dallo stile di linea, proprietà dei caratteri e assi, tramite l’interfaccia orientata agli oggetti

• psycopg: è l’adattatore del database PostreSQL, per la versione 3 di Python la libreria prende il nome di psycopg2

• datatime: fornisce le classi per manipolare date e tempi, focalizzandosi su un’eﬃciente estrazione delle componenti, per l'interpretazione dell’input e la formattazione dell’output

• statistics: utile quando di devono eﬀettuare statistiche matematiche su dai numerici reali

5.4. Database

Tra i molteplici database disponibili per il linguaggio Python, per questo lavoro è stato utilizzato quello nominato PostgreSQL.

PostgreSQL è un Object Database Management System, ODMS (modello di base di dati ad oggetti), nato inizialmente come INGRES da un progetto dell'Università della California a Berkeley nel 1982 con a capo Michael Stonebraker, importate ricercatore nel campo dei database.

Nel 1985 Stonebraker lasciò l’università per dare vita a un nuovo progetto post-Ingres, chiamato successivamente Postgres.

Questo progetto aveva l’obiettivo di fornire un supporto completo ai tipi di dati, in particolare la possibilità di definire nuovi tipi di dati, User Defined Function e User Defined Types, preservando l'integrità dei dati e capace di leggere informazioni da tabelle relazionate in modo naturale, seguendo le regole definite dall'utente.

Nel giugno del 1989 viene rilasciata la prima versione, mentre la terza pubblicata nel 1991, venne riscritta da zero aggiungendo il supporto ai gestori multipli di immagazzinamento dei dati e migliorando notevolmente il motore di query.

Nel 1994 il progetto passo a due studenti della Berkeley, A. Yu e J. Chen, che aggiunsero a Postgres in interprete SQL e solo nel 1996 prese il nome che possiede attualmente, PostgreSQL.

Figura 5.2. Logo attuale di PostgreSQL.

Utilizzando il linguaggio SQL, i dati sono immagazzinati come una serie di tabelle con chiavi esterne che servono a mettere in relazione i dati correlati, richiedendo che sia l'utente a prelevare e raggruppare le informazioni correlate utilizzando le query.

I principali pregi di PostgreSQL sono:

• L’incremento delle prestazioni, rispetto un qualsiasi altro database, in quanto la logica viene applicata direttamente dal server di database, riducendo il passaggio di informazioni tra il client ed il server

• Il miglioramento dell'aﬃdabilità, dovuto alla centralizzazione del codice di controllo sul server

• Il codice del client può essere più snello e semplice avendo inserito i livelli di astrazione dei dati, ovvero la loro organizzazione e memorizzazione, direttamente sul server,

PostgreSQL riesce quindi a ridurre il tempo totale di programmazione di molti progetti, con i vantaggi sopracitati che crescono con la complessità del progetto stesso.

Nel documento Sviluppo di un Geodatabase e di una StoryMap per lo studio e la disseminazione del rapporto tra cambiamenti climatici e sorgenti (pagine 59-64)