L’entit`a gestita dall’ambiente IDN `e un documento strutturato che risul- ta composto da contenuti, relazioni (implicite o esplicite tra i contenu- ti) e metadati, in conformit`a ai seguenti principi fondanti l’architettura stessa [Inn08, Chi09]:
• Principio 1: Contenitore-Contenuto. I documenti sono contenitori mentre i dati ed i metadati costituiscono il loro contenuto; questi sono importanti al pari della struttura che li contiene.
• Principio 2: Identificatori Globali. Ad ogni dato sono assegnati degli identificatori gestiti da un sistema globale per l’identificazione attra- verso il quale sia possibile effettuare il recupero delle informazioni. Sia i contenitori che i contenuti (ovvero documenti e dati/metadati) pos- sono avere uno o pi`u nomi con validit`a locale o globale. Al momento della creazione un documento o un dato ha un nome locale, che diventa globale una volta che l’autore decide di assegnarne la visibilit`a ad un certo insieme di utenti (ovvero singolo utente, gruppi specifici, etc.). • Principio 3: Cooperazione. Sia i documenti che i dati sono arricchiti di
un insieme di metadati/attributi che abilitano la cooperazione. In sin- tesi si asserisce che il modello dell’informazione costituito dall’insieme “dati-metadati-struttura” deve essere abilitante alla cooperazione. Si pu`o affermare che un documento `e la testimonianza di una evidenza fisica o intellettuale, memorizzata e strutturata in una qualsiasi forma materiale, capace di essere compresa dall’uomo, trattabile dalla macchina e comunica- bile [Buc97, RMS97]. Questa definizione si adatta perfettamente al concetto di unit`a informativa, su cui basare la collaborazione. Conseguenza naturale `e stata quella di prevedere nell’Information Model il concetto di documento, visto come insieme strutturato di informazioni pi`u elementari eventualmente documenti a loro volta. L’importanza del concetto di documento `e imme- diata conseguenza del fatto che, molto spesso, quando si considerano pi`u informazioni distinte come un’unica entit`a (raggruppate all’interno del do- cumento) il contenuto informativo della somma `e maggiore della somma delle singole informazioni: il documento `e di per s´e informazione. L’infor- mazione aggiuntiva `e data dalle correlazioni presenti fra le varie informazioni e permette di caratterizzare il documento come un’entit`a strutturata2. All’interno di InterDataNet il documento viene modellato come un aggregato di informazioni elementari; la struttura e il contenuto sono completamente separati dalla presentazione. Ciascun elemento informativo viene mantenuto
2
Nel caso in cui l’aspetto relativo alle correlazioni sia trascurabile si parla di informa-
zione non strutturata che comunque pu`o essere vista come un caso particolare di quella
3.1 IDN Information Model: concetti generici 51
isolato rispetto agli altri secondo un principio gerarchico che si basa sull’as- sociazione ad un responsabile, ovvero colui il quale ha la consapevolezza di dover rispondere degli effetti che possono scaturire a seguito della divulga- zione dell’informazione ([Inn04, Pao06, Inn08]); egli pu`o essere una persona fisica oppure giuridica.
Un esempio utile a comprendere tale concetto `e quello di un documento che rappresenta una patente di guida [Inn08, Chi09]. Per ognuno dei con- tenuti informativi presenti, `e possibile determinare un’organizzazione che detiene l’informazione: i dati anagrafici del titolare sono gestiti dal Comune di nascita, i dati della residenza dal Comune di residenza, la categoria di guida dal Ministero dei Trasporti, i punti dal Ministero degli Interni, i dati relativi alla scadenza dalla Motorizzazione Civile, e cos`ı via. Tale proce- dimento tende quindi a strutturare rigidamente il documento, seguendo le regole organizzative e procedurali che hanno contribuito alla sua creazione o rilascio.
Pi`u un documento `e finemente suddiviso nei suoi elementi, pi`u ogni sua parte, se opportunamente indicizzata e classificata, risulta riutilizzabile per la costruzione e la produzione di nuova informazione. Pertanto, ai fini di agevolare il riuso `e opportuno che l’informazione possa essere trattata con un livello di granularit`a arbitrario.
Non `e necessario che la sorgente di informazione sia unica (ovvero prodotta da una sola organizzazione) e unitaria (ovvero memorizzata su un solo si- stema); disporre della possibilit`a di modellare le informazioni con un livello di granularit`a arbitrario risulta essere tanto pi`u vantaggioso quanto pi`u `e possibile distinguere le organizzazioni (e sotto-organizzazioni) che trattano le singole informazioni, costituendo in modo naturale un sistema distribuito dal punto di vista dello stesso documento.
La dinamicit`a e la flessibilit`a sono ottenute grazie all’elevato grado di au- tonomia delle singole sorgenti che, in modo collaborativo, partecipano alla determinazione di documenti capaci di evolvere nel tempo, lasciando che ogni parte degli stessi sia soggetta a modifiche indipendenti. In realt`a il fruitore dell’informazione pu`o trovarsi di fronte a documenti che percepi- sce come immutabili (un atto di nascita, ma anche un articolo di giornale ormai pubblicato) cos`ı come ad entit`a intrinsecamente dinamiche (come lo stato del conto corrente bancario o lo stato di famiglia) che spesso vengono quantizzate con opportune tecniche di campionamento (nel tempo) al fine di renderle immutabili e quindi pi`u facilmente trattabili (l’estratto conto, lo stato di famiglia ad una certa data). In ogni caso `e esistito un processo, eventualmente distribuito, attivo nell’intervallo [t1, t2] (con t1 ≤ t2) che ha
portato alla generazione dell’informazione al tempo tx(immutabile o meno)
con tx∈ [t1, t2].
Il documento IDN `e quindi una entit`a attiva, in quanto pu`o evolvere e cam- biare comportamento sulla base dello stato assunto e delle relazioni espresse all’interno per effetto della gestione storica (o versioning).
Applicando le considerazioni precedenti all’esempio del documento patente, se i punti vengono azzerati come effetto di una serie di contravvenzioni, il documento perde di validit`a e possono venire automaticamente notificati degli avvisi ai soggetti interessati. Limitandosi al solo punto di vista tecnico e formale (e tralasciando quello giuridico) si determina la creazione automatica di una nuova patente, in base al principio che “se cambia una parte, allora cambia l’intero aggregato delle parti”.
All’interno di IDN-IM, i documenti sono ottenuti dalla suddivisione dei con- tenuti informativi, fino ad ottenere quelle che sono chiamate informazioni atomiche (la definizione sar`a fornita all’interno del paragrafo 3.3). Il proce- dimento di suddivisione termina nel momento in cui si incorre in un’infor- mazione che non sia ulteriormente (e ragionevolmente) frazionabile, quale ad esempio il nome o il cognome di una persona.
Per essere fruibile questo procedimento necessita ovviamente di un compro- messo tra la complessit`a, l’effettiva necessit`a di riuso dei contenuti infor- mativi e l’adeguatezza della granularit`a della rappresentazione: ci`o viene ottenuto attraverso il concetto di informazione primitiva (la cui definizione sar`a fornita nel paragrafo 3.3).
Il presente lavoro si propone come un approccio per la creazione di in- formazioni che siano sufficientemente granulari da possedere le seguenti caratteristiche:
• modularit`a: le informazioni devono essere aggregabili in maniera ver- satile con altre;
• indirizzabilit`a: le informazioni devono essere identificabili sia logica- mente che per indice;
• riusabilit`a: le informazioni devono essere autonome in diverse situa- zioni;
• interoperabilit`a: le informazioni devono essere indipendenti dal conte- sto.
Come regola fondamentale per la strutturazione viene utilizzato il principio di responsabilit`a sulle parti informative che costituiscono l’informazione: in tal modo si apre la strada alla possibilit`a di elaborare in autonomia le singole parti di cui `e costituito il documento.
Tale metodologia assume un valore estremamente determinante quando vie- ne coinvolto il trattamento di informazioni sensibili ed in generale da un punto di vista giuridico. Su larga scala consente inoltre di realizzare in maniera automatizzata un insieme di mattoni informativi elementari che possono essere riutilizzati dalla comunit`a per costruire nuova informazione, cos`ı come proposto dal capitolo 6 del presente lavoro.
3.1 IDN Information Model: concetti generici 53
Il principio di responsabilit`a pu`o anche essere inteso come conseguenza na- turale dei processi organizzativi e metodologici individuati all’interno delle organizzazioni.
Un’importante osservazione `e legata alla assegnazione selettiva dei diritti di accesso per le singole informazioni quale condizione necessaria per poter parlare di responsabile: per esercitare il suo ruolo occorre che il responsabile abbia le garanzie sulle modalit`a di gestione ed accesso all’informazione. All’interno dei documenti con i quali si interagisce possono essere individuate le seguenti categorie di informazioni:
• contenuti : elementi esplicitamente fruibili dall’uomo e che sono diret- tamente individuabili all’interno del documento. Rientrano in questa categoria i testi, le immagini, le date, i nomi, i contenuti multimediali, eccetera;
• relazioni : legami fra contenuti che possono essere di tipo esplicito o implicito. Un esempio di legame esplicito pu`o essere il riferimento ad una pagina o paragrafo di un libro, ad un articolo presente in una legge, eccetera. In modo duale un legame implicito pu`o essere quello esistente fra il titolo di un capitolo di un libro e il contenuto del capitolo stesso;
• presentazione: informazioni necessarie per mostrare correttamente il documento all’utente. Rientra a pieno titolo in questa categoria l’a- spetto grafico, ovvero la scelta dei caratteri, dei colori, dell’impagi- nazione, eccetera. Questa categoria di informazioni fornisce un valo- re aggiunto che in particolari casi `e determinante per permettere la fruibilit`a delle informazioni contenute nel documento;
• informazioni aggiuntive: ulteriori informazioni associate al documen- to e/o che possono essere date per scontate. Ad esempio l’autore di un brano musicale oppure il fatto che i contenuti presenti nella pri- ma pagina di un quotidiano rappresentano un sunto delle notizie pi`u importanti del giornale.
Queste categorie di informazioni sono state introdotte parlando di documen- to in senso astratto e/o nel senso convenzionale del termine. Nel momento in cui si intenda codificare un documento per renderlo trattabile dalle mac- chine occorre formalizzare al meglio questi concetti al fine di poterli gestire efficacemente ed efficientemente da un punto di vista informatico.
I documenti dotati di queste caratteristiche e codificati opportunamente vengono chiamati documenti strutturati. I vantaggi riscontrati trattando documenti strutturati sono molteplici in quanto gli aspetti strutturali, oltre a fornire un contenuto informativo addizionale rispetto al caso non strut- turato, permettono di garantire anche un maggior controllo dei contenuti. Inoltre tramite il riferimento ad altre informazioni `e possibile realizzare vari
documenti che di fatto determinano una rete di concetti. Le macchine, in questo modo, diventano sistemi in grado di elaborare il contenuto informati- vo dei documenti e ci`o permette di sfruttarne agevolmente le potenzialit`a in termini di velocit`a, memorizzazione e comunicazione per supportare efficien- temente l’uomo, il cui lavoro risulta velocizzato e facilitato nell’immissione, nella ricerca e nella consultazione delle informazioni.