• Non ci sono risultati.

Rappresentazione della conoscenza e classificazione ceramica.

N/A
N/A
Protected

Academic year: 2021

Condividi "Rappresentazione della conoscenza e classificazione ceramica."

Copied!
19
0
0

Testo completo

(1)

VOL. 2 2009,1 PP. 147-165

ISSN1974-7985

R

APPRESENTAZIONE DELLA CONOSCENZA E CLASSIFICAZIONE CERAMICA

C

AVANI

V.*,

M

OSCA

A.**,

R

ONDELLI

B.**

1

PAROLE CHIAVE

Classificazione automatica, ceramica, intelligenza artificiale, rappresentazione della conoscenza, ontologia. KEYWORDS

Automatic classification, pottery, artificial intelligence, knowledge representation, ontology.

R

IASSUNTO

Il presente articolo propone una metodologia di classificazione del materiale ceramico attraverso la sperimentazione di tecniche di rappresentazione della conoscenza, proprie del settore dell’intelligenza artificiale. Il contesto applicativo è il progetto di ricerca sull’età del Bronzo in Romagna, cui si rivolge questa edizione della rivista.

A

BSTRACT

This paper shows a methodology for the pottery classification by the testing of knowledge representation techniques coming from the field of artificial intelligence. The application context is the research project on the Bronze Age in Romagna, which this journal issue is devoted.

I

NTRODUZIONE

Il presente articolo intende descrivere una metodologia di classificazione applicata al materiale ceramico e mostrare una sperimentazione di tecniche proprie dell’intelligenza artificiale nell’ambito del progetto di ricerca sull’età del Bronzo in Romagna, cui si rivolge questa edizione della rivista2.

Il progetto3, iniziato nella primavera del 2007 e tuttora in corso, è di natura multidisciplinare e vuole rappresentare una piattaforma di sperimentazione per soluzioni innovative che possano sfruttare nuovi strumenti concettuali, modelli, tecniche e tecnologie derivati dall’approccio scientifico e computazionale a supporto all'analisi archeologica (MANTEGARI et al.2006; MANTEGARI ET AL. 2007; MOSCA ET AL. 2008; MANTEGARI ET AL. forthcoming; MANTEGARI,DE SALVO forthcoming).

La scelta del contesto, in cui si inserisce questo approccio, è lo studio del popolamento dell’età del Bronzo (ca. 2200 – 900 a.C.) nella Pianura Padana. Tale contesto rappresenta uno degli ambiti maggiormente conosciuti e documentati della protostoria italiana ed europea. I dati a disposizione sono estremamente dettagliati e disponibili in grande quantità, e le ricerche sul campo sono particolarmente attive.

Ovviamente, la revisione sistematica del materiale edito relativo alla cultura materiale ricopre un ruolo di primaria importanza per un'analisi e una miglior comprensione delle dinamiche del popolamento.

In questa sede ci focalizzeremo sulla documentazione e classificazione della produzione vascolare, che rappresenta l'aspetto meglio noto e dibattuto nella documentazione archeologica del periodo, nonché quello numericamente più rappresentato.

La struttura dell'articolo è così organizzata: la sezione 1 è dedicata ad una introduzione sul tema della classificazione ceramica e impiego di metodi automatizzati (sezione 1). Saranno poi spiegate alcune riflessioni sulle regole di classificazione definite nel progetto in corso (sezione 2.1) e la base di dati creata per l'inserimento dati (sezione 2.2). Nella sezione 3 si presenta il sistema di classificazione creato. In tale sezione saranno introdotti alcune nozioni

1 * Università di Bologna, Dipartimento di Archeologia, vittorio.cavani@studio.unibo.it; ** Università di Milano-Bicocca, Dipartimento di Informatica, Sistemistica e Comunicazione, alessandro.mosca@unimib.it; bernardo.rondelli@disco.unimib.it. 2 Si ringrazia Diego Bernini per il supporto alla progettazione, implementazione del sistema di classificazione automatica. Si

(2)

teoriche e metodologiche sulla tecnica scelta (sezione 3.1), per poi descrivere il metodo implementato (sezione 3.2). Nella sezione 4 presentiamo alcune considerazioni e problemi ancora aperti.

C

LASSIFICAZIONE E METODI AUTOMATIZZATI

:

INTRODUZIONE ALLA PROBLEMATICA

Il tema della classificazione ceramica nella sua connotazione teorica e metodologica è da sempre oggetto di ampi dibattiti e confronti anche nella preistoria italiana (BIETTI SESTIERI 2000), dove è principalmente inteso come strumento finalizzato a supportare l’identificazione di aspetti cronologici e culturali (COCCHI GENICK 2006). La classificazione ceramica è infatti definibile come la pratica di descrivere e disporre in gruppi tassonomici gli artefatti rinvenuti, osservando e comparando diverse caratteristiche degli stessi. Gli artefatti vengono classificati correlando informazioni eterogenee note, di natura qualitativa e quantitativa, e cioè strutturali (che si riferiscono alla struttura geometrica), mereologiche (che appartengono alla relazione tra le diverse parti che compongono l’artefatto), morfologiche (che appartengono alla forma dell’artefatto), funzionali (che appartengono all’uso dell’artefatto) e materiali (che si riferiscono alla composizione chimico-fisica e alla materia con cui sono realizzati gli oggetti). Uno degli obiettivi principali delle ricerche in questo contesto di studio consiste nell’individuazione di regolarità o irregolarità nella distribuzione spazio-temporale di determinati corpus di materiali, al fine di rilevare elementi utili all’identificazione ed, eventualmente, alla comprensione, di momenti di continuità, contatto, trasmissione o trasformazione, che hanno caratterizzato i sistemi sociali nel passato. In altri termini, gli artefatti ritrovati possono essere osservati come principali testimoni del risultato finale di processi produttivi, da un lato, e usi pratici e ideologico-simbolici, dall’altro.

La classificazione ceramica si propone, dunque, non solo di fornire una descrizione sistematica del materiale rinvenuto, ma anche di ricondurre frammenti a forme intere o di permettere un’analisi comparativa tra diversi frammenti archiviati all’interno di basi di dati. Tali operazioni (associazione alla tassonomia esistente, comparazione, eventuale individuazione di una nuova tassonomia), se effettuate manualmente, richiedono l'impiego di esperti ed una grande quantità di tempo. Per questo motivo diversi ricercatori si sono spinti nella sperimentazione di metodi atti a supportare l'attività di classificazione in maniera automatica o semi-automatica (ADAMS 2007, BARCELÒ 2009). I metodi per la classificazione e l'attribuzione tipologica automatizzate o semi- automatizzate si basano su due approcci fondamentalmente distinti, che impiegano metodi e tecniche proprie dell'Intelligenza Artificiale: I) approccio connessionista o sub-simbolico, II) approccio simbolico. A questi occorre aggiungere, per completezza, i metodi cosiddetti di III) data mining, caratterizzati dall'applicazione di algoritmi per l’analisi numerica di tipo statistico e dedicati solitamente a risolvere problemi di clustering. Ricordiamo a tal proposito che esiste una sostanziale differenza fra processi di classificazione e di clustering, laddove con il termine classificazione ci si riferisce all'organizzazione dei dati sulla base di tipi o gruppi predefiniti, nel clustering tali gruppi non sono determinati a priori e, anzi, la loro definizione è demandata all'algoritmo impiegato (ad esempio, algoritmi di tipo hierarchical, partitional o biclustering).

L'approccio simbolico e quello sub-simbolico sono rappresentatitivi di due filoni di ricerca, solitamente considerati come antitetici e alternativi, interni all'Intelligenza Artificiale. In questo contesto, la differenza fra i due approcci si misura essenzialmente in riferimento alle metodologie ed alle tecniche impiegate nella realizzazione di un artefatto computazionale che possa dirsi “intelligente”. La genesi dell'approccio simbolico risale agli albori dell'Intelligenza Artificiale, per non dire della stessa Computer Science4. Tale approccio consiste essenzialmente nel rappresentare, per mezzo di un opportuno linguaggio formale (dunque, machine readable), la conoscenza che un dato agente possiede, relativamente ad un dato dominio di interesse, in una “base di conoscenza” e da questa base trarre le conclusioni necessarie alla risoluzione di un problema specifico per mezzo di meccanismi inferenziali di manipolazione dei simboli (semanticamente densi) presenti nella base. Tale approccio ha molto a che vedere con la logica e con le teorie assiomatiche in matematica: la conoscenza di un dato pezzo di mondo viene rappresentata sotto forma di assiomi da cui si traggono conclusioni (i teoremi). A questo filone di ricerca appartengono gli studi sulla logica temporale, quelli sulla rappresentazione di conoscenza incerta (vedi la logica di default - Reiter, 1980), la ricerca sulle cosiddette verità “sfumate” (vedi la logica fuzzy - Zadeh, anni Sessanta). L'approccio sub-simbolico, che ha origine intorno alla seconda metà del secolo scorso5, mira a sfruttare l'architettura neuronale, ovvero, la composizione sotto forma di rete di un gran numero di unità logiche elementari interconnesse, per realizzare artefatti intelligenti che non necessitino di una rappresentazione a priori (implicita o esplicita) delle proprie regole di comportamento. Si intendeva così superare il problema relativo alla presenza di un programmatore umano che “programmasse” il comportamento intelligente dell'artefatto computazionale. Le reti risultanti, dette appunto “reti 4 In particolare, è nell'opera di J. McCarthy e nella realizzazione del linguaggio di programmazione LISP e dell'Advice Taker (1958) che si riconosce storicamente la nascita dell'approccio simbolico.

5 Sulla scorta della semplificazione del modello di neurone biologico proposta del neurofisiologo W.S. McCulloch e dal logico W.H. Pitts nel 1943.

(3)

neurali”, hanno la capacità di apprendere il proprio comportamento (ad esempio, la risoluzione di un determinato problema) dall'esperienza, senza alcun meccanismo che ne determini a priori il comportamento. Una rete neurale è in grado, diversamente da una macchina di Von Neumann, di creare le proprie rappresentazioni interne e di modificarle opportunamente sulla base della presentazione ripetuta di esempi. Chiaramente, perché il comportamento finale della rete sia consono alla risoluzione di un problema specifico, la rete necessita di una fase cosiddetta di “addestramento”, nel corso della quale il trainer sostiene, mediante l'impiego di “casi positivi” e “negativi”, la definizione da parte della rete di una opportuna rappresentazione interna del problema (ad esempio, una volta che la rete ha appreso a riconoscere come simili determinate immagini, grazie all'addestramento cui è stata sottoposta, essa è in grado di associare fra loro correttamente anche nuove immagini, anche se parzialmente differenti da quelle utilizzate nella fase di apprendimento). Non vogliamo addentrarci in questa sede nei dettagli tecnici che caratterizzano la definizione di una rete neurale, ci basti dire che ciascuna delle unità logiche (i neuroni) di cui è composta la rete fornisce un'uscita binaria (1 o 0) in base al risultato di un semplice calcolo effettuato su valori numerici o “pesi” (provenienti dai dati relativi al problema) che si trovano sui suoi canali d'ingresso. Solitamente l'unità è caratterizzata da un valore di soglia che viene continuamente confrontato con il risultato del calcolo effettuato sui suoi valori di ingresso: quando questo valore supera la soglia, l'unità restituisce il valore 1, restituisce 0, altrimenti. La rete “apprende dall'esperienza” se le è consentito modificare i pesi relativi alle unità logiche di cui è composta, al fine di riuscire a generare, dopo la fase di apprendimento, le risposte desiderate, date un problema. L'algoritmo impiegato dalla rete per adeguare i pesi delle sue unità logiche al fine di ridurre il più possibile la distanza tra la risposta reale e quella assegnata dall'istruttore è noto come algoritmo di “retro-propagazione dell'errore” (calcolo delle derivate effettuato rispetto ai pesi delle connessioni della somma dei quadrati degli scarti tra uscite effettive e uscite attese).

Per il supporto alla classificazione tipologica degli artefatti ceramici, la letteratura corrente mostra un crescente impiego di metodi basati su reti neurali (per es. BARCELÒ 1995, BARCELÒ 1996, REELER 1999, RAMAZZOTTI 1999, RAMIL et al. 2008, BARCELÒ 2009 Cap. IV), fondati prevalentemente sulla descrizione morfologica e dei profili, ottenuta per mezzo di tecniche di laser scanning e profilazione automatica (cfr. per una bibliografia estesa KAMPEL, SABLATNIG 2007; MAIZA, GAILDRAT 2005, GILBOA et al. 2004). Un altro esempio significativo è costituito dall’impiego di tecniche statistiche multivariate (Fermo et al. 2004), spesso applicate alle analisi archeometriche (ALDEN et al. 2006; CAU et al. 2004; PAPAGEORGIOU et al. 2001), così come l’uso di algoritmi di Data Mining per il clustering degli artefatti ceramici su base morfologica e/o strutturale.

E' importante sottolineare che, tanto l'approccio sub-simbolico a reti neurali, quanto quello fondato sull'impiego di algoritmi di clustering e di analisi statistica multivariata trovano applicazioni importanti soprattutto per quanto concerne materiale ceramico tornito e di produzione in serie, al contrario, nella produzione vascolare preistorica e protostorica non si trovano molte applicazioni per via della difficoltà ad operare un calcolo normalizzato dei profili o della morfologia in generale.

Nell’età del bronzo, in particolare, la ceramica è nella maggior parte dei casi una produzione ancora domestica, ciò determina un notevole grado di fluidità tipologica. Anche se alcuni studiosi (Levi 1997) suggeriscono la presenza di botteghe specializzate, individuabili sulla base di studi radiografici, che hanno permesso la possibilità di individuare l’uso diffuso dello stampo come indicatore di specializzazione e seriazione per alcune forme, a differenza della tecnica a cercine, meno specializzata, e assimilabile al laboratorio domestico. Inoltre, spesso esistono marcate differenze nella tecnica e nella qualità del disegno stesso dell’oggetto, inficiando la possibilità di un riconoscimento automatico efficace, basandosi esclusivamente sull'andamento morfologico deducibile da disegni. A tale “inconveniente” potrebbe supplire l’applicazione dello scanner laser, ma non è pensabile di poter oggi usare in maniera estensiva tale tecnologia. Il problema rimarrebbe, per di più, con i disegni antichi o ricavati dal materiale edito o d'archivio. Lo stesso problema si riscontrerebbe coll’applicazione di tecniche fotogrammetriche e fotografiche.

Nel contesto degli studi e della ricerca preistorica, va tenuto conto che la classificazione ceramica è tanto più efficace quanto più è competente colui che opera la classificazione, dal momento che può mettere in gioco maggior conoscenza ed esperienza accumulata, relativamente al contesto spazio-temporale di interesse. Tale competenza si manifesta spesso nella capacità di completare, individuare e associare informazioni che non sono, se non in rarissimi e fortuiti casi, riconducibili ad un mero calcolo numerico o statistico. In particolare, un aspetto molto importante nella classificazione ceramica preistorica è il trattamento dell'incertezza e la possibilità di gestire l'attribuzione multipla di un oggetto a più di una tassonomia in mancanza di informazioni complete.

La ricerca preistorica, inoltre, è per sua natura fortemente orientata all’analisi esplorativa dei dati, e cioè, a differenza di altri metodi matematici e statistici, l'analisi esplorativa non richiede particolare attenzione alla creazione del campione, giacché il suo fine specifico non è quello di estendere a una popolazione di riferimento i risultati ottenuti da un campione statisticamente rappresentativo, ma piuttosto è quello di evidenziare la presenza di strutture e relazioni esistenti nel corpus dei dati, riorganizzandoli in modo da sintetizzare l'informazione in essi contenuta, in

(4)

formulazione di ipotesi al riguardo. A tal proposito il metodo della rete neurale potrebbe sembrare una soluzione interessante, sennonché l’algoritmo che esplora la presenza di strutture e relazioni funziona come una “black box”, restituendo sì un raggruppamento, ma senza esplicitare le caratteristiche e i valori che hanno portato a quel raggruppamento.

A tal proposito l’esplorazione dei metodi simbolici nella classificazione ceramica rappresenta a nostro avviso un interessante contesto di esplorazione alternativo e integrativo al solo calcolo numerico, dal momento che i metodi simbolici, a differenza di quelli numerici, sono basati su modelli concettuali e permettono di integrare diverse caratteristiche in maniera più flessibile e aperta e costringono ad una esplicitazione della conoscenza esperta coinvolta nell'attività di classificazione.

C

RITERI DI CLASSIFICAZIONE E INSERIMENTO DATI

I criteri di classificazione utilizzati e qui discussi, fanno riferimento all'ipotesi preliminare di tipologia formulata dal gruppo di ricerca del Dipartimento di Archeologia dell'Università di Bologna6, ed elaborata sulla base del caso specifico riguardante l'età del Bronzo nel territorio romagnolo.

Nell'impostazione della ricerca si è proceduto ad un riesame approfondito della letteratura paletnologica disponibile, incontrando da subito le prime difficoltà. È circostanza assodata, infatti, che la Romagna non possa vantare una tradizione di studi paragonabile alla limitrofa Emilia, per motivi che in questa sede sarebbe fuori luogo approfondire; per lo studio in corso appare particolarmente grave la mancanza a tutt'oggi di un'edizione integrale di un complesso di scavo, se si esclude la revisione delle ricerche ottocentesche di G. Scarabelli a Monte Castellaccio (PACCIARELLI 1996), nonostante diversi studiosi di rilievo quali, H. Müller-Karpe, R. Peroni, A. M. Bietti Sestieri, si siano occupati in passato specificamente dei ripostigli del Riminese nel tentativo di giungere ad una classificazione sistematica nel quadro della preistoria recente italiana (ZUFFA 1978, pp. 202-203). Sfortunatamente tale breve stagione di studi non ebbe un seguito apprezzabile nei decenni successivi.

A ciò si aggiunge lo stato estremamente precario delle fonti archeologiche, costituito per la maggior parte da recuperi di superficie o in situazioni di emergenza, che ha contributo in maniera decisiva ad una relativa inerzia del dibattito scientifico. Solo in anni relativamente recenti si è giunti al riconoscimento dell'esistenza di gruppi locali (COCCHI GENICK 1996,pp.87-88; COCCHI GENICK 2002,pp. 319-325), all'interno delle più ampie facies interregionali. Infine si è deciso di passare in rassegna le diverse proposte di tassonomie e di tipologia per lo studio della produzione ceramica terramaricola da un lato (BERNABÒ BREA ET AL.1991-92;MUTTI 1993,pp.41-42;BERNABÒ BREA ET AL. 2004, p. 521), e, dall'altro, le molteplici e non sempre concordi classificazioni elaborate per l'ambito dell'Italia centrale (CARDARELLI ET AL.1999;COCCHI GENICK 1999;BELARDELLI ET AL.1999;COCCHI GENICK 2001), nella convinzione della possibilità e della necessità di creare una classificazione ed una terminologia unitaria per un contesto, la Romagna, che, come detto, sin dall'antica età del Bronzo ha conosciuto ascendenze culturali, le quali, senza entrare nel dettaglio, si possono definire genericamente peninsulari e padane.

REGOLE ED EURISTICHE

Da un punto di vista teorico è stata accolta la definizione critica di classificazione e tipologia elaborata da A. M. Bietti Sestieri (BIETTI-SESTIERI, 2000). Seguendo una tale impostazione si sono stabiliti tre differenti livelli di scala di osservazione, regolati tra loro da un rapporto gerarchico, che sono:

• classe: individuazione sulla base di parametri in senso lato funzionali degli aspetti morfologici generali del recipiente;

• forma: definizione dei caratteri morfologici complessivi comuni ad alcuni insiemi di manufatti che sono funzionalmente omogenei, ma che indicano con maggior precisione il prototipo, il modo d’uso o le esigenze tecniche;

• tipo: determinazione più dettagliata delle caratteristiche funzionali e stilistiche, elementi peculiari utili ad un inquadramento cronologico e/o di diffusione territoriale.

Il carattere ancora preliminare dello studio in corso non permette di approfondire il secondo e il terzo livello di analisi, nonché di giungere ad ulteriori gradi di dettaglio, quali ad esempio foggia e variante.

L'individuazione della classe si basa su parametri per lo più morfologici ed in particolare sul rapporto fra le varie parti componenti il recipiente ceramico e la presenza/assenza di elementi da presa. Solo in senso lato si sono prese in considerazione caratteristiche macrofunzionali come nel caso della tazza, cioè qualsiasi forma vascolare aperta 6 Il gruppo, coordinato dal prof. Maurizio Cattani, ha visto la partecipazione di una decina di persone tra studenti, neolaureati e dottorandi dell'Università di Bologna, all'interno di laboratori ed esperienze di avviamento alla ricerca preistorica, promossi dagli insegnamenti di Paletnologia e Metodi per la Ricerca Preistorica e Protostorica tra le sedi di Bologna e Ravenna.

(5)

che presenti un'ansa verticale, a prescindere dall'andamento del profilo (continuo o articolato) , in quanto la presenza di un ben preciso elemento da presa suggerisce che il manufatto (o artefatto) doveva essere afferrato in un modo differente da quello utilizzato per afferrare una ciotola o una scodella, indicando, pertanto, un altrettanto precisa funzione.

Sarebbe altresì preferibile utilizzare l'espressione “potenziale attitudine funzionale” (CARDARELLI ET AL.1999,p.281), significando con questa la possibile ricostruzione sintetica di modelli tramite il ricorrere di relazioni ed associazioni, pur rinunciando a fornire una determinazione della funzione, per la quale occorrerebbe l'ausilio, fra le altre, di ricerche archeometriche, senza tralasciare anche l'aspetto simbolico della medesima.

Sfortunatamente per l'ambito preso in esame il dato archeometrico risulta alquanto lacunoso, essendo disponibili i risultati di limitate analisi condotte sul materiale dei siti di Monte Castellaccio e San Giuliano di Toscanella (AMADORI et al.1996;LEVI et al.1997).

Seguendo questa impostazione di metodo si è giunti dunque ad un'identificazione di ampie classi per le quali si è tenuto conto di una suddivisione in forme aperte e forme chiuse. Un simile criterio si regola su parametri dimensionali, ossia sul rapporto in primis fra altezza e diametro all'orlo.

Le forme aperte si caratterizzano per una prevalenza della misura del diametro rispetto all'altezza (es. scodella, tazza, ciotola), al contrario delle forme chiuse (es. orcio, olla, dolio).

Sulla base di una distinzione statistico-dimensionale si sono definite ulteriori suddivisioni. Ad esempio lo scodellone si distingue dalla scodella per il diametro all'orlo superiore ai 30 cm; così come il dolio possiede un diametro superiore (> 40 cm) rispetto alle olle e agli orci, indipendentemente dal profilo.

Proprio il profilo rappresenta un secondo elemento utile all'individuazione delle classi. Sulla base della segmentazione composita delle parti che lo costituiscono esso può essere definito articolato (a) o non articolato (na). Queste categorie si differenziano a livello generale per quanto riguarda le forme chiuse come segue: (a) profilo biconico, oppure per la presenza di un collo distinto; (na) corpo ovoide, globulare, troncoconico, cilindrico.

Le forme aperte si diversificano oltre che per l'articolazione del profilo, composto essenzialmente da parete (es. scodella, scodellone) e dall'eventuale carena (es. tazza, ciotola), anche per la presenza/assenza di elementi da presa. Le scodelle ne risultano sempre prive, mentre le tazze sono sempre munite di un'ansa verticale e le ciotole presentano costantemente una presa, un manico o una maniglia, ossia un'ansa orizzontale.

Allo stato attuale dello studio tipologico solamente il bacile e la situla sono state individuate come forme chiuse presentanti un elemento da presa, nel secondo caso costituito da maniglia.

All'interno di questi ampi campi di variabilità si riscontrano quasi necessariamente classi che solo parzialmente si armonizzano nella classificazione proposta. È il caso delle tazze/ciotole, ovvero di quei frammenti di forme aperte articolate prive di elementi da presa non attribuibili all'una o all'altra classe; oppure della tazza/olla, forma con profilo articolato, di dimensioni contenute, con o senza orlo distinto, diametro inferiore ai 30 cm, che comprende tutti quei vasi in cui il rapporto fra diametro massimo all’orlo e altezza è di 1:1 e che presentano almeno un'ansa verticale.

Il secondo grado della tassonomia, ossia la forma, esamina nello specifico alcune caratteristiche morfologiche generali dei manufatti utili a definire insiemi più dettagliati. Fra le principali si ricordano: orlo, parete, collo, spalla, carena, fondo piede, tipo di elemento da presa con tutte le relative varianti.

Infine al terzo e ultimo livello di analisi si colloca la definizione del tipo, ossia il riconoscimento di evidenze archeologiche “in cui viene a riflettersi un modello mentale socialmente accettato da una o più comunità, identificabile in una serie di manufatti accomunati dall'associazione di specifici attributi.” (COCCHI GENICK 2001, p. 26). Peculiarità imprescindibile del tipo è la riproducibilità, ossia una sua diffusione geografica o cronologica, essendo indicatore dei meccanismi di trasmissione dei modelli; il tipo si rivela in ultima analisi essenziale per l'identificazione di facies e gruppi archeologici, e di conseguenza per la ricostruzione di una cronologia relativa più puntuale.

BASE DI DATI E SISTEMA INFORMATIVO GEOGRAFICO

Una volta definite le regole di classificazione è stato realizzato un database (MS Access connesso a Canto Cumulus) per gestire l'inserimento dati (cfr. per dettagli RONDELLI 2007, Cap. 6).

(6)

Fig. 1: Schema della struttura del sistema.

Per permettere una piena consultazione del database a tutti gli studiosi, compresi quelli che non condividono o non conoscono le scelte di classificazione adottate, abbiamo ritenuto fondamentale inserire nella scheda del reperto ceramico una descrizione minuziosa dell’oggetto e una sua immagine (disegno e fotografia laddove disponibile) con indicata la scala7.

(7)

Fig.2: Stampa a video della maschera di inserimento dati per la classificazione ceramica.

Attraverso una maschera di ricerca è possibile trovare analogie e confronti utilizzando come chiave di ricerca sia le regole di classificazione, sia il testo libero della descrizione. Il sistema restituisce come risposta l'elenco delle schede contenenti i requisiti cercati, oppure l'insieme di tutte le immagini dei reperti aventi tali requisiti. In tal modo, attraverso la visualizzazione diretta, è possibile verificare se il sistema ha restituito i reperti voluti ed effettuare un'ulteriore cernita.

(8)

Fig.4: Stampa a video della maschera dei risultati ottenuti con i parametri della ricerca

Ogni singolo reperto ceramico archiviato è collegato alla scheda riguardante il sito di provenienza, permettendo di visualizzare in maniera interattiva attraverso un GIS e WebGIS8 la distribuzione geografica (MANTEGARI et al. forthcoming; MANTEGARI, DE SALVO forthcoming).

Fig. 5: Stampa a video di un esempio di risultati della ricerca visualizzati nel GIS mediante l'esportazione della selezione. In questo caso le dimensioni dei cerchi indicano il numero dei reperti presenti per ogni sito.

(9)

Fig. 6: Stampa a video di un esempio di visualizzazione nel WebGIS. Anche in questo caso le dimensioni dei cerchi indicano il numero di reperti presenti per ogni sito.

La compilazione del database e la fase di inserimento dati è stata eseguita da studenti e neolaureati. Nel corso dell'attività sono emersi alcuni problemi che possono essere così sintetizzati:

La compilazione e la classificazione manuale di ogni singolo frammento ceramico richiede molto tempo e con numerose possibilità di errore accidentale o sistematico.

La classificazione presenta gradi di incertezza per mancanza di informazioni complete sul reperto da classificare e questo rende spesso difficile l'associazione ad una singola tassonomia, forzando il compilare a decidere in maniera rigida.

Le euristiche di classificazione sono spesso implicite e basate su esperienza tacita, per tale motivo è spesso difficile operare una classificazione metodologicamente corretta ed esplicita.

Il sistema di classificazione inizialmente adottato e sopra descritto non permette di integrare agevolmente descrizioni di classificazione proposte da altri studiosi dal momento che le differenze sono ricondotte a terminologie differenti ma non alle euristiche.

Detto ciò, si è cercato di ricorrere ad un metodo di classificazione che permettesse di superare i problemi sopra rilevati durante la classificazione manuale. Per alcune ragioni, già evidenziate nell'introduzione e, soprattutto, per la necessità di utilizzare un metodo utile a esplicitare conoscenza tacita e a integrare diverse variabili, abbiamo deciso di adottare un metodo simbolico. Tra i metodi simbolici, quello che qui proponiamo e su cui si è basata la nostra sperimentazione riguarda l’applicazione di tecniche computazionali che fanno capo alla branca dell'Intelligenza Artifciale nota con il nome di Knowledge Representation and Reasoning (KR&R - in it. 'Rappresentazione della conoscenza e ragionamento') (BRACHMAN,LEVESQUE 2004).

(10)

I

L METODO DI CLASSIFICAZIONE

Nel seguito dell'articolo mostreremo che esistono dei linguaggi di programmazione logica la cui espressività ben si presta ad essere impiegata nella direzione di superare (o quantomeno provare a farlo) i problemi appena delineati. RAPPRESENTAZIONE DELLA CONOSCENZA, INFERENZA E CLASSIFICAZIONE

Il settore dell’IA noto come rappresentazione della conoscenza, la cui comparsa nel panorama delle scienze computazionali può farsi risalire al periodo intorno alla seconda metà degli anni sessanta, ha come scopo quello di sviluppare linguaggi 'formali' (dotati, cioè, di una semantica formale esplicita) adatti a rappresentare la conoscenza utile alla risoluzione di determinati problemi. Come ricorda Marcello Frixione nelle sue “Dispense di Rappresentazione della Conoscenza”9: in generale, per soddisfare questa esigenza, un sistema di rappresentazione della conoscenza deve consistere di:

a) un linguaggio di rappresentazione, ossia di un insieme di strutture sintattiche (in accordo con l’ipotesi del sistema di simboli fisico di Newell e Simon) adatte a codificare le informazioni che si intendono rappresentare, e tali da poter essere implementate nella memoria di un calcolatore (NEWELL,SIMON, 1972);

b) un insieme di regole, o di operazioni, che consentano di manipolare tali strutture sintattiche in accordo con il significato che è loro assegnato. L’applicazione delle regole deve consentire di ottenere le inferenze volute, e le regole devono poter essere formulate sotto forma di procedure effettive.

Stante i requisiti appena elencati, non è difficile comprendere come la storia di questa disciplina sia legata in maniera pressoché indissolubile con i recenti sviluppi della logica matematica (GENESERETH,NILSSON,1987;RANDALL, 1993). La logica, disciplina assai più antica dell'Intelligenza Artificiale (l'origine della logica, nella forma simbolica in cui la conosciamo noi oggi, si fa risalire all'opera di Aristotele):

• studia i nessi inferenziali fra gli enunciati,

• è caratterizzata dalla presenza di un alfabeto e di regole per la definizione di parole semplici e complesse a partire dagli elementi di tale alfabeto (sintassi),

• è dotata di un apparato semantico formale di tipo composizionale mediante il quale è possibile associare un significato definito a ciascuna delle alle parole semplici e composte del linguaggio (semantica), e di un calcolo, ovvero, un insieme di regole che consentono la manipolazione sintattica degli elementi linguistici definiti, mediante il quale è possibile ottenere nuove espressioni (dette, conseguenze logiche o teoremi) a partire da espressioni date (dette premesse), in accordo con la semantica stabilita (calcolo inferenziale)10. La Sillogistica aristotelica è solitamente l'esempio che si suole portare per ricordare ad un pubblico non esperto cosa s'intende per logica, anche se non bisogna dimenticare che più di duemila anni di storia di questa disciplina hanno fortemente modificato il suo aspetto formale e potenziato il suo valore scientifico.

La classificazione di artefatti ceramici è chiaramente un'attività di risoluzione di problemi che si fonda su euristiche dipendenti dal dominio. Dal punto di vista epistemologico, un'euristica di classificazione può essere vista come il risultato della correlazione e dell'integrazione di differenti e, spesso, eterogenei frammenti di informazione relativi agli oggetti di un dato dominio. Detto in altri termini, un'euristica di classificazione dipende dalla correlazione di attributi e caratteristiche impiegati per la descrizione e l'analisi dell'oggetto d'indagine.

Date queste premesse, il primo passo verso la rappresentazione formale di un insieme consistente di euristiche di classificazione muove dalla esplicitazione di quella conoscenza, detta “ontologica”, che un ricercatore o una comunità di ricerca solitamente impiegano per rispondere alla domanda “Che cosa è?”, ogniqualvolta si trovano in presenza di un ente del loro dominio di studio. Con i termini 'conoscenza ontologica' ci riferiamo qui, in particolare, a quell'insieme strutturato di categorie di attributi che è impiegato di volta in volta per descrivere l'oggetto di studio; tale insieme strutturato rappresenta ciò che possiamo chiamare un “modello tipologico”, le cui molteplici istanziazioni rappresentano, nel rispetto della variabilità che necessariamente caratterizza il dominio della realtà materiale, gli oggetti di studio.

Detto questo, l'idea che sta alla base dell'impiego di tecniche di KR&R per la progettazione di un sistema a supporto della classificazione si fonda sulla possibilità di disporre di linguaggi logici e motori inferenziali che ammettano la rappresentazione formale delle euristiche di classificazione impiegate dagli esperti di dominio. Un sistema di questo tipo assume la forma del “programma logico”, ovvero, di un insieme di regole del tipo “se....allora”, la cui articolazione ricalca il più fedelmente possibile quella delle dimensioni epistemiche utili all'obiettivo di classificazione che ci si è 9 http://www.dif.unige.it/epi/hp/frixione/appunti_KR.pdf

10Ricordiamo brevemente che nonostante la caratteristiche elencate sembrino fare della logica lo strumento più naturale per la rappresentazione della conoscenza in ambito computazionale, questo non ha impedito, tuttavia, che si levassero voci contrastanti e forti critiche rispetto alla sua utilità: contrapposizioni queste che hanno dato luogo a un intenso dibattito interno alla disciplina nel corso degli anni '70 e '80 e che oggi possiamo considerare per lo più risolto in favore della compagine logicista e contro quella anti-logicista.

(11)

proposti, e di fatti, che rappresentano gli oggetti della classificazione sotto forma di insiemi strutturati di parametri descrittivi di natura qualitativa (ad esempio, presenza o assenza di determinati elementi strutturali) e quantitativa (ad esempio, altezza e profondità dell'oggetto).

C

ENNI ALLA RAPPRESENTAZIONE DELLA CONOSCENZA BASATA SU

A

NSWER

S

ET

P

ROGRAMMING

,

BASI DELLA CONOSCENZA E LORO STRATIFICAZIONE

Il linguaggio di rappresentazione della conoscenza che abbiamo usato nel contesto del progetto sopra descritto è detto ‘AnsProlog’ (or ‘A-Prolog’, un acronimo che in inglese sta per ‘Programming in logic with Answer Sets’) (BARAL 2003). AnsProlog appartiene insieme ad altri linguaggi di programmazione logica al regno cosiddetto della programmazione dichiarativa, basata sulla semantica dei modelli stabili (nota anche con il nome di answer set semantics) (GELFOND, LIFSCHITZ 1988). Non essendo questa la sede opportuna per dilungarsi nel discutere i dettagli di questo genere di programmazione e della programmazione logica in generale, rimandiamo ai testi citati nel testo per una panoramica esaustiva e critica della letteratura corrente e dei principali risultati.

Qui di seguito, ci limitiamo a citare solo alcune delle caratteristiche che rendono AnsProlog un linguaggio di programmazione logica estremamente innovativo nel contesto della KR&R e un utile strumento per il caso di studio introdotto in questo articolo.

Diversamente dal Prolog, AnsProlog possiede una semantica dichiarativa ben definita relativamente alle componenti nonmonotone11 che caratterizzano il suo linguaggio (vedi, ad esempio, la negazione per fallimento) e questo lo rende un linguaggio di rappresentazione della conoscenza indipendente dalle specifiche implementazioni dei suoi meccanismi di inferenza che di volta in volta possono essere specificate. Questo certamente fa di AnsProlog un vero e proprio linguaggio per la rappresentazione della conoscenza e, al tempo stesso, un linguaggio di programmazione, i cui statements possono essere letti, interpretati e opportunamente manipolati da un calcolatore senza ulteriori passaggi di traduzione ad altro linguaggi formali. Infine, i programmi AnsProlog sono programmi logici che ammettono l'introduzione della disgiunzione nella “testa” delle sue asserzioni e la presenza di letterali negati nel “corpo” delle stesse; sono queste peculiarità che negli ultimi anni hanno fatto di AnsProlog un strumento estremamente funzionale alla rappresentazione del cosiddetto commonsense reasoning (ad esempio, è fra le caratteristiche proprie di AnsProlog la possibilità di modellare formalmente meccanismi di gestione di conoscenza incompleta su un determinato dominio) (BREWKA,1991).

Molto brevemente, un programma AnsProlog è una coppia {σ,Π} dove σ è una particolare segnatura (ovvero, da un insieme di simboli, un vocabolario, mediante il quale è possibile formare parole semplice, complesse e frasi dotate di significato) e Π è una collezione di regole. Senza entrare nei dettagli tecnici, diciamo che un programma AnsProlog consiste di una collezione di regole della forma seguente:

L0 or … or Lk :- Lk+1, …, Lm, not Lm+1, …, not Ln.

I simboli Li che compaiono all'interno di ciascuna regola sono detti 'letterali' e una regola nella sua interezza può essere così letta: se sono veri Lk+1, …, Lm and se non vi sono evidenze per concludere che Lm+1, …, Ln siano veri, allora uno almeno dei letterali L0 or … or Lk deve anch'esso essere vero.

Esistono oggi diversi linguaggi AnsProlog, ciascuno caratterizzato da una specifica segnatura e, di conseguenza, da un diverso livello di espressività. le regole che discutiamo in questo articolo sono scritte nel linguaggio logico DLV (function free disjunctive language (Leone et al. 2006) AnsPRolog può ormai vantare un buon numero di implementazioni la cui efficienza e affidabilità computazionale sono state verificate in contesti applicativi quali l'interrogazione di basi di dati (query/answering), la costruzione di sistemi esperti, la pianificazione automatica. Si

11 In breve, per ragionamento nonmonotono si intende una specifica modalità di produrre inferenze in ambito logico; in particolare, a differenza del ragionamento cosiddetto ‘monotono’, che caratterizza l’intera logica classica, quello nonmonotono si distingue per il fatto di ammettere che alcune delle conseguenze logiche inferite al tempo t1 possano di fatto essere ritrattate ad un tempo t2 posteriore a t1. Per questo si dice che l’insieme delle conseguenze logiche, ovvero l’insieme di tutte le sentenze inferibili a partire da un insieme base, segue l’andamento di una funzione analitica nonmonotona (il cui andamento non è sempre crescente). Questo genere di ragionamento logico, le cui origini sono da ricercarsi nel contesto degli studi di logica filosofica, ha guadagnato credito nel contesto dell’Intelligenza Artificiale e, in particolare, della rappresentazione della conoscenza, dal momento che molti dei ragionamenti di senso comune hanno la caratteristica di essere nonmonotoni: noi tutti infatti siamo disposti a ritrattare inferenze fatte precedentemente ogniqualvolta nuove credenze o, in generale, nuovi fatti ci sembrano contraddire quanto avevamo inferito. Si osservi che ragionando logicamente nel contesto delle discipline matematiche, quali l’aritmetica o la teoria degli insiemi, laddove il tipo di inferenza adottato è quello monotono, non si da mai il

(12)

faccia riferimento a (BARAL 2003) per una introduzione esaustiva del linguaggio AnsProlog, della sua semantica formale, dei fondamenti teoretici e delle principali implementazioni oggi esistenti.

Come dicevamo sopra, abbiamo scelto di considerare la classificazione di artefatti ceramici un'attività di problem solving dipendente da ben precise euristiche di dominio; detto in altri termini, la classificazione non può essere automatizzata a meno di progettare e implementare sistemi computazionali che operino sulla base di conoscenza esperta relativa al dominio di studio d'interesse. La prospettiva epistemologica che abbiamo brevemente introdotto sopra, ci ha permesso di definire un modello delle categorie usate nella descrizione, comprensione e analisi di un artefatto nel contesto del caso di studio. Sulla base di tale modello, il sistema di classificazione è in grado di stabilire, ad esempio, che cosa si debba considerare oggetto di classificazione, cosa distingue un intero da un frammento, sulla base di quella che è la comprensione degli esperti di questi concetti e ancor prima di chiedersi a quale specifico raggruppamento tipologico tali oggetti appartengano o meno.

La dove tale modello epistemologicamente fondato, nella sua generalità, ha una validità che travalica il dominio specifico degli artefatti ceramici dell'età preistorica. In particolare, esso riguarda la nostra comprensione di oggetti artificiali, la cui struttura mereologica è finita e rispetta un'organizzazione discreta delle relazioni fra le parti e fra le parti e il tutto, le cui caratteristiche funzionali (d'uso e simbolico-ideologiche) sono alla base della sua progettazione, della sua produzione e delle significati specifici ch'esso assume nel corso del suo perdurare nella storia

Una volta definito il modello, il secondo passo nella costruzione del sistema di classificazione si è basato sulla esplicitazione e definizione formale, nel linguaggio AnsProlog, di un insieme di regole relativo alla caratterizzazione delle categorie tipologiche di dominio: classi e tipi di artefatto (questo lavoro ha dato luogo a quelle che abbiamo denominato class-classification e type-classification rules).

La restante parte di questa sezione è dedicata all'introduzione del modello e delle caratteristiche più rilevanti delle regole di classificazione implementate. Nella sintassi di DLV, il modello di artefatto da noi definito assume la forma seguente: artifact(X) :- isStructured(X), hasDimensionality(X), hasMorphology(X), hasMatter-EnergyActualization(X), hasSpatialLocation(X), not -hasFunctionality(X), not -hasTemporalLocation(X).

La regola afferma che le dimensioni lungo le quali un generico ente X può essere riconosciuto come artefatto sono le seguenti: (i) strutturale - l'ente ha una composizione mereologica discreta (possiamo distinguere la presenza di parti, possiamo distinguere le une dalle altre sulla base di caratteristiche loro proprie e del loro rapporto con l'esistenza stessa del tutto cui appartengono); (ii) attualizzazione chimico-fisica - l'ente è chiaramente il prodotto di un azione di natura cognitiva, in questo caso umana, che prende ad esistere come realtà fenomenica a seguito di un processo di reificazione (o attualizzazione) fatto di materia (sostanze chimiche) e energia; (iii) dimensionale - l'ente e, laddove esplicitamente descritte, le sue parti, hanno dimensionalità in quanto res extensa; (iv) morfologica - la caratterizzazione dell'ente passa attraverso l'attribuzione di determinati forme e andamenti del suo profilo; (v) localizzazione spaziale e temporale; (vi) funzionale - l'ente è caratterizzato dal punto di vista funzionale (d'uso e simbolico-ideologico) e tale attribuzione avviene talvolta in maniera intenzionale - ad esempio, quando è l'artefice a stabilirla, sia non intenzionale - ad esempio, quando è l'impiego a livello sociale di tale ente a stabilirne un significato in origine non previsto. (FINE 1994, Fine 1999, SIMONS, DEMENT 1996).

Occorre notare che le diverse dimensioni introdotte non rappresentano e, di fatto non sono, universi di informazioni fra loro sconnesse. Tali dimensioni dicono qualcosa dell'oggetto nella sua interezza, ma è evidente che essendo tali oggetti discretamente separabili in parti e sotto parti, il discorso vale in maniera analoga per ciascuna di queste componenti. In particolare, la caratterizzazione morfologica del tutto dipende strettamente dalla dimensione e dalla morfologia delle parti e da questa è inferibile. Tali legami, ortogonali rispetto alle dimensioni introdotte, sono stati oggetto di analisi e hanno condotto alla definizione di regole dedicate che ne consentono l'utilizzazione da parte del sistema. La regola seguente, ad esempio, consente di inferire il profilo di un intero a partire dalle caratteristiche morfologiche delle sue parti dirette; in particolare, l’oggetto che ha come sue parti dirette (dirPartOf ) una parte superiore (partSup) ed una parte inferiore (partInf ) con profilo, rispettivamente, rettilineo (rectilinear) e convesso (convex), è riconsciuto dal sistema come un oggetto dal profilo articolato (articulate).

(13)

hasProfile(X,articulate) :- partSup(S), hasProfile(S,rectilinear), partInf(I), hasProfile(I,convex), dirPartOf(S,X),

dirPartOf(I,X).

Grazie all'espressività offerta dal linguaggio formale usato, al momento abbiamo scelto di non considerare come strettamente necessarie, ai fini della possibilità di effettuare la classificazione, la presenza di informazioni riguardanti la funzionalità e cronologia dell'oggetto di studio12. Tale scelta, che è di natura tecnica e metodologica insieme, e' motivata dal fatto che i frammenti o gli oggetti trattati nel corso del progetto non hanno associate informazioni di questo genere, dal momento che è proprio l'attività di classificazione uno degli strumenti analitici utili alla loro successiva deduzione. Ciò non toglie, tuttavia, che laddove tali informazioni siano presenti e, al contempo, siano impiegate nella definizione di particolari tipi di artefatti (vedi, ad esempio, casi in cui né aspetti morfologici, né strutturali permettono di distinguere fra loro oggetti differenti, mentre sono le funzionalità loro attribuite a caratterizzarne la distanza ontologica).

Come è stato brevemente accennato sopra, lo statuto ontologico degli artefatti ceramici di cui ci siamo occupati è caratterizzato dalla presenza di una struttura mereologica finita e analizzabile in un spazio discreto13. In particolare, la struttura gerarchia tripartita è caratterizzata da un livello ground che vede la presenza di elementi atomici, non ulteriormente scomponibili in sotto-componenti, da un livello intermedio, fatto di elementi che abbiamo chiamato “aggregati funzionali” (la cui composizione è data da elementi atomici o aggregati di elementi atomici) e, infine, da un livello alto, dove vivono enti che chiamiamo “interi”, la cui esistenza è stata vincolata in modo tale ch'essi non possano mai essere parti, a loro volta, di altri oggetti. La mereologia che abbiamo definito stabilisce una strutturazione gerarchica fra le parti che costituiscono l'oggetto su tre principali livelli. Una relazione di “parte diretta” (in letteratura, detta anche direct part-of (Artale et al. 1996)), di tipo riflessivo e intransitivo, lega fra loro componenti che appartengono a livelli adiacenti di questa gerarchia. Una relazione “parte di” (o part-of ) è quindi stata introdotta e definita come chiusura transitiva della precedente relazione di parte diretta. Come si accennava sopra, le componenti atomiche e gli aggregati funzionali possono essere caratterizzati dalla presenza di determinate forme e profili (convesso, concavo, ecc.), dal fatto di avere determinate dimensioni (altezza, profondità, peso, ecc.), e dalla presenza/assenza di elementi decorativi. Sulla base di queste informazioni circa gli elementi componenti, un insieme specifico di regole interne al sistema è in grado di inferire, in maniera automatica, caratteristiche del tutto di cui queste sono parti (nell’esempio introdotto sopra è evidente l’impiego in tal senso della relazione mereologica di parte diretta).

Per quanto concerne le regole di tipo class-classification, che sono il frutto della rappresentazione formale delle euristiche di classificazione dedicate al riconoscimento e all'attribuzione della classe, si consideri il seguente esempio:

Fig. 7: Esempio di artefatto ceramico identificato secondo le nostre euristiche di classificazione come parte della classe “tazza”.

class(X,cup) :- artifact(X), openShape(X),

hasProfile(X,articulated), handle(A), partOf(A,X),

hasMaxDiameter(X,D), #let(D,"35").

12 Si osservi la presenza del costrutto not, come negazione per fallimento, all'interno della regola

13 Qualcuno potrebbe obiettare che fra le parti di singolo artefatto ceramico non esiste soluzione di continuità, specie se non si considerano artefatti con applicazioni di tipo decorativo o caratterizzati dalla presenza di anse o manici. Se è pur vero che fra il corpo e l'orlo spesso non esiste soluzione continuità, resta altrettanto valido il fatto che l'esperto che analizza tale oggetto

(14)

La regola di fatto sfrutta la correlazione di informazioni di tipo morfologico e strutturale per dedurre che un generico oggetto X appartiene alla classe cup (tazza). In particolare, la regola stabilisce che una tazza è un artefatto (ovvero, un ente rispetto al quale siamo in grado di fornire un insieme di informazioni in accordo con il modello introdotto precedentemente), con un profilo articolato, dotato di ansa e il cui diametro massimo è inferiore o uguale a 35 centimetri. Ogniqualvolta il sistema incontra la descrizione di un oggetto che soddisfa tutte le precondizioni della regola (ovvero, le asserzioni presenti nella sua parte destra), il sistema automaticamente dedurrà l'appartenenza alla classe 'cup' di tale oggetto.

Fig. 8: Disegno di una tazza caratterizzata dalla presenza della distintiva ansa a corna tronche. Questa tazza è stata chiamata “tipo Tabina”.

I risultati di classificazione ottenuti mediante l'applicazione delle regole di class-classification sono a loro volta utilizzati per la deduzione dell'appartenenza alle differenti tipologie di oggetto introdotte. La regola seguente tratta del caso delle tazze di “tipo Tabina” e sfrutta la precedente deduzione circa l'appartenenza alla classe cup dell'oggetto in questione.

type(X,tabinaCup) :- class(X,cup),

carina(Y), partOf(Y,X),

hasHandleProfile(X,verticalRisingHorned).

La regola stabilisce che una tazza, caratterizzata dalla presenza di una carena e di un ansa (handle) con profilo a corna tronche (vertical rising horned handle), è riconosciuta dal sistema come appartenente al “tipo 'Tabina”. Le regole che seguono rappresentano il frammento, della base di conoscenza implementata nel sistema, dedicato al trattamento delle informazioni riguardanti gli artefatti di tipo tazza e ciotola. Tale gruppo di regole è significativo dell’uso che è possibile fare della potenza espressiva di DLV e, più in generale, della programmazione basata su Answer Set. Gli esempi seguenti sono rappresentativi di come sia possibile gestire l’attività di classificazione degli artefatti nei casi caratterizzati dalla presenza di incompletezza delle informazioni. Per incompletezza delle informazioni s’intende qui denotare tutte quelle situazioni in cui non è dato conoscere una o più delle caratteristiche dell’oggetto in questione, a fronte, ad esempio, del suo stato di conservazione e, dunque, dell’impossiblità di ricostruirne la forma originaria.

I Gruppo

class(X,bowl) :-artefact(X), openShape(X), hasProfile(X,articulate), hasMaxDiameter(X,D),<=(D,35), grip(P),partOf(P,X). class(X,bowl) :- artefact(X), openShape(X), hasProfile(X,articulate),

(15)

hasMaxDiameter(X,D),<=(D,35), pull(M),partOf(M,X). class(X,bowl) :- artefact(X), openShape(X), hasProfile(X,articulate), hasMaxDiameter(X,D),<=(D,35), shaft(M),partOf(M,X). class(X,cup) :- artefact(X), openShape(X), hasProfile(X,articulate), hasMaxDiameter(X,D),<=(D,35), handle(A),partOf(A,X). class(X,cup) :- artefact(X), openShape(X), hasProfile(X,semplice), hasMaxDiameter(X,D),<=(D,35), handle(A),partOf(A,X).

II Gruppo

class(X,bowl) v class(X,cup) :- artefact(X),

openShape(X), hasProfile(X,articulate), hasMaxDiameter(X,D),<=(D,35), handleEquipped(X), not -class(X,cup), not -class(X,bowl). class(X,bowl) v class(X,cup) :- artefact(X), openShape(X), hasProfile(X,semplice), hasMaxDiameter(X,D),<=(D,35), handleEquipped(X), not -class(X,cup), not -class(X,bowl).

Il primo gruppo di regole riguarda la classificazione degli artefatti in relazione ai raggruppamenti tazza e ciotola. La semantica di tali regole è deducibile in analogia con quanto visto negli esempi precendemente introdotti. Laddove le precondizioni di queste regole siano verificate, gli artefatti descritti come dati di input del sistema vengono classificati coerentemente con il significato delle regole. La presenza di una molteplicità di regole per la classificazione lungo un medesimo raggruppamento, ad esempio tazza, è usata per rappresentare la variabilità che le gli oggetti possono assumere all’interno di un singolo raggruppamento. Per quanto riguarda la classe ciotola, ad esempio, la presenza simultanea di tre regole distinte, consente di riconoscere come appartenenti a tale classe oggetti caratterizzati dall’avere un diametro massimo (hasMaxDiameter) inferiore o uguale a 35 centimetri, da una morfologia a forma aperta (openShape) e, alternativamente, dalla presenza di una presa (grip) o di una maniglia (pull) o di un manico (shaft).

D’altro canto, in assenza di una descrizione completa dell’oggetto di classificazione o di un numero di informazioni sufficiente a rendere vere le precondizioni delle regole di cui sopra, il sistema è in grado di attivare le regole del secondo gruppo. Ciò che caratterizza queste ultime regole è la presenza di un simbolo di disgiunzione nella loro parte sinistra: ad esempio, ‘class(X,ciotola) v class(X,tazza)’. La presenza di questo simbolo induce il sistema a generare due possibili output in presenza di oggetti le cui descrizioni sono incomplete o, comunque, non sufficientemente complete da consentire la loro classificazione con le regole del primo gruppo. Si osservi che la presenza di tali regole è tesa a rendere esplicito il caso in cui l’incompletezza di informazioni riguardo la descrizione di un oggetto o di un artefatto impedisca la sua certa classificazione in una qualunque delle classi o dei tipi introdotti: l’utente finale del sistema otterrà infatti, nei casi sopra riportati, due distinte risposte da parte del sistema, una riportante la classificazione dell’oggetto all’interno della classe tazza, l’altra

(16)

fra esse) e vengono prodotte contemporaneamente dal sistema. Infine, si osservi che nel caso in cui vengano prodotte successive analise sull’oggetto di classificazione o si venga a conoscenza di informzioni a suo riguardo precedentemente sconosciute, il sistema è in grado di “adattare” di conseguenza le proprie risposte, senza che questo comportamento richieda ulteriori modifiche al suo codice. In particolare, se le nuove informazioni sono tali da consentire una classificazione dell’oggetto secondo una delle classi introdotte nell’esempio, il sistema si preoccuperà di classificarlo correttamente e di cancellare la sua attribuzione multipla a diverse classi.

C

ONCLUSIONI E PROBLEMI APERTI

L'esperienza sopra descritta e la realizzazione di un classificatore automatico basato su programmazione logica AnsProlog permette di catturare le informazioni inserite nel database e supportare in maniera automatica la classificazione secondo le euristiche definite, a tal proposito è in corso una campagna di sperimentazione per valutare l’efficienza computazionale del classificatore descritto.

Detto ciò, questo metodo permette di velocizzare i tempi e di ridurre gli errori della classificazione manuale. Inoltre, come valore aggiunto, il classificatore costringe ad un approccio dichiarativo che espliciti le regole utilizzate nell'osservazione della variabilità interna ai raggruppamenti definiti, permettendo di superare un approccio troppe volte ridotto ad un mero dibattito terminologico.

In tal senso, il metodo proposto favorisce una gestione non riduttiva della complessità relativa all'attività di classificazione, offrendo la possibilità di gestire l'attribuzione multipla di un oggetto a più di un raggruppamento o tipologia. Questo aspetto può rivelarsi particolarmente utile nella fase di analisi comparativa del materiale classificato, dal momento che permette un’analisi non riduttiva o esclusiva, ma, al contrario, permette di introdurre anche valori soggetti all’incertezza dell’incompletezza dell’informazione.

Quanto fino ad ora presentato si riferisce ad una sola “proposta” di classificazione, costruita sulla base dell’esperienza e obiettivi di un solo gruppo di ricerca (cfr. nota 4). Al contrario, un aspetto molto importante per la riuscita del progetto in corso è proprio la possibilità di far interagire diverse basi di dati anche costruite secondo modelli ed euristiche di classificazione differenti. Per tale motivo, va tenuto presente che solo l'utilizzo di un approccio dichiarativo può permettere di integrare o far interagire basi di dati costruite secondo scuole o modelli classificatori differenti.

Lo schema riportato nella Fig. 9 rappresenta per sommi capi l’architettura di sistema che integra le funzionalità di un sistema informativo geografico, con quelle di un sistema di classificazione costruito sfruttando l’approccio descritto in questo articolo. In particolare, lo schema si compone:

• di un insieme di sorgenti di dati fra loro eterogenee e distribuite nelle intranet dei differenti gruppi di ricerca (Archaeological Data Sources),

• di un sistema informativo geografico consultabile attraverso il Web

• di un insieme di differenti sistemi di classificazione del materiale archeologico costruiti secondo l’approccio descritto nel presente articolo.

Le sorgenti di dati cui si fa riferimento consistono essenzialmente in basi di dati di tipo relazionale di pertinenza dei singoli gruppi di ricerca, e l’eterogeneità che li contraddistingue riguarda gli schemi per mezzo dei quali tali basi di dati sono state progettate e implementate. Questo spiega in parte la necessità di introdurre un altro elemento nello schema suggerito sopra, elemento che abbiamo chiamato Mediated Schema. Sarebbe fuorviante per gli scopi di questo articolo entrare nei dettagli tecnici che riguardano la progettazione di un simile livello di integrazione e per questo abbiamo scelto di rappresentare questo elemento come una sorta di scatola nera14, eccezion fatta per quel che riguarda la funzionalità che ci aspettiamo esso performi, ovvero, la definizione di una vista globale sulle differenti basi di dati introdotte.

14 Per ulteriori dettagli rispetto alla Data Integration e alle tecniche attualmente impiegate in questo settore di ricerca, rimandiamo a (LENZERINI 2002).

(17)

Fig.9: Possibile Architettura Di Un Sistema Web-Based Che Integra Le Funzionalità Di Un Sistema Informativo Geografico Con La Possibilità Di Consultare Basi Di Dati Distribuite Riguardanti Materiale Archeologico E Sistemi Di Classificazione Eterogenei

Appartenenti A Differenti Gruppi Di Ricerca.

Sappiamo, dunque, che esistono ad oggi diverse scuole di pensiero e proposte circa la classificazione del materiale ceramico e che ciascuna di esse si contraddistingue per la natura delle euristiche di classificazione utilizzate e, più in generale, per la peculiarità delle pratiche analitiche adottate. Tali pratiche riguardano le modalità di documentazione del materiale archeologico, le forme che assume la sua digitalizzazione, la concezione stessa degli elementi chiave utili alla classificazione e, ovviamente, lo sfondo teoretico che definisce la tassonomia impiegata. L’idea che sta alla base della progettazione futura di un sistema informativo come quello descritto sopra è essenzialmente connessa con la possibilità di offrire:

uno strumento per accedere a dati e informazioni attualmente custoditi in basi di dati eterogenee e distribuite; • la possibilità di interrogare queste sorgenti di dati mediante un sistema informativo geografico (GIS) e, di

conseguenza, la possibilità di svolgere analisi sulla distribuzione spaziale del materiale esistente facendo interagire dati provenienti da diverse sorgenti

• utilizzare il proprio sistema automatico di classificazione, non solo sui propri dati, ma anche su dati messi a disposizione da altri gruppi di ricerca coinvolti nel progetto;

• la possibilità di avere accesso alle euristiche di classificazione e, più i generale, allo sfondo analitico e teoretico che contraddistingue i diversi gruppi di ricerca

• la possibilità di confrontare, su un corpus di dati di dimensione considerevole, i risultati della classificazione ottenuti secondo la propria metodologia con quelli ottenuti secondo la metodologia degli altri gruppi. È chiaro in tal senso che uno degli obiettivi che stanno alla base della realizzazione di un simile sistema informativo altro non è se non quello di mettere a disposizione della comunità scientifica, che lavora nello stesso contesto di studi, uno strumento che sia utile, non solo alla consultazione e diffusione dei risultati della propria attività di ricerca, ma anche a supportare la pratica stessa della ricerca scientifica offrendo la possibilità di accedere a dati, informazioni e conoscenza altrimenti non raggiungibili e favorendo il confronto scientificamente fondato delle metodologie di analisi e degli sfondi teoretici delle diverse realtà coinvolte.

(18)

Si osservi infine che la prospettiva qui suggerita permette di collocare il progetto di sviluppo del sistema informativo appena introdotto nell’orizzonte dei sistemi e, più in generale, delle infrastrutture tecnologiche, che danno corpo a quella che oggi viene definita e-Science: l’utilizzo di tecnologie computazionali avanzate, basate su tecniche di Grid Computing e di Semantic Web, a supporto dell’attività di ricerca scientifica (GOBLE et al. 2006, ROURE, HENDLER 2004)

In conclusione, appare evidente che, a differenza di altri metodi brevemente introdotti all'inizio, l'approccio KR richiede un grosso sforzo iniziale da parte degli esperti per esplicitare la propria conoscenza tacita e le euristiche di classificazione utilizzate e volute. Tuttavia, proprio a questo “investimento” va ricondotta l'efficacia e la scientificità del metodo di classificazione adottato.

B

IBLIOGRAFIA

ADAMS E.W.2007, Archaeological Typology and Practical Reality: A Dialectical Approach to Artifact Classification and Sorting, Cambridge University Press.

ALDEN J.R.,MINC L.,LYNCH T.2006, Identifying the sources of Inka period ceramics from northern Chile: results of a neutron activation study, Journal of Archaeological Science 33 (4), pp. 575-594.

AMADORI M.L.,DESOGUS P.,FABBRI B.,LEVI S.T.,PACCIARELLI M.1996, La tecnologia di produzione delle ceramiche da Monte Castellacio e S. Giuliano indagata attraverso analisi archeometriche, in La collezione Scarabelli. 2. Preistoria, a cura di M. Pacciarelli, Grafis, Casalecchio di Reno, pp. 355-415.

BARAL C.2003,Knowledge Representation, Reasoning and Declarative Problem Solving, Cambridge University Press. BARCELÒ J.A.1995, Back-propagation algorithms to compute similarity relationships among archaeological artifacts. In J. Wilcock & K. Lockyear (Eds.), Computer applications in archaeology, pp. 165-176. Oxford: ArcheoPress.

BARCELÒ,J.A.1996, Heuristic classification and fuzzy sets. New tools for archaeological typologies. Analecta Praehistorica Leidensia, 28, pp. 155-164.

BARCELÒ J.A.2009, Computational Intelligence in Archaeology, IGI Global.

BELARDELLI C.,BETTELLI M.,COCCHI GENICK D.,DE ANGELIS A.,GATTI D.,INCERTI L.,LO ZUPONE M.,TALAMO P.,TUNZI SISTO A.M. 1999, Il Bronzo Medio e Recente nell'Italia centro-meridionale, in Criteri di nomenclatura e di terminologia inerente alla definizione delle forme vascolari del Neolitico/Eneolitico e del Bronzo/Ferro, Atti del Congresso (Lido di Camaiore, 26-29 marzo 1998), a cura di D. Cocchi Genick, vol. II, Octavo, Firenze, pp. 373-394.

BERNABÒ BREA M.,CARDARELLI A.,MUTTI A.,BRESCIANI R.,BRONZONI L.,CATARSI M.,DESANTIS P.,LABATE D.,MACELLARI R.,MORICO G.,SERGES A.,TIRABASSI J.,ZANASI C.1991-1992, Ambiti culturali e fasi cronologiche delle terramare emiliane in base alla revisione dei vecchi complessi e ai nuovi dati di scavo, in L’età del Bronzo in Italia nei secoli dal XVI al XIV a.C., atti del congresso (Viareggio, 26-30 ottobre 1989), Rassegna di Archeologia, vol. 10, pp. 341-373.

BERNABÒ BREA M.,MUTTI A.,WOLF C.,BIANCHI P.,BRESCIANI R.,CENCI L.,FORNACIARI M.,FORNARI C.,HOMAN C.,LINCETTO S., MEDICI T.TRAMONTANO N.,ZANINI C.2004, La ceramica, in Il villaggio piccolo della terramara di Santa Rosa di Poviglio. Scavi 1987-1992, a cura di M. Bernabò Brea, M. Cremaschi, Istituto Italiano di Preistoria e Protostoria, Firenze, pp. 185-549.

BIETTI SESTIERI A.2000, Classificazione e tipologia, Dizionario di Archeologia. A cura di Francovich R., Manacorda D., pp. 61–65.

BRACHMAN R.,LEVESQUE H.2004, Knowledge Representation and Reasoning, Elsevier.

CARDARELLI A.,DAMIANI I.,DI GENNARO F.,IAIA C.,PACCIARELLI M.1999, Forme del vasellame ceramco in Italia peninsulare dal Bronzo Medio al principio dell'età del ferro: criteri e proposte di nomenclatura, in Criteri di nomenclatura e di terminologia inerente alla definizione delle forme vascolari del Neolitico/Eneolitico e del Bronzo/Ferro, Atti del Congresso (Lido di Camaiore, 26-29 marzo 1998), a cura di D. Cocchi Genick, vol. II, Octavo, Firenze, pp. 281-307.

CAU M.A., DAY P.M., BAXTER M.J., PAPAGEORGIOU I., ILIOPOULOS I., MONTANA G. 2004, Exploring automatic grouping procedures in ceramic petrology, Journal of Archaeological Science 31 (4), pp. 1325-1338.

COCCHI GENICK D.1996,L'ITalia centrale, in L'antica età delBronzo in Italia, atti del Congresso Nazionale (Viareggio, 9-12 gennaio 1995), a cura di D. Cocchi Genick, Octavo, Firenze, pp. 79-111.

COCCHI GENICK D.1999,L'antica età del bronzo nell'Italia centrale, in Criteri di nomenclatura e di terminologia inerente alla definizione delle forme vascolari del Neolitico/Eneolitico e del Bronzo/Ferro, Atti del Congresso (Lido di Camaiore, 26-29 marzo 1998), a cura di D. Cocchi Genick, vol. II, Octavo, Firenze, pp. 351-369.

COCCHI GENICK D.2001, Classificazione tipologica e processi storici. Le ceramiche della facies di Grotta Nuova, Mauro Baroni editore, Viareggio.

COCCHI GENICK D.2002, Grotta Nuova: la prima unità culturale attorno all'Etruria protostorica, Mauro Baroni editore, Viareggio.

COCCHI GENICK D. 2006, Considerazioni sull’identificazione dei modelli nella produzione artigianale, RSP, LVI, pp. 551– 594.

DE ROURE D.,HENDLER J.A., 2004, E-Science: The Grid and the Semantic Web, IEEE Intelligent Systems, vol. 19, no. 1, pp. 65-71.

Figura

Fig. 1: Schema della struttura del sistema.
Fig. 5: Stampa a video di un esempio di risultati della ricerca visualizzati nel GIS mediante l'esportazione della selezione
Fig. 6: Stampa a video di un esempio di visualizzazione nel WebGIS. Anche in questo caso le dimensioni dei cerchi indicano il  numero di reperti presenti per ogni sito
Fig. 7: Esempio di artefatto ceramico identificato secondo le nostre euristiche   di classificazione come parte della classe “tazza”
+2

Riferimenti

Documenti correlati

The base class is abstract (only contains the interface) For each method there is only one final implementation in the derived classes. It is possible to always understand

The base class is abstract (only contains the interface) For each method there is only one final implementation in the derived classes. It is possible to always understand

Specifiche ente schedatore: Museo Internazionale Design Ceramico Nome: Peregalli, Giancarlo. Funzionario responsabile: Fontana, Liviana TRASCRIZIONE

Notizia del ricorso in giudizio proposto dai titolari di interessi giuridicamente rilevanti ed omogenei nei confronti delle amministrazioni e dei concessionari di

Il rilascio del certificato definitivo della qualifica di Imprenditore Agricolo Professionale e l’iscrizione a titolo definitivo all’elenco regionale degli Imprenditori

[r]

We show the existence and asymptotic behav- ior of a saddle solution on the entire plane, which has odd symme- try with respect to both axes, and even symmetry with respect to the

La struttura partecipa di una complessità ambientale storicamente significativa di cui restano tracce evidenti (fig.1). Al suo esterno, nelle immediate vicinanze ed in