• Non ci sono risultati.

8.1 TRATTAMENTO DIGITALE DELLE IMMAGINI: METODOLOGIA APPLICATA E SOFTWARE IMPIEGAT

8.1.9 La classificazione supervisionata pixel-based

Per prima cosa, chiariamo come l’obiettivo della sperimentazione condotta all’interno del presente lavoro sia la creazione di protocolli metodologici che permettano l’estrazione semi-automatica di

features archeologiche.

La classificazione guidata o supervisionata è la tecnica più impiegata per condurre un’analisi quantitativa con immagini multispettrali. Schematicamente, si suddivide nei seguenti momenti:

1. definizione della legenda: fase in cui va specificato l’insieme delle classi di copertura presenti nella superficie da analizzare; tale scelta è strettamente connessa con la tipologia di studio che si vuole portare avanti. Per esempio, uno studio di tipo agrario incentrato sullo sfruttamento di un’area coltivata sceglierà di evidenziare e discriminare gli appezzamenti di terreno in base al tipo di coltura;

2. scelta dei training site: individuazione dei pixel che serviranno da modello per le fasi successive; poiché dei pixel viene calcolata l’impronta spettrale nello spazio delle caratteristiche, il c.d. pattern, è necessario che essi siano rappresentativi della classe. Andrebbero scelti, pertanto, pixel omogenei, tentando di evitare deleterie sovrapposizioni e zone di confine;

3. scelta delle caratteristiche: selezione o delle bande o degli indici spettrali su cui impostare gli algoritmi. Durante l’intera attività di classificazione, lo spazio delle caratteristiche è composto da tutte le bande spettrali in cui è stata acquisita l’immagine originariamente587.

4. funzioni di decisione: associazione di ogni classe a regole di decisione per la suddivisione dello spazio;

5. applicazione dell’algoritmo: tutti i pixel sono classificati secondo le regole di decisione e il prodotto finale è una mappa tematica. Nella pratica del calcolatore, l’algoritmo di decisione

587L’avvento delle immagini multispettrali ha migliorato la qualità dei processi di classificazione, ma non

necessariamente l’accuratezza finale delle carte tematiche. È diventato d’attualità il fenomeno di Hughes, ovvero la tendenza a crescere dell’accuratezza all’aumentare delle bande spettrali, fino a raggiungere un picco di massimo e iniziare, successivamente a decrescere.

agisce come una misura di distanze, all’interno dello spazio delle caratteristiche, dove si sono formati i cluster di pixel per le diverse classi tematiche. Il processo di assegnazione di un pixel ad una classe è condotto con logica booleana (classificazione di tipo Hard), o con logica probabilistica (classificazione di tipo Soft). Da due approcci diversi nascono prodotti diversi; nel caso di classificazione Hard mappa tematica in k classi, quante sono quelle in partenza, nella legenda; nel caso Soft, il prodotto che si ottiene è costituito da k mappe tematiche.

6. validazione dei risultati: confronto del risultato con una serie di pixel ground truth.

Dedichiamo maggiore attenzione ai principali algoritmi di decisione utilizzati durante i processi di classificazione supervisionata.

L’algoritmo Minima Distanza dalla Media (MDM) sfrutta esclusivamente il valore medio dei pixel di training per ognuna delle classi. Viene, infatti, calcolata la distanza del vettore di misura x di ogni pixel dal valore medio di ogni classe; al pixel sarà assegnata la classe per la quale la distanza sarà minore. Si noti che la funzione di distanza d(x) può essere una delle tante applicate per la distribuzione delle classi, tuttavia un criterio di scelta può essere quello di valutare il grado di dispersione dei cluster e, quindi, il grado di compattezza.

Da un punto di vista matematico, il metodo è semplice e computazionalmente efficiente; il principale limite è insito nell’impossibilità di riconoscere il livello di dispersione di ogni classe nello spazio delle caratteristiche; esso, di conseguenza, non è lo strumento più adatto per tutti quei casi in cui le classi presentano livelli di differenziazione minimi.

186

L’algoritmo del parallelepipedo (Box) definisce le classi attraverso l’identificazione di limiti inferiori e superiori. Esso, infatti, calcola la dispersione nello spazio delle caratteristiche tramite l’esistenza degli intervalli; quest’ultimi sono definiti sui pixel di allenamento e sono calcolati sulla base del valore massimo e minimo delle bande spettrali. L’assegnazione di un pixel a una determinata classe avviene se il suo valore sarà all’interno del range. Al contrario, se non dovesse soddisfare il requisito richiesto, il pixel sarebbe assegnato alla classe non classificato.

Il SAM (Spectral Angle Mapper) costituisce l’algoritmo di riferimento per la classificazione di immagini iperspettrali. Esso confronta direttamente il pattern dei training sites con quello dei pixel da classificare, definito, nello spazio multispettrale, dal vettore x. Per ogni classe, inoltre, il pattern di riferimento per il confronto è il risultato delle media delle firme spettrali dei training sites. La differenza rispetto agli altri metodi consiste nel modo in cui è espressa la firma spettrale, in questo caso calcolata come distanza angolare tra i due vettori. Anche qui, qualora tale misura risulti superiore alla distanza angolare, il pixel rimarrà non classificato.

Infine, la valutazione del livello di errore e di accuratezza del prodotto finale. Il concetto di accuratezza si differenzia rispetto a quello di precisione che è legato, invece, al livello di dettaglio. L’accuratezza, infatti, è la stima del margine di errore o di coincidenza esistente tra il prodotto realizzato e il modello ritenuto corretto588. L’errore si caratterizza per frequenza, natura (in

relazione alle classi), grandezza (banalità o gravità) e sorgente (l’origine dell’errore). Uno strumento fondamentale, una vera e propria scatola nera dell’errore verificatosi, è la matrice di errore, dove sono raccolti tutti i dati provenienti dal confronto tra i pixel del prodotto e quelli del modello assunto come riferimento.

Infine, alcune considerazioni sulle classificazioni supervisionate di tipo Hard.

L’evoluzione dei sensori ha portato ad alte risoluzioni spaziali, garantendo dimensioni dei pixel abbastanza limitate (nel nostro caso di 0,5 m). Era lecito pensare che, sulla scia di una migliore risoluzione spaziale, sarebbe divenuto possibile avere pixel con caratteristiche spettrali pure, più facilmente inseribili nelle diverse classe tematiche. In realtà, quanto auspicato non è accaduto; infatti, il miglioramento della risoluzione ha portato con se la comparsa di nuovi dettagli, impossibili da leggere con le immagini precedenti. Non è stato, pertanto, risolto il problema della presenza di pixel misti, ovvero quei pixel che presentano caratteristiche spettrali non pure. È stato, quindi, elaborato un approccio in grado di aggirare, anche concettualmente, il problema. La classificazione di tipo Soft si basa sul principio chiave di appartenenza parziale alle diverse classi.

L’assegnazione del pixel non avviene attraverso una logica binaria ma associando un livello di probabilità differente per l’appartenenza a una classe. Da un punto di vista logico, si tratta della medesima procedura utilizzata per incorporare i livelli di incertezza nei modelli predittivi589. Sulla

base di quanto appena detto, non deve sorprendere come l’approccio più utilizzato impieghi, anche in questo campo, la logica fuzzy.