• Non ci sono risultati.

La costruzione del data set è una fase delicata sia per l’addestramento della rete che per la validazione del modello finale.

Le mammografie utilizzate per la costruzione del data set sono state rica- vate da esami effettuati presso l’Azienda USL Toscana Nord Ovest (ATNO), nel presidio di Carrara; agli esami sono associate le rispettive segmentazioni delle microcalcificazioni, effettuate da operatori esperti del centro.

Tutte le immagini hanno una risoluzione dell’ordine dei 40 µm e dimen- sione variabile. Da queste sono state estratte delle patch di dimensione NxN da utilizzare per l’addestramento e la validazione della rete. In particola- re sono state testate le prestazioni della rete in corrispondenza di diverse dimensioni NxN dell’ingresso.

Prendendo a riferimento la segmentazione delle mammografie a disposi- zione, a ciascuna patch è stata associata come label una coppia di numeri rappresentativi della sua classe di appartenenza (fig. 4.1). Le label sono:

• [1, 0] se il pixel centrale della patch non appartiene a una microcalcifi- cazione (caso negativo, classe dei sani );

• [0, 1] se il pixel centrale della patch appartiene a una microcalcificazio- ne (caso positivo, classe dei malati ).

4.2 Costruzione del data set 61

Figura 4.1: Criterio di labelizzazione delle patch.

La rete fornirà come uscita il grado di appartenenza della patch a ciascu- na classe. Ad esempio, se l’uscita sarà [0.89, 0.11] allora vorrà dire che se- condo la rete all’89% il pixel centrale non fa parte di una microcalcificazione e all’11% si.

Avendo a che fare con lesioni molto piccole e presenti solo in poche re- gioni localizzate della mammella, bisogna fare attenzione ad estrarre dalle mammografie un insieme ben bilanciato di patch, che contempli tanti casi positivi quanti negativi. Al contempo per allenare la rete a discriminare bene dove finisce una calcificazione sarà necessario che fra i casi negativi ci siano anche una buona quantità di casi in cui la lesione non cade nel centro della patch ma è comunque lì vicino.

Sulla base di queste considerazioni la scelta delle patch è stata eseguita sfruttando la maschera di segmentazione dell’immagine secondo i seguenti criteri:

• criterio 1 : è estratta una patch dall’immagine ogni qualvolta nella re- gione corrispondente della maschera di segmentazione il pixel centrale era classificato parte di una lesione (cioè era settato a 1, fig. 4.2, caso a);

• criterio 2 : è stata scartata sempre ogni patch in cui il pixel centrale non era parte di una calcificazione ma era adiacente a un pixel che ne

faceva parte (fig. 4.2, caso b);

• criterio 3 : è stata estratta con probabilità del 30% una patch ogni qualvolta il pixel più vicino a quello centrale e classificato come parte di una calcificazione era incluso in un raggio compreso fra 3 e 6 pixel (fig. 4.2, caso c);

• criterio 4 : è stato estratto il restante 70% delle patch negative casual- mente all’interno della mammografia.

Soffermandoci sui criteri 2, 3 e 4, si consideri la figura 4.2.

Figura 4.2: Esempio di possibili posizioni occupate dalla lesione relativamente al pixel centrale (evidenziato da un puntino nero). La patch più a sinistra (a) viene sempre considerata appartenente alla classe dei malati, quella centrale (b) viene scartata sempre, quella a destra (c) viene annoverata nella classe dei sani solo il 30% delle volte mentre nel 70% dei casi viene scartata.

La segmentazione di una microcalcificazione non è affatto semplice: mol- to spesso non si può valutare con certezza dove finisce una lesione proprio a causa dell’effetto volume parziale (PVE). Per questo motivo si è preferito scartare tutte le patch nella configurazione b sperando che quando la rete si trovi a classificare un pixel del genere in fase di test lo valuti come una situazione intermedia fra i casi a e c e quindi gli associ la classe dei malati (o sani) con una probabilità attorno al 50%. Questo darebbe una buona interpretazione della probabilità come correlata all’effetto volume parziale:

4.2 Costruzione del data set 63

in un certo senso, associare il 50% di probabilità significa dire che il 50% del pixel contiene la lesione.

Le patch in configurazione simile al caso c invece sono meritevoli di essere introdotte nel training set per addestrare la rete a capire dove finiscono le lesioni (almeno in maniera approssimativa) e che vanno considerate solo le lesioni che cadono esattamente al centro della patch. La scelta di quali patch considerare in questo caso è stata effettuata pescando un numero random fra 0 e 1 e includendo la patch nel campione solo se si otteneva un valore > 0.7: questa scelta è dovuta alla necessità di mantenere bilanciato il campione di addestramento e al contempo di bilanciare quello delle patch della classe dei sani.

Per quanto riguarda l’ultimo criterio esso serve a fornire alla rete patch in cui non ci sono microcalcificazioni e patch in cui ci sono ma sono più lontane dal centro rispetto al caso del criterio 3. Questo tipo di patch dovrà addestrare la rete a capire che una calcificazione è un aumento localizzato di intensità rispetto al suo background (patch senza calcificazioni) e assieme a quelle estratte con il criterio 3 ad insegnarle che la calcificazione deve trovarsi sul pixel centrale della patch per dare in uscita la label [0, 1].

Il criterio 4 contribuisce a ben il 70% dei casi sani perché a differenza dei sani forniti dal criterio 3 qui la varietà delle patch è ben maggiore:

• in primo luogo ci saranno alcuni casi contenenti microcalcificazioni decentrate (casi simili al caso c) che apportano poche novità alla rete non introdotte già con il criterio 3. Questi casi ricoprono solalmente una piccola porzione del 70% perché le patch in questione sono pescate a caso in tutta la mammografia.

• In altri casi le calcificazioni non appariranno affatto. Questi sono casi molto diversi da quelli di tipo 2 e quindi è da questi che la rete può imparare molto, per capire cos’è una microcalcificazione e cosa non lo è.

• Ci saranno diverse patch relative a regioni di bordo della mammella. Queste sono regioni un po’ critiche perché comportano una grande va- riazione di contrasto e quindi la rete potrebbe intenderle come ricche di microcalcificazioni. Inoltre spesso i vasi che irrorano la mammella in queste regioni possono apparire come un aumento di intensità con for- ma ellissoidale ed essere scambiati per il tipo di lesioni che cerchiamo. La rete dovrà imparare a classificare adeguatamente queste regioni.

• Ci saranno patch contenenti artefatti o regioni in cui sovrapposizioni di tessuti ghiandolari, di vasi e lobuli di grasso potrebbero portare alla creazione di falsi positivi. Anche queste patch sono importantissime per un addestramento efficace della rete.

A questo punto appare evidente come il bilanciamento all’interno casi sani possa risultare ben più critico del bilanciamento fra casi sani e malati. Senza dubbio avere un training set abbastanza grande ci aiuta ad essere più fiduciosi del fatto che durante il suo addestramento la rete veda ogni tipologia di patch un numero sufficiente di volte.

La costruzione del data set è stata effettuata a partire da 290 esami mammografici, di cui 238 sono stati utilizzati per la creazione del training set e del validation set, mentre 52 esami sono serviti al test finale del modello in seguito alla creazione del test set.

La dimensione ottenuta per il training set consiste di 80.000 patch, men- tre quella del validation in un totale di 10.000. Dalle 52 mammografie utiliz- zate per la costruzione del test set invece è stato estratto un totale di 8.000 patch. Tutti i set sono bilanciati in accordo a quanto detto in precedenza.

Dato il numero limitato di campioni presenti nel training set, durante l’addestramento è stato operato data augmentation, casualmente ruotando o ribaltando le patch date in pasto alla rete.

Documenti correlati