• Non ci sono risultati.

UNIVERSITÀ DEGLI STUDI DA PADOVA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA GESTIONALE DIPARTIMENTO DI TECNICA E GESTIONE DEI SISTEMI INDUSTRIALI

N/A
N/A
Protected

Academic year: 2021

Condividi "UNIVERSITÀ DEGLI STUDI DA PADOVA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA GESTIONALE DIPARTIMENTO DI TECNICA E GESTIONE DEI SISTEMI INDUSTRIALI"

Copied!
58
0
0

Testo completo

(1)

UNIVERSITÀ DEGLI STUDI DA PADOVA

FACOLTÀ DI INGEGNERIA

CORSO DI LAUREA IN INGEGNERIA GESTIONALE

DIPARTIMENTO DI TECNICA E GESTIONE DEI SISTEMI INDUSTRIALI

TESI DI LAUREA TRIENNALE

MODELLAZIONE DI DIAGRAMMI CCT:

ANALISI DELLE CAPACITÀ DI PREDIZIONE

RELATORE: Ch.ma Dott.ssa MONICA REGGIANI

Dipartimento di Tecnica e Gestione dei Sistemi Industriali

CORRELATORE: Ch.mo Ing. PAOLO FERRO

Dipartimento di Tecnica e Gestione dei Sistemi Industriali

LAUREANDO: SABRINA LANCERIN

(2)

INDICE

SOMMARIO ... 4

INTRODUZIONE ... 5

CAPITOLO 1: Problematica ... 7

1.1.L’importanza dell’acciaio... 7

1.2.Le curve CCT... 8

1.3.Cenni sui principali trattamenti termici ... 10

1.4.Effetto degli elementi in lega... 13

1.5.Le problematiche delle curve CCT... 14

CAPITOLO 2: Stato dell'arte ... 15

2.1.Modelli empirici ... 15

2.2.Modelli analitici... 17

2.3.JMatPro ... 20

2.4.Il modello delle reti neurali ... 21

CAPITOLO 3: Analisi delle capacità di predizione...26

3.1.Analisi delle capacità di predizione di valori noti alla rete...26

3.1.1.Diagrammi di analisi: curve di errore e curve di evaluating...28

3.1.1.1.Curve di errore e curve di evaluating stimate sulla totalità degli

acciai raccolti...28

3.1.1.2.Curve di errore e curve di evaluating stimate su un sottogruppo

degli acciai raccolti...37

(3)

3.2.Analisi delle capacità di predizione di valori sconosciuti alla rete...51

3.2.1.Curve di cross-evaluation………..52

CAPITOLO 4: CONCLUSIONI...56

(4)

SOMMARIO

Nel primo capitolo è stata descritta la problematica da cui prende spunto questo lavoro, cioè la necessità di prevedere, per ogni tipo di acciaio, il campo ferritico dello specifico diagramma CCT; nel secondo sono stati analizzati i vari metodi che cercano di ovviare a questa problematica, dimostrando come le reti neurali siano il metodo più promettente; nel terzo viene descritta l’analisi delle capacità di predizione della rete neurale; infine nel quarto vengono raccolte le conclusioni di questo progetto di tesi.

(5)

INTRODUZIONE

Questa tesi si colloca all’interno di un lavoro di gruppo avente lo scopo di sviluppare un progetto di rete neurale in grado di prevedere, per ogni tipo di acciaio, il campo ferritico dello specifico diagramma CCT ( Continuous Cooling Transformation ).

Il lavoro sviluppato in queste pagine, dunque, non tratterà l’intero problema, ma si focalizzerà sulla terza fase di tale progetto, ovvero sull’analisi delle capacità di predizione di un sistema a reti neurali.

Lo sviluppo dell’intero progetto è molto importante dal punto di vista ingegneristico. Una conoscenza delle curve CCT è infatti fondamentale per capire come evolve la struttura degli acciai in funzione del tempo e della temperatura in corrispondenza di trasformazioni a velocità di raffreddamento costanti.

Si capisce dunque come il corretto impiego di tali curve sia molto rilevante nei trattamenti termici. Esse vengono infatti utilizzate per poter stabilire quale temperatura, quale tempo e quale velocità di raffreddamento devono essere scelte per ottenere le caratteristiche di durezza, tenacità, microstruttura e lavorabilità desiderate.

Purtroppo però, la localizzazione e le forme di tali curve sono altamente sensibili alla composizione chimica dell’acciaio. Ne consegue che, eventuali fluttuazioni di quest’ultima, anche all’interno della stessa classe di acciaio, fanno si che il diagramma CCT estrapolato dalla letteratura non fornisca informazioni affidabili sulle trasformazioni dell’austenite, ossia passaggio di fase di riferimento per la costruzione di tale diagramma. Ciò che si vorrebbe, dunque, sarebbe un sistema computerizzato che fosse in grado di prevedere le curve CCT al variare delle composizioni chimiche degli acciai.

A tale proposito, sono stati nel seguito brevemente trattati i vari metodi, sviluppati da diversi studiosi, che hanno cercato di prevedere tali diagrammi nel modo più efficiente possibile.

Tra questi, quello che sembra essere più promettente è proprio il metodo basato sulle reti neurali. Quest’ultime rappresentano un’efficace soluzione ai problemi sopra descritti poiché esse, tramite la ricerca di un modello appropriato, consentono proprio la simulazione al computer dell’effetto della composizione chimica sulle proprietà richieste o l’ottimizzazione delle soluzioni realizzabili basandosi sui criteri assunti.

(6)

conoscere il modello fisico del fenomeno descritto.

Perché ciò sia possibile, è necessario raccogliere un elevato quantitativo di dati, necessari per la fase di apprendimento delle reti. Infatti, sono state trattate le fonti da cui sono stati attinti i dati e descritta l’elaborazione fatta di questi, al fine di ottenere uno schema appropriato da dare come input alle reti neurali successivamente utilizzate.

Nei precedenti lavori di tesi sono state descitte la fase di raccoglimento dei dati ed è stato presentato e descritto il codice di programmazione che implementa la rete neurale.

(7)

CAPITOLO 1

Problematica

1.1.L’importanza dell’acciaio

L’oggetto di analisi di tale progetto è l’acciaio che gode di un vasto impiego nel campo ingegneristico.

Si definisce acciaio una lega composta principalmente da ferro e carbonio, quest’ultimo in percentuale non superiore al 2,11% poiché, oltre tale limite, le proprietà del materiale cambiano e la lega assume la denominazione di ghisa.

Si può oggi affermare che esso rappresenti la risorsa più comunemente usata nel settore dell’ingegneria, nonostante il progresso nello sviluppo dei materiali con proprietà speciali, come ad esempio la ceramica o i polimeri.

Il vantaggio dell’acciaio rispetto agli altri materiali ingegneristici, si trova in relazione alle elevate caratteristiche meccaniche che si ottengono con un grande numero di processi produttivi, di formatura e di trattamento termico.

Data la sua importanza pratica, dunque, esso è sicuramente la lega su cui più è stato fatto la sforzo per conoscerne il comportamento nei vari tipi di lavorazione, in modo da ottimizzarne la resa nei processi con cui dai processi siderurgici si passa all’oggetto finito. Ogni qualità è stata perciò sottoposta a ricerche per garantire la lavorabilità all’utensile, la formabilità a caldo e a freddo, l’attitudine a dare getti di buona qualità, la saldabilità, la risposta al trattamento termico e così via.

Questo ha significato ottimizzare le strutture in funzione del tipo di lavorazione richiesto, a parità di composizione, oppure a parità di proprietà finali, adattare quest’ultima al tipo di lavorazione più critico nel ciclo di trasformazione.

Nota quindi la qualità dell’acciaio, è possibile attingere ad una mole spesso imponente di dati di ogni genere che lo riguardano e che servono alle industrie per impostare i processi di lavorazione.

L’importanza dell’acciaio deriva anche dal fatto che esso è la lega che copre il più vasto spettro di proprietà tra tutte quelle che hanno applicazione industriale.

(8)

fisico-chimiche della struttura mediante opportune alligazioni.

La resistenza meccanica (Rm) risente fortemente della condizione strutturale: allo stato ricotto o normalizzato Rm varia tra 200 e 1000 N/mm2, per salire oltre 2000 allo stato incrudito (negli acciai inossidabili austenitici) e oltre 3500 allo stato temprato e rinvenuto (negli acciai maranging).

Le proprietà plastiche (allungamento, strizione) variano in senso inverso rispetto alla resistenza meccanica: l’allungamento raggiunge valori intorno al 35% per gli acciai da imbutitura per ridursi a entità trascurabili negli acciai a tutta tempra e la strizione raggiunge il 50-60% negli acciai inossidabili austenitici per ridursi anch’essa con l’indurimento.

La massima resistenza a fatica viene raggiunta negli acciai per molle (sono ammissibili in certe condizioni sollecitazioni di 1000-1200 N/mm2) e negli acciai cementati e temprati per organi meccanici (oltre 850 N/mm2).

La durezza va da valori modesti per gli acciai ricotti (si parte da 70-80 HV, durezza Vickers) per salire negli acciai temprati da utensili fino a 1100 HV; la resistenza all’usura abrasiva è direttamente legata alla durezza e va di pari passo con quest’ultima.

La resistenza alla corrosione dell’acciaio comune è assai modesta e richiede in genere delle protezioni aggiuntive (tipica la verniciatura); nel caso degli acciai inossidabili è possibile realizzare strutture resistenti in modo accettabile ad un gran numero di aggressivi chimici.

1.2.Le curve CCT

Come è stato precedentemente detto, è mediante degli opportuni trattamenti termici che è possibile far assumere alla lega quelle strutture cristalline che gli conferiscono determinate caratteristiche meccaniche e tecnologiche.

Un trattamento termico rappresenta un ciclo termico di riscaldamento effettuato in predeterminate condizioni e temperature, a cui devono seguire raffreddamenti, più o meno lenti.

Per comprendere l’effetto che il trattamento termico ha sulla struttura della lega è necessario conoscere il diagramma di stato della stessa.

Ma tale conoscenza non è tuttavia sufficiente poiché i diagrammi di stato definiscono le varie strutture di equilibrio della lega, a una determinata temperatura.

(9)

variabile tempo.

Esso, infatti, non tiene conto della velocità di raffreddamento e di quella di riscaldamento, ne’ della durata di permanenza alle varie temperature.

Questi aspetti devono però essere considerati nell’applicazione di un trattamento termico. Durante il riscaldamento o raffreddamento, infatti, si hanno delle variazioni della microstruttura. Questi fenomeni implicano la diffusione e quindi l’effetto non solo della temperatura ma anche del tempo.

A tale proposito è quindi necessario integrare le conoscenze acquisite con quelle relative all’influenza della velocità di raffreddamento/riscaldamento sulle trasformazioni indicate sul diagramma di stato, e quindi considerare l’effetto della cinetica.

Ciò risulta fondamentale poiché la velocità non influisce solo sulle temperature di transizione (che in genere saranno diverse da quelle ricavate dai diagrammi di stato), ma anche sulla natura stessa della struttura ottenuta, con la possibilità di ottenere componenti metastabili, come ad esempio la martensite, assenti nel diagramma di stato.

Bain fu il primo che cercò di considerare questo aspetto [1]. I suoi studi consistevano nel considerare inizialmente un campione di un acciaio eutettoidico, riscaldarlo sopra i 723°C così da farlo passare allo stato di austenite (una soluzione solida primaria di tipo interstiziale di carbonio nel ferro gamma che presenta un reticolo cubico a facce centrate o "CFC"), raffreddarlo successivamente al di sotto dei 723°C e lasciarlo lì per un certo tempo. Il campione veniva poi raffreddato velocemente in acqua. Bain ha eseguito tale procedimento per vari sottoraffreddamenti.

Lo studio così fatto permetteva di vedere quanta austenite si era trasformata in perlite, bainite, martensite o ferrite e quindi analizzare la microstruttura ottenuta. Si ottiene così la curva descritta in Fig. 2, chiamata anche curva di Bain o curva TTT (Temperatura – Tempo - Trasformazione).

Nei trattamenti termici più diffusi e di maggior interesse applicativo però, la trasformazione dell’austenite non avviene a temperatura costante, ma nel corso di un raffreddamento continuo.

Pertanto, nel seguire o prevedere le trasformazioni di fase, è necessario fare riferimento alle curve di trasformazione anisotermica dell’austenite, cioè alle curve CCT (Continuous – Cooling – Transformation).

(10)

Curva CCT Curva TTT

1.3.Cenni sui principali trattamenti termici

Ogni traiettoria di raffreddamento presente nelle curve CCT, rappresenta un particolare trattamento termico. I principali trattamenti a cui può essere sottoposto un metallo o una lega, al fine di ottenere determinate caratteristiche, sono:

(11)

Fig. 3 Esempio velocità di raffreddamento per la ricottura in una curva CCT

· Distensione: consiste in un riscaldamento ad una temperatura notevolmente al di sotto di A1 e permanenza a tale temperatura per un tempo conveniente. Questo trattamento riduce le tensioni interne senza alterare significativamente la durezza. · Normalizzazione: consiste nel riscaldamento del materiale a una temperatura poco

(12)

Fig. 4 Esempio velocità di raffreddamento per la normalizzazione in una curva CCT

(13)

Fig. 5 Esempio velocità di raffreddamento per la tempra in una curva CCT

· Rinvenimento: esso comprende un riscaldamento ad una temperatura inferiore ad A1, un mantenimento per un certo tempo a questa temperatura ed infine un raffreddamento in un mezzo appropriato fino a temperatura ambiente. Tale trattamento viene eseguito subito dopo la tempra poiché allo stato temprato l’acciaio presenta un’elevata durezza e basse caratteristiche di tenacità. È necessario quindi ricorrere ad un successivo trattamento che ne modifichi, più o meno profondamente, la struttura martensitica di tempra annullandone le tensioni e la fragilità. La temperatura di rinvenimento va scelta in modo da ottenere il miglior compromesso tra le caratteristiche di durezza e di tenacità.

1.4.Effetto degli elementi in lega

(14)

elementi.

Tali elementi però, influenzano le curve TTT e CCT. Quest’ultimi, infatti, modificano sia la forma, sia la posizione di tali curve. In particolare:

· tutti gli elementi in lega, ad eccezione del cobalto, provocano degli spostamenti delle curve di inizio e di fine trasformazione verso tempi più lunghi, quindi verso destra, rispetto agli acciai al solo carbonio.

· inoltre, tutti gli elementi in lega tranne il cobalto spostano verso il basso la temperatura Ms e Mf; ciò può causare la presenza di austenite alla temperatura ambiente.

1.5.Le problematiche delle curve CCT

Questa rappresenta dunque la problematica da cui nasce lo scopo di questo lavoro. Se infatti da uno stesso acciaio, tramite l’immersione in bagni diversi, si ottengono acciai con diverse composizioni chimiche e i diagrammi CCT risultano essere sensibili a ciò, ne consegue che è impossibile produrre sufficienti diagrammi per l’uso generalizzato.

Ovvero, i diagrammi presenti in letteratura non riescono a fornire delle adeguate informazioni per ogni tipo di acciaio. Poiché però, la conoscenza di tali diagrammi risulta essere fondamentale per l’applicazione dell’adeguato trattamento termico, non essendo disponibili in letteratura, questi si dovrebbero ricavare sperimentalmente. Tale operazione però risulta essere molto dispendiosa in termini di tempo e di denaro. Inoltre, non riuscirebbe a soddisfare la sempre più crescente domanda di prodotti, non essendo un metodo in grado di ottimizzare la selezione di un vasto insieme di materiali.

Per risolvere tale problema, sarebbe infatti auspicabile poter avere un modello che, una volta data la specifica composizione chimica, fosse in grado di prevedere la corrispondente curva CCT.

Una soluzione di questo tipo infatti, consentirebbe così di ovviare a tutti i problemi sopra descritti, ovvero, permetterebbe di fornire dati affidabili, ad un costo contenuto e in un tempo ragionevole.

(15)

CAPITOLO 2

Stato dell’arte

Come è stato precedentemente detto, i diagrammi CCT sono molto importanti per la determinazione della struttura del materiale, dopo un trattamento termico. A tale proposito, sono stati intrapresi molti studi per cercare il metodo più efficiente per la previsione di tali diagrammi, necessari per la produzione industriale. Vengono qui sotto riportati i modelli più significativi sviluppati finora.

2.1.Modelli empirici

Un primo metodo possibile è quello di ricavare tale diagramma sperimentalmente, ovvero tracciarlo usando un test di dilatometro su un simulatore caldo ed un’analisi metallografica [2,3].

Tale metodo, operativamente, consiste nel lavorare opportunamente i campioni fino ad ottenere le specifiche desiderate: ad esempio, modellarli fino a raggiungere un diametro di 8 mm ed una lunghezza di 12 mm. I campioni così ottenuti, poi, vanno riscaldati fino ad una stabilita temperatura, con una certa velocità e mantenuti successivamente a tale temperatura per un dato tempo. Successivamente, essi vengono raffreddati fino ad una precisa temperatura, con diverse velocità. Durante i vari processi di raffreddamento, vengono registrate sul simulatore, le dilatazioni dei campioni da parte del dilatometro. Quando tutti i campioni sono stati presi in esame, per ognuno di essi vengono analizzate le microstrutture, ottenute tramite un microscopio ottico, al fine di determinare la loro composizione di fase.

Ciò che si ottiene tramite un’analisi con il dilatometro, è mostrato nella figura sottostante (Fig. 1). Ogni punto di flesso mostra la corrispondente temperatura a cui avviene una trasformazione di fase.

Da tale figura è evidente però anche qual è la problematica di tale metodo. Si vede, infatti, come nella curva di dilatazione mostrata in Fig. 1(a), sia difficile determinare tutte le temperature di trasformazione, poiché il punto di flesso “b” non risulta molto chiaro.

(16)

Fig. 1 Curve di dilatazione. (a) Campione 1, raffreddato alla velocità di 0.1 °C/s che mostra un

vertice non chiaro; (b) Campione 8, raffreddato alla velocità di 20 °C/s che mostra chiari vertici.

Viene poi qui sotto mostrata l’analisi della microstruttura dei due campioni presi in esame, che è utile per decifrare le varie composizioni di fase, ottenute con il raffreddamento.

Fig. 2 (a) Metallografia del campione 1 che mostra una microstruttura costituita da ferrite e

perlite; (b) metallografia del campione 8 che mostra una microstruttura costituita da perlite e struttura Widmanstatten.

(17)

Tabella 1 Microstruttura, tipi di trasformazioni e temperature per tutti i campioni nel test.

Questo metodo, però, poiché non è in grado di tracciare accuratamente i diagrammi CCT per certi tipi di acciai ed anche perché risulta essere un metodo molto dispendioso di tempo e costoso, non può essere preso di riferimento per un utilizzo su ampia scala. 2.2.Modelli analitici

Altri tentativi includono l’utilizzo di modelli matematici dei processi che avvengono nell’acciaio durante il raffreddamento o dipendenze empiriche sviluppate dopo molti esperimenti.

Questi tentativi, consentono di ottenere le curve CCT, ricavandole dalle curve TTT.

Per fare ciò si fa ricorso alla regola dell’additività di Scheil [4]. L’assunzione di tale legge è che una generica storia termica possa essere descritta come combinazione di un numero sufficientemente ampio di passi di reazioni isotermiche. Tale legge è espressa nella seguente formula:

1

)

(

0

=

ò

x t x

T

dt

t

Dove

τ

x

(

T

)

è il tempo impiegato per la frazione di volume trasformato per raggiungere x

(18)

Graficamente, tale regola è mostrata nella figura sottostante (Fig. 3). In quest’ultima si vede che il range di temperatura è diviso in una serie di piccoli finiti passi. Mantenere l’intervallo di tempo ∆tisufficientemente breve, garantisce che le condizioni siano isoterme su ogni intervallo di tempo. Si è supposto che in ogni passo temporale, venga prodotta una tale trasformazione che si verifica come nel diagramma isotermo, alla stessa temperatura.

Fig. 3 Predizione della microstruttura da una curva di raffreddamento e diagramma TTT

Fa ricorso a tale regola, la legge di Johnson-Mehl-Avrami-Kolmogorov [5], che rappresenta il modello più comunemente usato per descrivere le trasformazioni cinetiche di tipo diffusivo. Tale legge definisce la frazione di volume Φ del costituente prodotto al tempo t, per una trasformazione isotermica, alla temperatura T, nel seguente modo:

n kt

e

t

)

= 1

-

-(

f

(1) Dove k ed n sono parametri empirici che dipendono dalla temperatura T, tenuta durante tutta la trasformazione.

Per quanto riguarda invece le trasformazioni “martensitiche”, ovvero prive di diffusione, si impiegano leggi simili a quella proposta da Koistinen-Marburger [6].

(19)

di crescita, ovvero solo in una condizione “isocinetica”.

Matematicamente, ciò si traduce nel fatto che il fattore n dell’equazione (1) non dipenda dalla temperatura. Se questa condizione non viene verificata, dunque, la regola dell’additività non è più valida in un senso strettamente matematico.

A tale proposito, la valida applicazione di tale legge è stata successivamente estesa da Cahn [4], integrando anche la velocità nella relazione, nella seguente forma:

)

(

)

(

^ ^

f

q

f

·

=

j

h

(2) Dove il punto indica una derivata nel tempo e θ rappresenta la temperatura. Questa relazione implica una condizione di “generale isocinetica”.

Il risultato raggiunto da Cahn permette di predire con accuratezza una vasta gamma di reazioni non isotermiche utilizzando la legge dell’additività, ampliando così le condizioni di applicazione della stessa.

Anche se l’argomentazione di Cahn è valida per quanto riguarda il rispetto del ruolo dell’additività nelle condizioni di generale isocinetica, egli ha inoltre dichiarato che la regola vale per una classe ancora più ampia di relazioni cinetiche. In particolare, Cahn affermò che la regola dell’additività può essere applicata ad ogni equazione cinetica che si presenti nella seguente forma:

)

,

(

f

q

f

=

g

· (3)

Tuttavia, nonostante la riuscita applicazione della regola di additività negli ultimi quarant’anni, è stato dimostrato che tale equazione non può essere applicata a tutte le relazioni cinetiche che si presentano in quella forma, chiamate anche relazioni indipendenti dalla velocità. Tramite degli esempi analitici, si è potuto quindi verificare la non veridicità dell’ultima conclusione a cui era arrivato Cahn, ovvero che tutte le reazioni indipendenti dalla velocità seguissero la regola dell’additività.

Molti studiosi dunque, cercarono dei modelli alternativi, proprio per cercare di ovviare alle limitazioni di tale regola.

(20)

Qualsiasi tentativo di tipo matematico però risulta applicabile solo in certe condizioni, e non è in grado di soddisfare appieno gli obiettivi desiderati.

2.3.JMatPro

Nonostante i modelli descritti nel paragrafo precedente dimostrano che è possibile calcolare i diagrammi TTT e CCT con una certa accuratezza, si è visto però che ciò è vero solo per acciai basso legati. Questi modelli dunque risultano essere di successo per quest’ultimi, ma limitativi per gli acciai alto legati. Questo software nasce dunque con lo scopo di ampliare la gamma di acciai su cui poter applicare dei metodi predittivi [9].

Quest’ultimo, acronimo di Java-based Material Properties, è un software che può fornire molte delle proprietà del materiale che vengono richieste dai processi di simulazione. Esso può essere considerato un ulteriore tipo di modello analitico, poiché utilizza il modello di Kirkaldy. Quest’ultimo è stato scelto come base per i nuovi calcoli, in quanto vi è un insieme di parametri di input richiesti, chiaramente identificabili e che possono essere facilmente calcolati. Esso presenta anche parametri empirici che possono essere sistemati facilmente e sono controllabili.

Come detto prima, dunque, il successo di tale modello è dovuto al fatto che esso è in grado di predire le trasformazioni di fase per diversi tipi di acciai, inclusi sia quelli medio che alto legati. È in grado inoltre di fornire un’accurata descrizione di tutte le principali trasformazioni di fase che si hanno, così come il calcolo delle proprietà delle diverse fasi che si formano durante i processi di trattamento termico.

Oltre poi a calcolare le curve TTT e CCT, tale modello è in grado di calcolare una vasta gamma di proprietà fisiche, termo-fisiche, tra cui la forza di snervamento e quella di deformazione.

Tale pacchetto software consente dunque la modellazione di complesse leghe commerciali e le loro proprietà caratteristiche. Esso è in grado di calcolare il diagramma di fase degli acciai, utilizzando delle equazioni matematiche. Da questo se ne deduce che questo metodo, anche se migliore dei metodi descritti precedentemente, presenta ancora delle limitazioni.

(21)

2.4.Il modello delle reti neurali

Dai paragrafi precedenti si è visto come i metodi sviluppati finora, al fine di prevedere le curve di raffreddamento, presentino molte limitazioni nell’applicazione: i metodi sperimentali sono molto costosi in termini di tempo e di denaro e non sempre sono in grado di tracciare correttamente le curve; le equazioni su cui si basano i modelli analitici sono applicabili solo in certe condizioni e quindi sono valide solo per un piccolo gruppo di acciai; l’utilizzo di JMatPro presenta molte volte dei risultati molto diversi dai reali valori degli stessi parametri ed inoltre anch’esso non si può applicare ad ogni tipo di acciaio perché si basa su leggi matematiche che presentano le stesse problematiche dei metodi analitici.

Tutti questi motivi rendono dunque tali modelli non adatti ad un utilizzo su ampia scala. Poiché però questo rappresenta proprio il nostro obiettivo, la nostra analisi non ha considerato i metodi descritti prima, ma si è focalizzata sull’utilizzo delle reti neurali.

Questo metodo si è molto sviluppato negli ultimi decenni ed ha avuto largo impiego anche in diversi campi. Nella metallurgia, sembra essere il modo più promettente per descrivere i complicati processi di trasformazione dell’acciaio durante un trattamento termico, proprio perché è in grado di rappresentare le relazioni tra le quantità di dati indagati senza conoscere il modello fisico del fenomeno descritto [10, 11, 12]. I risultati forniti dalla rete neurale molto spesso presentano una maggiore compatibilità con i dati empirici che con i risultati ottenuti grazie alle interrelazioni empiriche o ai modelli matematici dei processi analizzati. Questo metodo infatti imita la funzione del cervello umano che è in grado di imparare dagli esperimenti, di associare, predire o prendere decisioni razionali. È proprio da ciò che deriva il nome “neurale”, ovvero in grado di simulare la funzione dei neuroni presenti nel cervello.

Allo stato attuale, infatti, a differenza delle macchine, l’uomo è un ottimo esempio di “sistema” in grado di elaborare informazioni. Tali elaborazioni, come ogni processo cognitivo, hanno sede nel cervello, una complessa struttura neurobiologica, attualmente decifrata in modo piuttosto accurato per quanto riguarda gli aspetti anatomici.

Tale struttura è composta da una cellula denominata neurone, che costituisce un “mattone elementare” e caratterizza tutte le strutture cerebrali.

(22)

diversi.

Noto dunque ciò, ci si è chiesti se dal comportamento dei neuroni all’interno della struttura cerebrale, si potessero trarre degli utili suggerimenti e ispirazioni per la costruzione di macchine in grado di replicare compiti connotati da una forte componente di elaborazione, attualmente difficilmente realizzabili negli attuali calcolatori.

Ecco dunque che per i modelli artificiali è stata seguita una metafora simile a quella del cervello umano: sono stati studiati diversi tipi di neuroni e diverse architetture associandovi le modalità di elaborazione concepite per implementare un determinato compito cognitivo.

Fu così che vennero realizzati i primi neuroni artificiali e questi vennero poi sviluppati al fine di renderli in grado di soddisfare sempre più esigenze reali.

Al giorno d’oggi vengono utilizzati vari criteri per catalogare e raggruppare diversi tipi di reti. In genere, si possono distinguere in due grandi famiglie: reti back e reti feed-forward.

Nelle reti di tipo feed-back i neuroni di uno strato possono ricevere il loro input da qualsiasi neurone che faccia parte dello stesso strato oppure che appartenga ad uno degli strati seguenti o precedenti; come input, il neurone, potrebbe usare addirittura il suo stesso output.

Fig. 4 Esempio di rete neurale di tipo feed-back

(23)

Fig. 5 Esempio di rete neurale di tipo feed-forward

Neuroni dunque dello stesso strato non sono tra loro connessi. A causa di ciò, queste reti, calcolano un risultato molto rapidamente. Un risultato in una rete di questo tipo è ottenuto nel seguente modo.

Prima i neuroni di input calcolano il loro valore di output basato sul corrente input. Dopo che tutti i neuroni hanno completato simultaneamente questo compito, allora nel successivo strato (quello intermedio), ognuno dei neuroni calcola il proprio output. Ogni neurone intermedio ottiene il risultato tenendo conto dei segnali provenienti da tutti i neuroni dello strato di input. Infatti il neurone intermedio è collegato con una distinta connessione (dall’appropriato “peso”) ad ognuno dei neuroni dello strato di input.

In genere, quindi, gli output sono differenti per ognuno dei neuroni intermedi. Quando tutti i neuroni intermedi hanno implementato il loro risultato, quelli di output (o del successivo strato intermedio) calcolano il loro output basando sempre sulla somma pesata dei segnali provenienti da tutti i neuroni intermedi.

(24)

tipo di controllo. Nel caso dei modelli supervised, dopo aver abbozzato la rete, bisogna attuare il training costruendo il training set, cioè una lista di coppie: un valore di input e un valore di output detto “pattern”. Il pattern è il risultato che la rete deve produrre in corrispondenza di quel determinato input. Ognuna delle coppie è chiamata “fact” (fatto). E’ importante che tutte le informazioni che la rete deve imparare siano nel training set e cioè che i fact siano numerosi e vari tali da poter rappresentare tutto il range di situazioni possibili. Il training set è fornito alla rete: essa analizzerà sequenzialmente un fact alla volta. Per ogni fact la rete preleva l’input e produce un suo output. Quest’ultimo viene confrontato con il valore del pattern, ovvero con il desiderato output. Se c’è una differenza, i pesi delle connessioni vengono modificati per diminuire il valore dell’errore. La rete poi analizza la successiva coppia fino all’ultima e continuerà a fare ciò finché, anche solo una di queste, produce errore. In genere la rete deve analizzare numerose volte i fact prima di apprendere totalmente il training set. In alcuni casi il ciclo non termina mai e probabilmente sarà necessario rivedere l’architettura della rete. Quando invece il training è completo la rete è pronta per l’utilizzo; infatti agli input risponde con i corretti e desiderati output.

I più popolari algoritmi di apprendimento per le reti feed-forward sono: Perceptron, Adaline, Madeline, Cognitron, Neo-Cognitron, Competition, Boltzman, Harmony, Counter Propagation e Back Propagation. Tutte queste tecniche si assomigliano abbastanza tra loro e danno il nome a differenti sottomodelli di reti feed-forward. Tutti gli algoritmi di apprendimento hanno un identico obbiettivo: ottenere una configurazione interna di pesi che permette alla rete feed-forward di svolgere una determinata funzione, ovvero di completare con successo l’addestramento previsto dal training set. Perciò, allorquando durante il training si verificano degli errori, dovranno essere modificati opportunamente tutti i pesi delle connessioni della rete. La necessaria variazione di peso viene calcolata applicando delle rigorose regole matematiche basate sulla teoria di Hebb o su alcune sue varianti di tale regola, come la regola Delta e Back Propagation.

Questo lavoro si è incentrato sullo sviluppo di tale modello, per la previsione della regione ferritica di acciai con composizioni chimiche diverse.

(25)
(26)

CAPITOLO 3

Analisi delle capacità di predizione

La fase di sviluppo di un sistema a reti neurali diventa l'input per il successivo lavoro di analisi delle capacità di predizione. Quest'analisi prevede una prima fase di valutazione della capacità previsionale della rete sulla base di valori ad essa noti, e una seconda fase di valutazione della capacità previsionale della rete sulla base di valori ad essa sconosciuti.

3.1.Analisi delle capacità di predizione di valori noti alla rete

I dati precedentemente raccolti, cioè quelli relativi all'ultimo file csv creato e menzionato nel capitolo precedente, e il sistema a reti neurali sviluppato hanno portato alla fase di esecuzione del programma. Questa fase è stata effettuata più volte a seconda degli input forniti e degli output desiderati.

Tali input sono stati di volta in volta:

· i soli elementi relativi alla composizione chimica degli acciai (11 in totale), che nel programma si presentano sotto la dicitura OnlyComponents;

· gli elementi relativi alla composizione chimica degli acciai, il tempo di raffreddamento, i punti critici A1 e A3 (14 in totale), che nel programma si presentano sotto la dicitura ComponentsCoolA1A3;

· gli elementi relativi alla composizione chimica degli acciai, il tempo di raffreddamento, i punti critici A1 e A3, la temperatura di austenitizzazione e quella di riferimento (16 in totale), che nel programma si presentano sotto la dicitura Everythings.

Gli output, fin dall'inizio desiderati e scopo della presente tesi, sono: · il tempo di inizio precipitazione della ferrite (Fs);

(27)

In pratica, per ogni output desiderato sono state eseguite tre compilazioni, ciascuna relativa ad ogni input fornito, ed ognuna di esse è stata ripetuta su un certo numero learning cycles (cicli di apprendimento).

(28)

3.1.1.Diagrammi di analisi: curve di errore e curve di evaluating

Dai valori forniti dal file trajectory si costruisce un diagramma relativo all'errore in funzione del numero di cicli di apprendimento, e si ottiene quindi una curva che mostra l'andamento dell'errore previsionale.

Invece, dai valori forniti dal file previsione si costruisce un diagramma relativo all'output in funzione di ogni acciaio, e si ottengono dunque due curve: una che mostra l'andamento dell'output desiderato e l'altra che mostra l’andamento dell'output previsto (le cosiddette curve di evaluating).

Nei diagrammi presentati in seguito si è assunta la convenzione di indicare con due colori diversi le curve rappresentanti l’output desiderato e l’output previsto: le prime sono state tracciate in blu, le seconde in rosso.

3.1.1.1.Curve di errore e curve di evaluating stimate sulla totalità degli acciai raccolti.

Per svolgere una valutazione accurata dell’andamento dell’errore previsionale e dei valori di Fs o Ff previsti rispetto a quelli desiderati, includiamo inizialmente nella nostra analisi la totalità degli acciai da noi raccolti, cioè tutti e 897 gli acciai di partenza. Solo successivamente, se emergerà la necessità, provvederemo a restringere il nostro campo di analisi ad un numero inferiore di campioni. L’apprendimento della neural network viene condotto per un numero di learning cycles pari a diecimila.

(29)

1) Input per Fs: i soli elementi relativi alla composizione chimica degli acciai 0 5000 10000 15000 20000 25000 30000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento err ore

Fig.1.Curva di errore previsionale di Fs, calcolata su diecimila cicli di apprendimento.

0 200 400 600 800 1000 1200 1400 1600 1800 2000 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti

Fig.2.Andamento dei valori di Fs desiderati e previsti, calcolati su 897 acciai.

(30)

2) Input per Fs: composizione chimica, tempo di raffreddamento, punti critici A1e A3 0 5000 10000 15000 20000 25000 30000 35000 40000 45000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento err ore

Fig.3.Curva di errore previsionale di Fs, calcolata su diecimila cicli di apprendimento.

-500 0 500 1000 1500 2000 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti

Fig.4.Andamento dei valori di Fs desiderati e previsti, calcolati su 897 acciai.

(31)

3) Input per Fs: composizione chimica, tempo di raffreddamento, punti critici A1 e

A3, temperatura di austenitizzazione e temperatura di riferimento

0 5000 10000 15000 20000 25000 30000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.5.Curva di errore previsionale di Fs, calcolata su diecimila cicli di apprendimento.

-500 0 500 1000 1500 2000 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti

Fig.6.Andamento dei valori di Fs desiderati e previsti, calcolati su 897 acciai.

(32)

1) Input per Ff: i soli elementi relativi alla composizione chimica degli acciai 0 10000 20000 30000 40000 50000 60000 70000 80000 90000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.7.Curva di errore previsionale di Ff, calcolata su diecimila cicli di apprendimento.

-500 0 500 1000 1500 2000 2500 3000 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti

Fig.8.Andamento dei valori di Ff desiderati e previsti, calcolati su 897 acciai.

(33)

2) Input per Ff: composizione chimica, tempo di raffreddamento, punti critici A1 e A3 0 20000 40000 60000 80000 100000 120000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.9.Curva di errore previsionale di Ff, calcolata su diecimila cicli di apprendimento.

-500 0 500 1000 1500 2000 2500 3000 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti

Fig.10.Andamento dei valori di Ff desiderati e previsti, calcolati su 897 acciai.

(34)

3) Input per Ff: composizione chimica, tempo di raffreddamento, punti critici A1 e A3,

temperatura di austenitizzazione e temperatura di riferimento

0 10000 20000 30000 40000 50000 60000 70000 80000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.11.Curva di errore previsionale di Ff, calcolata su diecimila cicli di apprendimento.

-500 0 500 1000 1500 2000 2500 3000 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti

Fig.12.Andamento dei valori di Ff desiderati e previsti, calcolati su 897 acciai.

(35)

Da questo primo livello di analisi delle capacità di predizione degli output Fs e Ff possiamo già formulare alcune interessanti considerazioni.

In primo luogo, lo studio dei diversi diagrammi riportati ci permette di osservare come la diversa composizione dell’insieme di input forniti alla neural network influisca significativamente sulla qualità dei risultati ottenuti. Il solo dato di input degli elementi relativi alla composizione chimica degli acciai sembra infatti non essere sufficiente per una stima abbastanza accurata dell’output richiesto; la rete neurale infatti si trova a dover faticare molto per trovare una corrispondenza in termini di omogeneità all’interno della totalità di acciai esaminati ed evidentemente l’alto valore di errore generato è dovuto proprio al fatto che potrebbero essere necessari maggiori dati di input.

Arricchendo infatti l’insieme degli input anche con il tempo di raffreddamento, i punti critici A1 e A3, la temperatura di austenitizzazione e quella di riferimento si nota già un significativo miglioramento della capacità di predizione della rete: i valori di Fs e di Ff previsti rincorrono con maggiore precisione i rispettivi valori desiderati e, conseguentemente, anche la curva di errore si abbassa avvicinandosi a valori di errore sempre più bassi.

Per un livello di dettaglio maggiore è utile infatti porre a confronto i diversi valori raggiunti dalla curva di errore al termine dei diecimila cicli di apprendimento: si osserva come essi passino, arricchendo passo passo l’insieme degli input, da 10312 a 5592 ed infine a 5169 per quanto riguarda Fs, e da 40505 a 10212 ed infine a 7932 per quanto riguarda Ff. Lo stesso andamento viene riscontrato osservando il diagramma che riporta i valori di Fs ed Ff previsti dalla rete neurale: le previsioni tendono ad inseguire i dati desiderati con sempre maggior precisione via via che aumentano gli input forniti.

Merita di essere fatta una considerazione a proposito del diagramma che presenta gli andamenti dei valori di Fs ed Ff desiderati e previsti nel caso l’input sia la sola composizione chimica degli acciai. La curva di previsione presenta un particolare andamento a gradino in quanto, ricevendo la rete come dato di input i soli elementi della composizione chimica ed avendo incluso nella raccolta iniziale più acciai con la stessa composizione ma in quanto differenti per le altre caratteristiche, la neural network intuisce diversi valori di Fs o Ff pur rimanendo invariata la composizione chimica per un certo numero di acciai.

(36)

Nonostante infatti la terza modalità di evaluating (cioè quella che sfrutta come dati di input la composizione chimica, il tempo di raffreddamento, i punti critici A1 e A3, la temperatura di austenitizzazione e quella di riferimento) possa essere considerata la più precisa delle tre, comunque presenta una piccola quantità di acciai con valori di Fs ed Ff assai superiori alla media; è proprio in corrispondenza di questi acciai che la rete neurale non riesce a prevedere con sufficiente accuratezza i dati di output.

(37)

3.1.1.2.Curve di errore e curve di evaluating stimate su un sottogruppo degli acciai raccolti.

In questo paragrafo si cercano di stimare gli stessi output (Fs e Ff) che erano obiettivo anche del paragrafo precedente, operando però una selezione più accurata del numero di acciai da fornire alla rete neurale.

Escludendo infatti dall’analisi quegli acciai che presentano dei picchi anomali relativi ai valori di Fs ed Ff, si dovrebbe giungere ad un risultato più soddisfacente di quello ottenuto con lo studio appena condotto, in quanto un campione di acciai meno numeroso e più omogeneo al suo interno dovrebbe facilitare la rete neurale nella fase di evaluating.

A tale scopo si è proceduto con una selezione accurata del gruppo di partenza costituito da 897 diversi acciai e, concentrandosi sui tempi di inizio e fine precipitazione della ferrite di ognuno, si sono distinti quelli più significativi da quelli invece anomali e quindi meno utili alla fase di predizione. Si è osservato come alcuni acciai presentano valori di Fs ed Ff assai elevati, e quindi potrebbero influenzare negativamente la neural network, in quanto non le forniscono alcun sussidio all’attività di previsione sui restanti acciai che invece presentano valori di Fs ed Ff molto inferiori, con il rischio di deviarla dalla corretta stima su di essi.

Un’attenta analisi dei diversi valori di Fs ef Ff ha permesso la creazione di un sottogruppo più omogeneo rispetto a quello di partenza: si sono esclusi dall’analisi quegli acciai con picchi troppo elevati in corrispondenza dei relativi valori di Fs ed Ff. Sono stati escusi tutti quegli acciai con valori di Fs o Ff superiori a 400, restringendo così il campione iniziale ad un sottogruppo più omogeneo costituito da 868 acciai.

Si è quindi operata una seconda analisi completa, ristretta a 868 acciai, dove per ogni output desiderato sono state eseguite altre tre compilazioni, una relativa ad ogni input fornito, ed ognuna di esse è stata ripetuta come prima su diecimila learning cycles.

(38)

1) Input per Fs: i soli elementi relativi alla composizione chimica degli acciai 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.13.Curva di errore previsionale di Fs, calcolata su diecimila cicli.

0 50 100 150 200 250 300 350 400 450 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti

Fig.14.Andamento dei valori di Fs desiderati e previsti, calcolati su 868 acciai.

(39)

2) Input per Fs: composizione chimica, tempo di raffreddamento, punti critici A1eA3 0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.15.Curva di errore previsionale di Fs, calcolata su diecimila cicli.

-100 -50 0 50 100 150 200 250 300 350 400 450 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti

Fig.16.Andamento dei valori di Fs desiderati e previsti, calcolati su 868 acciai.

(40)

3) Input per Fs: composizione chimica, tempo di raffreddamento, punti critici A1 e

A3, temperatura di austenitizzazione e temperatura di riferimento

0 1000 2000 3000 4000 5000 6000 7000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.17.Curva di errore previsionale di Fs, calcolata su diecimila cicli.

-100 -50 0 50 100 150 200 250 300 350 400 450 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti

Fig.18.Andamento dei valori di Fs desiderati e previsti, calcolati su 868 acciai.

(41)

1) Input per Ff: i soli elementi relativi alla composizione chimica degli acciai 0 5000 10000 15000 20000 25000 30000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.19.Curva di errore previsionale di Ff, calcolata su diecimila cicli.

0 100 200 300 400 500 600 700 800 900 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti

Fig.20.Andamento dei valori di Ff desiderati e previsti, calcolati su 868 acciai.

(42)

2) Input per Ff: composizione chimica, tempo di raffreddamento, punti critici A1 e A3 0 5000 10000 15000 20000 25000 30000 35000 40000 45000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.21.Curva di errore previsionale di Ff, calcolata su diecimila cicli.

-100 0 100 200 300 400 500 600 700 800 900 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti

Fig.22.Andamento dei valori di Ff desiderati e previsti, calcolati su 868 acciai.

(43)

3) Input per Ff: composizione chimica, tempo di raffreddamento, punti critici A1 e A3,

temperatura di austenitizzazione e temperatura di riferimento

0 2000 4000 6000 8000 10000 12000 14000 16000 18000 20000 1 501 1001 1501 2001 2501 3001 3501 4001 4501 5001 5501 6001 6501 7001 7501 8001 8501 9001 9501 cicli di apprendimento erro re

Fig.23.Curva di errore previsionale di Ff, calcolata su diecimila cicli.

-100 0 100 200 300 400 500 600 700 800 900 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti

Fig.24.Andamento dei valori di Ff desiderati e previsti, calcolati su 868 acciai.

(44)

Da questo secondo livello di analisi delle capacità di predizione degli output Fs e Ff possiamo formulare altrettante interessanti considerazioni.

Innanzitutto è fondamentale notare, ai fini di un confronto coerente, come la scala utilizzata per rappresentare l’andamento dei valori di Fs (o di Ff) desiderati e previsti calcolati su 897 acciai sia diversa dalla scala utilizzata per rappresentare l’andamento dei valori di Fs (o di Ff) desiderati e previsti calcolati su 868 acciai; si è fatto uso di una diversa scala semplicemente per focalizzare l’attenzione sul miglioramento della capacità previsionale della rete nel caso si sia ristretto l’insieme degli acciai di partenza ad un sottogruppo più omogeneo, privo di quei picchi di valori che provocavano un errore previsionale significativamente superiore. Un utilizzo diverso di scala presuppone quindi una maggior cautela nella formulazione delle rispettive conclusioni.

Lo studio dei diversi diagrammi riportati ci permette di osservare, anche in questo caso, come la diversa composizione dell’insieme di input forniti alla neural network influisca significativamente sulla qualità dei risultati ottenuti. Il solo dato di input degli elementi relativi alla composizione chimica degli acciai sembra infatti non essere sufficiente per una stima abbastanza accurata dell’output richiesto; arricchendo infatti l’insieme degli input anche con il tempo di raffreddamento ed i punti critici A1 e A3, la temperatura di austenitizzazione e quella di riferimento, si nota già un significativo miglioramento della capacità di predizione della rete. Tale miglioramento è riscontrato sia nell’andamento della curva di errore sia nell’andamento dei valori di Fs ed Ff previsti rispetto a quelli desiderati, dal momento che la curva dei primi rincorre con maggiore precisione la curva dei secondi. Nonostante persistano alcuni acciai con valori di Fs o Ff desiderati superiori alla media generale che la rete neurale non riesce a prevedere con sufficiente accuratezza, si nota come l’errore previsionale associato ai diagrammi costruiti con la totalità degli acciai a disposizione si sia notevolmente ridotto con la restrizione del numero di acciai soggetti all’analisi.

(45)

3.1.2.Curve di evaluating stimate incrociando i risultati finora ottenuti.

I precedenti passi di valutazione delle capacità di previsione della rete neurale hanno condotto a risultati piuttosto soddisfacenti ma necessitano di un ultimo intervento prima di poter essere definitivamente confrontati tra loro per trarne delle conclusioni complete e il più possibile affidabili.

Dall’analisi dei dati di training forniti alla rete neurale e dei dati richiesti come previsione nasce infatti la necessità di operare un’analisi incrociata di due gruppi di dati: quelli utilizzati dalla rete come training e quelli che invece sono richiesti come previsioni. Senza tale intervento risulta infatti impossibile confrontare tra loro i risultati ottenuti dall’analisi su 897 acciai e quelli ottenuti dall’analisi sul sottogruppo di 868 acciai, poiché anche le stime previsionali che sono state richieste alla rete sono state differenti: nel primo caso la neural network si è allenata su 897 acciai e ha dovuto fornire in output previsioni su 897 acciai, nel secondo caso la neural network si è allenata su un sottogruppo di 868 acciai e ha dovuto fornire in output previsioni su 868 acciai. Risulta chiaro che i valori di Fs e di Ff previsti non sono in realtà confrontabili in quanto gli insiemi di dati a confronto sarebbero diseguali; sorge quindi la necessità di uniformare l’insieme dei dati previsti dalle rete per avere delle previsioni su uno stesso numero di dati.

A tal proposito si è deciso di intervenire al fine di rendere omogeneo l’insieme delle previsioni proponendo alla rete neurale che si è finora allenata su 897 acciai di fornire come output 868 valori previsti (e non più 897).

Si è perciò ricompilato il programma fornendo alla rete come dati di training l’insieme iniziale di 897 dati e richiedendole invece l’evaluating sul sottogruppo di 868 dati.

Incrociando tali valori sono stati generati più file di previsione, uno per ogni combinazione dei valori di input con i valori di output, ora confrontabili con i rispettivi file di previsione generati utilizzando il sottogruppo di acciai in quanto entrambi i file presentano le previsioni Fs ed Ff fatte su uno stesso numero di acciai.

Verranno perciò costruiti più grafici, uno per ogni combinazione dei diversi input con i due output Fs ed Ff, raffiguranti tre diversi andamenti: la curva dei valori desiderati, la curva dei valori previsti con l’analisi incrociata e la curva dei valori previsti con l’analisi sul sottogruppo formato da 868 acciai.

(46)

Infine, per poter operare il confronto finale tra queste due serie di errori previsionali si ricorre all’errore quadratico medio (Mean Squared Error), indicante la discrepanza quadratica media tra i valori dei dati desiderati ed i valori dei dati previsti. La sua radice quadrata fornirebbe un ulteriore indice statistico, la cosiddetta radice dell’errore quadratico medio (Root Mean Square Error), che corrisponde alla varianza interna data dal rapporto fra la devianza interna e la numerosità totale.

Ai fini della nostra tesi è stato considerato il Mean Squared Error, calcolato come segue:

dove (yi– xi) rappresenta i due errori previsionali (l’errore tra i valori previsti dall’analisi incrociata e i valori desiderati, e l’errore tra i valori previsti dall’analisi sul sottogruppo e i valori desiderati), mentre N rappresenta la totalità degli acciai considerati in questa fase e cioè 868. La formulazione di qualsiasi considerazione relativa alle curve di evaluating di seguito rappresentate deve essere perciò supportata dal calcolo e dal successivo confronto dei corrispondenti errori quadratici medi.

(47)

1) Input per Fs: i soli elementi relativi alla composizione chimica -100 0 100 200 300 400 500 600 700 800 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti incrocio Valori di Fs previsti 868

Fig.25.Andamento dei valori di Fs desiderati, dei valori di Fs previsti con l’analisi incrociata e dei

valori di Fs previsti con l’analisi sul sottogruppo, tutti calcolati su 868 acciai.

MSE (analisi incrociata) = 5101,584 MSE (analisi sul sottogruppo) = 3133,893

2) Input per Fs: composizione chimica, tempo di raffreddamento, punti critici A1 e A3

-100 0 100 200 300 400 500 600 700 800 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti incrocio Valori di Fs previsti 868

Fig.26.Andamento dei valori di Fs desiderati, dei valori di Fs previsti con l’analisi incrociata e dei

valori di Fs previsti con l’analisi sul sottogruppo, tutti calcolati su 868 acciai.

(48)

3) Input per Fs: composizione chimica, tempo di raffreddamento, punti critici A1 e

A3, temperatura di austenitizzazione e temperatura di riferimento

-100 0 100 200 300 400 500 600 700 800 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs desiderati Valori di Fs previsti incrocio Valori di Fs previsti 868

Fig.27.Andamento dei valori di Fs desiderati, dei valori di Fs previsti con l’analisi incrociata e dei

valori di Fs previsti con l’analisi sul sottogruppo, tutti calcolati su 868 acciai.

MSE (analisi incrociata) = 2592,446 MSE (analisi sul sottogruppo) = 1761,481

1) Input per Ff: i soli elementi relativi alla composizione chimica

-200 0 200 400 600 800 1000 1200 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti incrocio Valori di Ff previsti 868

Fig.28.Andamento dei valori di Fs desiderati, dei valori di Fs previsti con l’analisi incrociata e dei

valori di Fs previsti con l’analisi sul sottogruppo, tutti calcolati su 868 acciai.

(49)

2) Input per Ff: composizione chimica, tempo di raffreddamento, punti critici A1 e A3 -200 0 200 400 600 800 1000 1200 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti incrocio Valori di Ff previsti 868

Fig.29.Andamento dei valori di Fs desiderati, dei valori di Fs previsti con l’analisi incrociata e dei

valori di Fs previsti con l’analisi sul sottogruppo, tutti calcolati su 868 acciai.

MSE (analisi incrociata) = 5034,5489 MSE ( analisi sul sottogruppo) = 2776,3317

3) Input per Ff: composizione chimica, tempo di raffreddamento, punti critici A1 e A3,

temperatura di austenitizzazione e temperatura di riferimento

-200 0 200 400 600 800 1000 1200 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff desiderati Valori di Ff previsti incrocio Valori di Ff previsti 868

Fig.30.Andamento dei valori di Fs desiderati, dei valori di Fs previsti con l’analisi incrociata e dei

valori di Fs previsti con l’analisi sul sottogruppo, tutti calcolati su 868 acciai.

(50)

MSE (analisi incrociata) MSE (analisi sottogruppo)

Fs only components 5101,58 3133,89

Fs components, cool, A1, A3 2186,02 1583,91

Fs everythings 2592,45 1761,48

Fig.31

MSE (analisi incrociata) MSE (analisi sottogruppo)

Ff only components 17387,72 12311,84

Ff components, cool, A1, A3 5034,55 2776,33

Ff everythings 4650,82 3044,34

Fig.32

Il confronto tra i diversi valori del parametro statistico Mean Squared Error evidenzia come l’errore quadratico medio sia nettamente inferiore quando l’analisi viene effettuata sul sottogruppo rispetto a quando viene condotta l’analisi incrociata.

(51)

3.2.Analisi delle capacità di predizione di valori sconosciuti alla rete

Per analizzare le capacità della rete neurale di prevedere valori ad essa sconosciuti si ricorre al metodo della evaluation. In questo lavoro di tesi applichiamo la cross-evaluation a quelle analisi effettuate fornendo alla rete l’insieme più ampio di input disponibili (cioè la composizione chimica, il tempo di raffreddamento, i punti critici A1 e A3, la temperatura di austenitizzazione e quella di riferimento).

L’input fornito dalla tecnica di cross-evaluation per il training della rete neurale comprende tutte le caratteristiche (a meno di Fs ed Ff) di tutti gli acciai, tranne quelle dell’acciaio che si vuole fare prevedere alla rete. Durante la fase di training la rete cerca di apprendere dai dati che riceve e, successivamente, nella fase di evaluating vengono fornite alla rete neurale tutte le caratteristiche (a meno di Fs o Ff) dell’acciaio che si vuole prevedere e la rete cerca di valutare proprio Fs o Ff. Infine, l’output generato dalla cross-evaluation è rappresentato dal valore di Fs o Ff stimato dalla rete e ad essa finora sconosciuto.

Qui la fase di training viene iterata per 3000 cicli e non più per 10000 cicli in quanto si è osservato dalle curve dell’errore previsionale come tale errore tenda asintoticamente ad un certo valore in corrispondenza di un numero di cicli di circa 3000. Inoltre, un’analisi previsionale condotta su un numero di cicli inferiore risulta essere un’analisi meno dispendiosa in termini di tempo. Il training, unito alla fase di evaluating, viene poi a sua volta ripetuto per 897 volte, cioè tante volte quanti sono gli acciai considerati.

(52)

3.2.1.Curve di cross-evaluation -200 0 200 400 600 800 1000 1200 1400 1600 1800 1 51 101 151 201 251 301 351 401 451 acciai Fs

Valori di Fs desiderati Valori di Fs previsti

Fig.31.Curva previsionale di Fs dati valori sconosciuti alla rete (curva di cross-evaluation) e curva dei

rispettivi valori di Fs desiderati.

-200 0 200 400 600 800 1000 1200 1400 1600 1800 1 51 101 151 201 251 301 351 401 451 acciai Ff

Valori di Ff desiderati Valori di Ff previsti

Fig.32.Curva previsionale di Ff dati valori sconosciuti alla rete (curva di cross-evaluation) e curva dei

(53)

Volendo operare un confronto tra le previsioni ottenute con la tecnica della cross-evaluation e le previsioni ottenute fornendo alla rete valori ad essa noti, è utile diagrammare i rispettivi dati come riportato in seguito:

-200 0 200 400 600 800 1000 1200 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Fs

Valori di Fs previsti noti Valori di Fs previsti sconosciuti

Fig.33.Curva previsionale di Fs dati valori sconosciuti alla rete (curva di cross-evaluation) e curva

previsionale di Fs dati valori noti alla rete.

-200 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 1 51 101 151 201 251 301 351 401 451 501 551 601 651 701 751 801 851 acciai Ff

Valori di Ff previsti noti Valori di Ff previsti sconosciuti

Fig.34.Curva previsionale di Fs dati valori sconosciuti alla rete (curva di cross-evaluation) e curva

(54)

Le curve di cross-evaluation presentate forniscono ulteriori spunti per definire il comportamento della rete neurale e la sua capacità di predizione nel caso le si forniscano, nella fase di evaluating, valori ad essa sconosciuti.

Osservando i diagrammi riportati in Fig.31 ed in Fig.33 si può affermare che, anche nel caso di previsione di valori sconosciuti, la rete neurale ha generato degli ottimi risultati in quanto le curve previsionali di Fs ed Ff ottenute da valori sconosciuti alla rete tendono ad inseguire con un comportamento molto simile le rispettive curve dei valori desiderati, ad eccezione di qualche picco isolato di Fs o Ff dove le previsioni della rete fanno più fatica ad inseguirle.

Per quanto riguarda invece i diagrammi riportati in Fig.33 ed in Fig.34, è necessario osservare preliminarmente come le curve di cross-evaluation si interrompano in corrispondenza di un certo numero di acciai: la motivazione risiede nel fatto che il processo di cross-evaluation richiede 3000 cicli per la fase di training e 897 ripetizioni delle fasi di training ed evaluating per riuscire a prevedere la totalità degli acciai presi in esame. Tali operazioni avrebbero richiesto un tempo elevatissimo e assolutamente incompatibile con quella che era la tempistica richiesta per svolgere il presente lavoro di tesi triennale, perciò è stato necessario bloccare il processo di cross-evaluation e cercare di trarre delle conclusioni il più possibile complete sulla base dei dati finora a nostra disposizione. Analizzando i due diagrammi è con grande soddisfazione che si riscontra anche qui una più che buona capacità previsionale della rete, anche nel caso di valori ad essa appunto sconosciuti. A parte qualche valore isolato di picco che le previsioni della rete non riescono a raggiungere, nel complesso l’andamento della curva di cross-evaluation è decisamente soddisfacente in quanto insegue con buona precisione la curva dei rispettivi valori di Fs o Ff desiderati.

Anche in questo caso, per poter operare un confronto tra le previsioni ottenute fornendo alla rete valori ad essa noti e le previsioni ottenute su dati sconosciuti, è utile ricorrere alla calcolo dei due rispettivi Mean Squared Errors.

Per quanto riguarda Fs: MSE (previsione su valori noti) = 27458,35

MSE (previsione su valori sconosciuti) = 27209,31 Per quanto riguarda Ff: MSE (previsione su valori noti) = 81332,66

MSE (previsione su valori sconosciuti) = 80535,11

(55)
(56)

CAPITOLO 4

Conclusioni

Dall’analisi complessiva dei risultati ottenuti nel presente progetto di ricerca emerge che il metodo delle reti neurali rappresenta una promettente modalità per predire i diagrammi di trasformazione anisoterma a partire dalla semplice conoscenza della composizione chimica dell’acciaio preso in esame.

Come già menzionato in introduzione, questo lavoro di tesi si è focalizzato sull’analisi delle capacità di predizione di un sistema a reti neurali, successivo ad un lavoro di strutturazione dei dati di ingresso e ad un altro lavoro di sviluppo di tale sistema a reti neurali.

Ciò che si è concluso con tale lavoro, pertanto, è la verifica della capacità predittiva della neural network che, attraverso i dati raccolti e forniti in input, effettua la previsione dei tempi di inizio e fine precipitazione della ferrite.

Da tale lavoro si sono ottenuti dei buoni risultati in termini di capacità di previsione. Lo sviluppo dei sistema a rete neurale, unito all’appoggio della libreria Shark e ad

un’accurata fase di raccoglimento dei dati, ha infatti permesso di ottenere delle stime con un buon livello di precisione. Possiamo concludere affermando che, molto probabilmente, si sarebbero potuti ottenere risultati ancora più precisi se si avessero avuto a disposizione più dati iniziali; nel complesso comunque la rete neurale ha sviluppato un buon

apprendimento.

(57)

BIBLIOGRAFIA

[1] William D.Callister Jr, Scienze e Ingegneria dei Materiali. Una Introduzione;

EDISES

[2] Guang Xu, Lun Wan, Shengfu Yu, Li Liu e Feng Luo, 2008, “ A new method for

accurate plotting continuous cooling transformation curves”, Materials Letters, vol.

62, p. 3978-3980;

[3] Yoon-Jun Kim, L. Scott Chumbley e Brian Gleeson,2007, “Continuous cooling

transfmation in cast duplex stainless steels CD3MN and CD3MWCuN”, ASM

International, vol. 1059-9495;

[4] J.S. Ye, H.B. Chang e T.Y. Hsu (Xu Zuyao), 2003, “On the Application of the

Additivity Rule in Pearlitic Transformation in Low Alloy Steels”, Metallurgical and

Materials transactions, vol. 34A;

[5] Mark Lusk e Herng-Jeng Jou, 1997, “On the rule of additivity in phase

transformation kinetics”, Metallurgical and Materials transactions, vol. 28A;

[6] Victor D. Fachinotti, Alberto Cardona e Andr´es A. Anca, 2005, “Solid-State

microstructure evolution in steels”, Mecanica Computacional, vol. XXIV, A.

Larreteguy Editor;

[7] F. Liu , C. Yang, G. Yang e Y. Zhou, 2007, “Additivity rule, isothermal and

non-isothermal transformations on the basis of an analytical transformation model”,

(58)

[8] M. Lusk, G. Krauss e H.-J. Jou, 1995, “A Balance Principle Approach for

Modeling Phase Transformation Kinetics”, Journal de physique IV, vol.C8,

p.279-284;

[9] Jean-Philippe Schillé1*, Zhanli Guo1, Nigel Saunders2, A Peter Miodownik2

e Rongshan Qin1, SimPro’08, 2008, Ranchi, INDIA;

[10] J.Trzaska e L.A.Dobrzanski, 2007, “Modelling of CCT diagrams for

engineering and constructional steels”, Materials Processing Technology, vol.

192-193, p. 504-510;

[11] L.A. Dobrza´nski e J. Trzaska, 2004, “Application of neural networks to

forecasting the CCT diagrams”, Journal of Materials Processing Technology ,

vol.157–158, p.107–113;

[12] Leszek A. Dobrzanski e Jacek Trzaska , 2004, “Application of neural networks

for the prediction of continuous cooling transformation diagrams”, Computational

Materials Science, vol. 30, p.251–259;

SITI CONSULTATI:

MatNavi NIMS Materials Database, “http://mits.nims.go.jp/index_en.html” Shark library, “http://shark-project.sourceforge.net/”.

Riferimenti

Documenti correlati

Il flusso indotto lungo la lastra prima della turbolenza è sostanzialmente unidimensionale nella direzione del campo magnetico (direzione asse x); in più esso non è uniforme

Si pensi ad esempio alla mobilità elettrica, e all’accumulo domestico in un futuro di maggior elettrificazione dei consumi (con largo impiego della combinazione pompe di

Nella seconda parte del questionario invece troviamo come domanda chiave la specificazione delle pratiche (ovvero delle modalità e dei modi) che sono state adottate per mettere in

L’obiettivo di questo capitolo è presentare nel dettaglio quali siano gli attori coinvolti nella supply chain del settore navale, ed in particolare focalizzarsi sui

Oltre a fattori di riduzione costi alla base della delocalizzazione ci sono anche scelte di tipo strategico come la possibilità di avvicinarsi al cliente finale

La tesi segue il flusso logico tipico dell’approccio A3: la prima parte è dedicata alla raccolta dati, la seconda all’analisi delle anomalie e delle cause che le generano e,

Il risultato è che si ha un sistema produttivo poco efficiente, costretto a schedulazioni complesse per l’evasione degli ordini, le quali non permettono di ottimizzare la capacità

Come si è visto anche nei casi illustrati, il problema non riguarda infatti solo singoli individui e cittadini isolati, ma anche organizzazioni, talvolta di grande dimensione,