CAPITOLO 2
ANALISI DI CRITICITA’: LA METODOLOGIA FMECA
2.1 La
metodologia
L’acronimo FMECA significa “Failure mode, effects and criticality analysis” che si potrebbe tradurre con la frase “Analisi dei modi di guasto, degli effetti e delle criticità”. La FMECA è una metodologia di analisi affidabilistica di tipo bottom–up che può essere usata sia in fase di progettazione sia nel periodo di esercizio di una macchina o impianto con l’intento di evidenziare ed analizzare tutti i possibili modi di guasto e le relative conseguenze.
Questa analisi permette di evidenziare i guasti ordinandoli per criticità decrescente; se teniamo conto del principio secondo il quale i guasti più ricorrenti di un sistema riguardano una piccola percentuale dei componenti ( analisi statistiche hanno evidenziato che solo il 5% dei componenti sono sottoposti ad attività manutentive costanti e ripetute) arriviamo alla conclusione che questa metodologia è uno strumento molto potente per convogliare risorse economiche ed umane principalmente sui componenti risultati critici dall’analisi.
La FMECA è nata e si è sviluppata, attorno agli anni 60 negli Stati Uniti, utilizzata in campo missilistico e nella valutazione dell’affidabilità di strumenti elettronici. L’uso di tale tecnica si è poi esteso ad altri campi, in particolare quello automobilistico.
Il Comitato elettrotecnico internazionale (IEC) ha prodotto una norma (812/1985) per codificarne l’uso. In Italia la FIAT – Iveco, con altri suoi partners, ha pubblicato nel 1998 linee guida per la sua adozione nel proprio contesto operativo.
Il fondamento su cui si basa la FMECA è quello di poter quantificare con vari indici caratteristici, opportunamente combinati, un ordine di criticità dei componenti del sistema che stiamo studiando, in modo da stabilire delle priorità d’intervento e permettendo, come già detto, di concentrare le risorse in base ai risultati. L’efficacia di questa metodologia si basa su una applicazione sistematica della stessa che risulta, pertanto, efficace solo se portata avanti con scrupolosità.
L’approccio che porta a risultati significativi è quello di applicare la FMECA secondo le più recenti filosofie di gestione quali il Total Quality Managment o il miglioramento continuo con l’applicazione della nota “Ruota di Deming ” (vedi schema in Figura 2.1).
CHECK
ACT
DO
PLAN
Figura 2.1 : Ruota di Deming
Naturalmente questo schema deve essere applicato lungo tutto il ciclo di sviluppo per procedere con una sistematicità che ci permette di anticipare le difettosità mediante l’individuazione delle potenziali criticità. In questo modo si agisce in retroazione cioè l’errore sull’ output può essere usato per intervenire sugli input.
2.2 Concetti base e definizioni dell’Affidabilità
L’uso della metodologia FMECA presuppone una serie di ipotesi che traggono origine dalla teoria dell’affidabilità ed in questo paragrafo se ne esporranno i concetti base e le definizioni dei più importanti parametri.
Per “affidabilità” si intende quella parte della statistica che studia le leggi di guasto di componenti, macchine e sistemi al fine di stimare o ottimizzare la durata di vita, la disponibilità operativa e il costo del ciclo di vita. Un componente o una macchina si dice “affidabile” se è capace di funzionare correttamente, senza guastarsi, per un periodo di tempo assegnato, secondo precise condizioni di impiego e in predeterminate condizioni ambientali.
Solitamente si accetta la teoria secondo la quale, l’affidabilità di un sistema sia rappresentata da un parametro, detto tasso di guasto, e dal suo andamento nel tempo. Prima di esplicitare la formula del tasso di guasto occorre definire alcune grandezze affidabilistiche:
• Probabilità di guasto (f) è la probabilità che il componente o sistema si guasti ad un istante prefissato (ora, giorno,…) a partire dall’istante di inizio servizio. • Probabilità cumulata di guasto (F) è la probabilità che il componente o sistema
si guasti entro un istante prefissato cioè non “sopravviva” in funzionamento corretto fino a quell’istante.
• Affidabilità (Reliability, R) è la probabilità che il componente o sistema funzioni correttamente per un periodo di tempo assegnato, secondo precise condizioni di impiego e in predeterminate condizioni ambientali. Come possiamo notare dalle definizioni vale:
R = 1 – F
• Tasso di guasto (rateo di guasto, failure rate, λ) è la probabilità che il componente o sistema, che abbia funzionato fino ad un istante prefissato, si guasti nel periodo di tempo (ora, giorno..) immediatamente successivo, praticamente rappresenta la misura di un rischio immediato di guasto di un componente che ha già vissuto per un determinato tempo. Il tasso di guasto si calcola come rapporto tra il numero di guasti in un intervallo di tempo e il numero degli “individui” ancora funzionanti all’inizio del periodo considerato:
) ( ) ( ) ( ) ( 1 1 2 2 1 t R t F t F t t ÷ = − λ
Da analisi sperimentali, condotte nel corso degli anni, è emerso che λ(t) segue un andamento particolare, disegnando una curva “a vasca da bagno” meglio conosciuta come “bathtub curve” di cui nelle Figure 2.2, 2.3 e 2.4 se ne riportano degli esempi:
Figura 2.2 : Bathtub Curve
Come possiamo vedere la curva è divisa essenzialmente in tre tratti: il primo corrisponde al periodo di rodaggio (“mortalità infantile”) ed è caratterizzato da un andamento decrescente del tasso di guasto, fino ad un valore pressochè costante, il secondo tratto è invece relativo alla vita utile del componente, caratterizzato dalla costanza di λ(t), in cui i guasti sono di natura casuale ed accidentale, il terzo tratto rappresenta la zona di degrado dove abbiamo un rapido innalzamento del tasso di guasto dovuto all’inevitabile processo di usura dei componenti il quale ne compromette le caratteristiche meccaniche, fisiche e chimiche. Di seguito nelle Figure 2.3 e 2.4 sono riportati due casi estremi dell’ andamento di λ(t)
Figura 2.4 : Esempo di Bathtub Curve
Altri parametri affidabilistici di notevole importanza pratica, soprattutto per l’ampio uso che se ne fa durante l’ applicazione della metodologia FMECA, sono:
• MTTF (Mean Time To Failure) che rappresenta il tempo medio fino al guasto
• MTTR (Mean Time To Repair) che rappresenta il tempo medio di riparazione
Il primo di questi parametri è ampiamente usato quando il componente che si rompe non viene riparato, ma sostituito completamente, mentre il secondo è preferibile qualora si proceda alla riparazione. La somma tra MTTF e MTTR definisce:
MTBF = MTTF + MTTR
il quale (Mean Time Between Failures) rappresenta il tempo medio tra due guasti successivi ed è ampiamente utilizzato per descrivere il comportamento di componenti riparabili.
In generale si definisce sistema (affidabilistico) un oggetto composto da altri oggetti. La definizione stessa dipende dal “grado di aggregazione” del modello, per esempio un tornio (oggetto) è un componente di una linea (sistema) ma lo stesso tornio (sistema) è composto da slitte, bancale, mandrino ecc. (oggetti). I sistemi si classificano in base a:
• Ridondanza, ossia la presenza di uno o più componenti in grado di sopperire al funzionamento del componente principale in caso di guasto. • Riparabilità, ossia la possibilità che le caratteristiche di un sistema
Esempi notevoli di sistemi affidabilistici sono i sistemi serie e parallelo.
I primi sono schematizzabili come in Figura 2.5 e basta che uno qualsiasi dei componenti non funzioni affinché il sistema, complessivamente, non funzioni.
Figura 2.5 : Sistema serie
Per un sistema serie l’affidabilità vale:
∏
= n i i serie t R t R ( ) ( )cioè l’affidabilità complessiva e il prodotto delle singole affidabilità dei componenti che compongono il sistema.
I secondi, invece, sono schematizzabili come in Figura 2.6 e basta che un qualsiasi componente funzioni affinché il sistema complessivamente funzioni.
Figura 2.6 : Sistema parallelo
Per un sistema parallelo l’affidabilità vale:
∏
− − = n i i parallelo t R t R ( ) 1 (1 ( ))Cioè l’inaffidabilità (probabilità di guasto) del sistema parallelo è il prodotto delle inaffidabilità dei componenti e l’ affidabilità di tale sistema è sempre maggiore della massima affidabilità dei suoi componenti.
In generale i sistemi parallelo sono anche sistemi ridondanti (i sistemi serie non lo sono mai) ed una tipologia particolare di questi sono i sistemi a ridondanza maggioritaria o sistemi k/n i quali funzionano correttamente solo se funzionano
almeno k (k < n) elementi degli n in parallelo; se si fa l’ipotesi che gli n-elementi siano tutti uguali e con affidabilità pari ad R vale che:
∑
= − − ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = n k j j n j n k R R j n t R / ( ) (1 )In Figura 2.7 è rappresentato un esempio di sistema:
5
5
5
2/3 Ridondante
1
Parallelo
4
3
2
6
7
Figura 2.7 : Esempio di sistema affidabilistico
Il calcolo dell’affidabilità complessiva può effettuarsi con le formule introdotte sopra:
7 6 1R R R R R Rtot = p rid Dove: ) 1 ( ) 1 ( 1 R3 R4 R5 Rp = − − × × − (1 ) } 2 2 3 ) 1 ( 2 3 2 3 { 1 2 5 5 3 5 0 5 . R R R R Rrid − × + − × × − =
Da quanto appena esposto, risulta evidente che la FMECA ha come scopo principale quello di estendere il più possibile il tratto di curva a tasso di guasto costante per evitare di “combattere” problemi connessi all’usura e quindi fronteggiare solo guasti casuali e accidentali.
2.3 La FMECA in atto
La metodologia FMECA viene attuata da team di esperti che provengono da varie funzioni aziendali, integrati e guidati da personale estremamente preparato. Questo metodo di tipo operativo, consente di ricavare con efficacia i componenti critici e quindi progettare e pianificare una migliore politica di intervento. Considerando le ipotesi fatte nella breve trattazione della metodologia. il problema principale è quello di evidenziare quei componenti che sono effettivamente critici per il funzionamento della macchina e, per questi, analizzare i modi, gli effetti e le cause di guasto.
L’applicazione della FMECA si divide in tre fasi successive: • Fase 1: selezione della macchina critica;
• Fase 2: scomposizione funzionale della macchina;
• Fase 3: individuazione dei modi di guasto e valutazione della criticità;
Nella fase 1 il responsabile della manutenzione, in base ad una stima tecnica e anche alla propria esperienza, localizza quale parte dell’impianto è più critica; questa scelta viene anche determinata seguendo dei criteri guida tra cui:
• Elevati costi di mancata produzione per indisponibilità impianti; • Elevati costi di non conformità qualitativa;
• Prevalenza di manutenzione incidentale rispetto alle altre politiche manutentive;
• Costi globali di manutenzione elevati o sbilanciati.
La fase 2 consiste nel decomporre il sistema in studio in ogni suo componente, fino al livello di profondità e di dettaglio desiderati. Tale scomposizione funzionale dipende da una serie di fattori concorrenti quali l’accuratezza dell’analisi, il tempo a disposizione per effettuare lo studio e le risorse economico-finanziarie disponibili. Di solito si procede ad una scomposizione ad un livello più superficiale e generale, per approfondire in seguito l’indagine laddove sia ritenuto necessario o opportuno.
Solitamente, per raggiungere un livello ottimale cui fermare la scomposizione funzionale, conviene fare riferimento alle Line Replaceable Units (LRU), cioè quelle parti fisiche che, in caso di guasto, vengono sostituite interamente e sulle quali non vengono fatti interventi di manutenzione.
Il risultato della scomposizione funzionale è una struttura arboriforme, più o meno dettagliata, che consente di affrontare al meglio i successivi passi dello studio.
Nella fase 3 viene effettua l’analisi di criticità vera e propria. Questa consiste nel determinare tutti i possibili modi di guasto di un componente o di una sua parte, unitamente agli effetti ad essi imputabili e che si ripercuoteranno sull’intero sistema. Tenendo presente che per “guasto” si intende la cessazione dell’attitudine di un’entità ad eseguire le funzioni richieste, possiamo concordare che questo rappresenti un evento che determina il passaggio da stato di piena funzionalità a quello di avaria. E’ naturale pensare che ogni guasto rivesta un’importanza diversa, dato che i suoi effetti possono essere più o meno marcati sul sistema nella sua interezza. Fatta questa considerazione appare essenziale correlare all’evento “guasto” alcuni parametri capaci di quantificarne il peso, allo scopo di creare una lista dalla quale individuare e analizzare le priorità, che sia strumento di verifica e punto di partenza per ogni successivo ciclo di miglioramento.
2.4 La scomposizione funzionale e l’analisi di criticità
Come messo in evidenza precedentemente, il livello di scomposizione funzionale è una variabile dipendente da molti fattori quali l’accuratezza dell’analisi, il tempo e le risorse economiche finanziarie disponibili. Quest’ultimo aspetto è un fattore particolarmente vincolante in quanto risulta necessario calcolare a priori il guadagno ottenibile, anche in termini di affidabilità, rispetto ai costi aggiuntivi di un’analisi molto dettagliata. Conseguentemente, uno stesso sistema o una sua parte, può essere analizzato a diversi livelli e diversi gradi di dettaglio secondo le esigenze del momento. Anche la variabile tempo può condizionare fortemente le decisioni sul grado di dettaglio della scomposizione funzionale, spesso si parte perciò con un “progetto pilota” che poi viene modificato o migliorato in momenti successivi. Alcuni esempi chiariranno meglio i più importanti principi guida per la decisione del dettaglio della scomposizione funzionale: se analizziamo una parte prodotta internamente risulta opportuno approfondire la scomposizione ad un livello di dettaglio molto elevato; se si tratta di un LRU, cioè una parte che viene acquistata all’esterno e in caso di guasto viene sostituita interamente, non è conveniente procedere oltre.
Può succedere che uno stesso componente possa essere analizzato più o meno dettagliatamente: un macchinario nuovo, appena entrato in servizio, darà,
sicuramente, maggiori garanzie di un corretto funzionamento rispetto allo stesso in fase di degrado come possiamo vedere dalla “bathtub curve” riportata in Figura 2.8.
Figura 2.8 : Bathtub Curve
Quindi lo stesso macchinario, da nuovo può potrà essere analizzato prendendo a riferimento un certo numero di cause di guasto, mentre, con il passare del tempo e quindi con il deterioramento delle caratteristiche, si richiede necessaria un’analisi più approfondita.
Il risultato della scomposizione funzionale, come già detto, è una struttura arboriforme (Figura 2.9) ben rappresentabile da un diagramma a blocchi in quanto questo tipo di rappresentazione mette in evidenza i legami tra i componenti e permette una volta individuati i modi di guasto ai livelli più bassi di individuare gli effetti sul livello immediatamente precedente, fino ad arrivare al punto di partenza (“bottom - up”).
Rullo pendolo
Pendolo pendoloAlbero
Dado di bloccaggio Bronzina Cuscinetto assiale Grippaggio Blocco rotazione Contatto con forti urti Guaina pendolo
Nella Figura 2.9 sono stati riportati, a titolo di esempio, dei modi di guasto per far vedere come quelli di livello più basso si ripercuotano sui livelli superiori. Il procedimento si svolge perciò seguendo una ben precisa sequenza logica comunemente definita flusso logico della catena causale e visibile in Figura 2.10.
Failure Cause: Mancanza lubrificazione Failure Mode: Grippaggio Failure Effect: Blocco rotazione Failure Cause: Grippaggio Failure Mode: Blocco rotazione Failure Effect: Contatto con forti urti
Figura 2.10 : Catena Causale
Per non creare ambiguità al momento dell’identificazione dei modi di guasto, tra guasto inteso come evento, il modo con cui esso si concretizza e la causa che ne ha determinato l’insorgenza, bisogna definire un modo di guasto in maniera chiara e univoca: noto il componente che, a causa del guasto, subisce un passaggio da sistema funzionante a sistema in avaria, il modo di guasto è rappresentato dall’avaria stessa.
Il passo più importante dell’analisi di criticità è senza dubbio l’attribuzione dei parametri che serviranno a “pesare” i vari modi di guasto.
Ad oggi non esistono standard consolidati in merito alla scelta dei parametri bensì sono state proposte molte varianti in base alla realtà ed al contesto che analizziamo. In campo industriale si è affermato il metodo proposto dalla Ford Motor Company e dalla Society of Automotive Engineers (SAE). Con questo metodo si prendono a riferimento tre parametri solitamente variabili tra un minimo, 1, ed un massimo, 10, i quali possono essere valutati mediante semplici espressioni linguistiche.
I tre parametri in questione sono:
• Probability (O) : indica la probabilità che un guasto si verifichi nel modo previsto. Nella FMECA classica, applicata alla manutenzione, una buona scelta di valutazione è quella di stimare i valori basandosi sul Mean Time Between Failures (MTBF).
• Detectability (D) : misura la “rilevabilità” o la “visibilità” del guasto, cioè l’attitudine dello stesso ad essere identificato mediante controlli o ispezioni. • Severity (S) : è intesa come la gravità degli effetti del guasto che possiamo
considerare come insoddisfazione del cliente, la perdita di immagine dovuta ad un prodotto di scarsa qualità, il tempo di fermo produzione necessario alla riparazione o il rischio di danni fisici.
Il prodotto di questi tre parametri fornisce il Risk Priority Number (RPN):
RPN = O x D x S
Questo metodo ha avuto successo perché permette di valutare il RPN mediante espressioni linguistiche di facile interpretazione le quali, mediate opportune tabelle di conversione, forniscono valori numerici. Questo vantaggio è importante laddove non sia possibile risalire allo storico e quindi estrapolare dati.
2.5 Quantificazione dei parametri
Per attribuire ai parametri sopra citati una valutazione numerica esistono due tipi di approcci, uno quantitativo ed uno qualitativo.
Il primo è sicuramente da preferire quando si disponga di dati, storici e statistici, dai quali ricavare parametri come il MTTF, MTTR o MTBF; il secondo invece è necessario quando i dati, storici e statistici, non sono disponibili o non sono affidabili. L’approccio qualitativo offre il vantaggio di poter essere applicato in tutte le situazioni, ma ha il difetto della soggettività ed attendibilità del giudizio; tuttavia per ovviare a questo problema alcuni autori hanno stilato una serie di principi guida da seguire:
• Usare, per i vari parametri, elementi di giudizio il più generali possibili.
• Ogni elemento di giudizio dovrebbe avere un numero di valori possibili chiuso e ristretto.
• Per ogni parametro è necessario verificare tutte le combinazione che gli elementi di giudizio possono assumere e successivamente scartare quelle prive di significato. Ogni combinazione dovrebbe dare come risultato un unico valore su una scala predefinita.
Con l’applicazione rigorosa di questi principi guida si creano delle tabelle di conversione, da valutazioni linguistiche a valori numerici, che saranno utilizzate durante l’effettiva analisi. Di seguito si riportano alcuni esempi di tabelle che possono essere riadattate alle particolari circostanze nelle quali svolgiamo la FMECA.
Per il parametro Probability (O) solitamente si usa come riferimento il MTBF che porta alla costruzione di tabelle simili a quella di Figura 2.11.
O
Valutazione
linguistica della
probabilità del
guasto
Valori del MTBF di
riferimento
O
REMOTA
> 1anno
1
BASSA
6-12mesi
2-3
MODERATA
4-6
4-6
ALTA
1-4 mesi
7-8
MOLTO ALTA
<1 mese
9-10
Figura 2.11 : Tabella di conversione per il parametro Probabilità
Naturalmente i valori del MTBF di riferimento non sono fissati ma variano, come già detto, a seconda della realtà nella quale svolgiamo la FMECA.
Per il parametro Detectability (D) si usano tabelle ancor più sintetiche proprio per ovviare al rischio, di fornire giudizi soggettivi, che in questo caso è molto elevato; un esempio è riportato in Figura 2.12.
Visibile ad
occhio nudo
Controllabile
mediante
strumentazione
Rilevabile
dopo
un’ ispezione
Ispezione
periodica
Punteggio
per la
Rilevabilità
R
Si Parz. No Dir. Indir. No
Si
No
Si
No
X
1
X
X
1
X X
2
X
X X X
3
X
X X X
4
X X X
5
X
X X X
5
X X X
6
X
X X X
6
X
X
X X
7
X
X
X X
8
X
X X X
9
X
X X X
10
Figura 2.12 : Tabella di conversione per il parametro Rilevabilità (D)
Infine, per quanto riguarda il parametro Severity (S), questo può essere associato, come già detto, a diversi fattori quali l’insoddisfazione del cliente, la perdita di immagine dovuta ad un prodotto di scarsa qualità, il tempo di fermo produzione necessario alla riparazione o il rischio di danni fisici. Date queste diversità si intuisce che in base al significato che riteniamo opportuno dare al parametro Severità, le tabelle di conversione cambieranno notevolmente con questo.
Di seguito sono riportate due tipi di tabelle nelle quali, al parametro “S”, è stato dato un significato diverso: nella tabella di Figura 2.13 quello di danno economico sia in termini di riparazione, sia come blocco della produzione, in quella di Figura 2.14 quello di danno fisico, cioè valutiamo la possibilità che un modo di guasto causi incidenti sul lavoro più o meno gravi.
Livello di criticità
Valutazione linguistica
del parametro Severità
Punteggio da attribuire
al parametro S
Molto critica
Blocco totale del flusso
produttivo
10
Critica
Rallentamento della
capacità produttiva
7
Poco critica
Aumento della difettosità
con piena capacità
produttiva
3
Marginalmente critica
Utilizzo di impianti di
back-up con
mantenimento della
capacità produttiva
1
Figura 2.13 : Tabella di conversione del parametro “S” a riferimento del danno economico
Valutazione linguistica del parametro Severità
Punteggio da
attribuire al
parametro S
Probabilmente il guasto non causerà fastidi di alcun
genere
1 - 3
L’ incidente dovuto al gusto richiede meno di tre giorni di
assenza
4 - 6
L’ incidente dovuto al gusto richiede più di tre giorni di
assenza
7 - 8
L’ incidente dovuto al guasto può avere gravi
conseguenze penali
9 - 10
2.6 Fogli di lavoro e Valore di soglia
Attribuiti i giudizi ai parametri è possibile proseguire nell’analisi calcolando, come già esposto in precedenza, il Risk Priority Number e compilando le schede per l’analisi di criticità proprie della metodologia. La forma di questi “fogli di lavoro” non è standardizzata ma in ogni caso devono risultare ben leggibili. In Figura 2.15 è riportato un esempio di “foglio di lavoro” cosi come si presenta sul software che ho utilizzato per svolgere il mio studio.
F M E C A
Number: State: Company: MOLINO PM-16 Item Code: Responsible: Created: 08/04/2005 State: Company: Created: 29/07/2005 FMEA/System Element: FMEA FormEffects S C Failure Modes Causes Preventive
Action O Detection Action D RPN R/D
System Element: Pendoli
Function: Macinare prodotto portandosi a contatto con la pista
Initial State: 27/06/2005
Macinazione
impedita 4 Contatto impedito Bloccaggio rotazione orizzontale pendolo 1 10 40 Initial State: 27/06/2005 Sollecitazioni su albero verticale fuori specifica 10 Contatto pista-pendolo con forti urti Bloccaggio rotazione 1 8 80
Function: Impedire forti sollecitazioni nel contatto rullo-pista
Initial State: 27/06/2005 Vibrazioni dovute ai pendoli 9 Vibrazioni eccessive pendoli Usura non omogenea 1 7 63 Initial State: 27/06/2005 Perdita accoppiamento pendolo- stella 1 8 16 Initial State: 27/06/2005 Perdita riferimenti pendoli 1 2 Perdita accoppiamenti esterni Perdita di riferimenti verticali (esterni) 1 8 16
La scheda riporta essenzialmente il nome del componente in esame, le sue funzioni all’interno del macchinario, i suoi modi di guasto, l’effetto e la causa, insieme con i valori numerici dei parametri adottati e con il valore risultante dell’indice di priorità del rischio.
L’ultima fase della metodologia consiste nel fissare un valore di soglia per il RPN e nello stabilire le azioni di manutenzione volte a ridurre la criticità dei modi di guasti che superano tale valore. Il parametro Severità, come già detto, è quello che tiene conto degli effetti del guasto quindi potrebbe essere utile suddividere i modi di guasto in classi d’importanza all’ interno delle quali fissare il valore di soglia. In Figura 2.16 si riporta un esempio di quanto appena detto: