Risultati sperimentali
6.1 Analisi esplorativa della prima sessione sperimen- sperimen-talesperimen-tale
L’analisi iniziale è stata svolta grazie all’analisi dei dati della prima sessione sperimentale raccolti nel mese di marzo e mirati a evidenziare come una variazione di alcuni parametri
6.1 – Analisi esplorativa della prima sessione sperimentale
esterni tra cui macinatura, dose e pressione, influenzi le caratteristiche del caffè e se una differenza nella manutenzione del gruppo macchina potesse incidere sulle prestazioni.
6.1.1 Selezione delle variabili principali
L’obiettivo iniziale è definire una struttura per il rilevamento dei dati in laboratorio, tale da includere le variabili più utili e significative per l’analisi, al fine di velocizzare il processo di raccoglimento dei dati. Si procede con la selezione degli attributi che forniscono maggiori informazioni.
Come descritto nella sezione 4.2.1, la struttura del dataset si può dividere in diverse macroaree:
• Informazioni generali: indica quando l’erogazione è stata effettuata, e a quale test appartiene, più precisamente a quali variazioni dei parametri esterni corrisponde;
• Dati caratteristici dell’erogazione: descrive l’erogazione grazie ai dati provenienti dalla macchina(modello, gruppo usato, tipologia, dose programmata),al tipo di miscela usata e alla sua pressatura. Generalmente i valori degli attributi di questa sezione restano fissi per l’intera durata dell’esperimento;
• Parametri primari dell’erogazione rilevati esternamente: rilevazioni effettuate ma-nualmente, che offrono informazioni sul tempo di erogazione, e sui pesi di macinato e quantità in tazza dell’erogazione. Rappresentano le caratteristiche in tazza del caffè;
• Dati provenienti dalla scheda PC : dati rilevati dalla scheda elettronica della macchina.
Sono la base dei dati rilevati dal device di telemetria;
• Confronto con le soglie: sono le informazioni più importanti dell’erogazione(tempo di erogazione, flusso e erogato in tazza), a cui vengono date delle etichette basandoci sulle soglie di qualità fornite dagli esperti di dominio;
• Diagnostica della macchina: forniscono informazioni sulla presenza dei lavaggi del gruppo di erogazione, oltre a fornire eventuali messaggi di errore della macchina.
• Indici calcolati: sono indici ricavati partendo dalle rilevazioni in tazza e dalla scheda PC, così da fornire nuove variabili in analisi.
Durante lo studio delle variabili è emerso come gli Indici Calcolati non forniscono molte informazioni aggiuntive, ed essendo calcolati a partire dai dati rilevati possono essere calco-late successivamente in caso di necessità. Quindi, si è optato per eliminarli dalla struttura dei dataset futuri e di non rilevare alcuni campi della diagnostica della macchina, in quanto non significativi o con valore nullo costante.
Per quanto concerne i Dati caratteristici dell’erogazione, assumono sempre lo stesso valore all’interno della prima sessione sperimentale, in quanto tutte le erogazioni sono doppie e svolte sulla stessa macchina, con la sola differenza del gruppo di erogazione.
Esse risultano molto importanti in un contesto in cui dati di rilevazioni di diverso tipo, svolte su macchine diverse, siano analizzate assieme. Per l’analisi limitata alla prima sessione sperimentale risultano però di poca importanza poichè vengono mantenute le stesse condizioni per ogni erogazione.
É stato deciso allora di eliminare queste colonne solo per quanto riguarda l’analisi della prima sessione sperimentale, ottenendo il database ridotto le cui caratteristiche sono specificate nella sezione 4.2.2.
6.1.2 Analisi di correlazione
Partendo dal nuovo dataset, si è cercato di capire quali parametri delle erogazioni sono correlati. Dopo aver eliminato quegli attributi il cui valore è calcolato direttamente da altre variabili, è stata calcolata la matrice di correlazione tra le diverse variabili.
Figura 6.1: Matrice di correlazione
Il grafico riporta la correlazione tra le diverse variabili: le gradazioni di rosso indica-no una correlazione positiva, mentre quelle di colore azzurro presentaindica-no una correlazione negativa. Variabili poco o non correlate sono invece caratterizzate da un colore grigio.
Possiamo quindi notare come alcune variabili siano correlate tra loro:
• Tempo di erogazione e flusso della scheda PC: inversamente correlati, poichè più aumenta il tempo, più il flusso è lento;
6.1 – Analisi esplorativa della prima sessione sperimentale
• Pressione con tempo di erogazione e flusso della scheda PC: aumentando la pressione il tempo di erogazione diminuisce, e di conseguenza il flusso aumenta;
• Peso del macinato con tempo di erogazione e flusso della scheda PC: una dose minore di macinato causa un tempo di erogazione minore, e quindi un flusso maggiore;
• Tempo di erogazione e erogato in tazza: correlati positivamente, ovvero a un tempo maggiore corrisponde un erogato maggiore;
• Gruppo usato con tempo di erogazione e flusso della scheda PC: le due caratteristiche principali sembrano in qualche modo correlati col gruppo usato. Ciò è di particolare interesse in quanto i due gruppi presentano condizioni diverse, in quanto in uno dei due gruppi non sono mai stati effettuati i lavaggi.
Possiamo quindi affermare che, come già anticipato dagli esperti di dominio, le nostre variabili di interesse sono:
• Tempo di erogazione;
• Flusso;
• Erogato in tazza.
In particolare il tempo e il flusso variano a seconda di alcuni parametri esterni, come, ad esempio, la pressione e la dose di macinato, e sembra intercorrere una differenza di comportamento nei due gruppi: di questi due aspetti parleremo più approfonditamente nella sezione 6.4, dedicata allo studio delle regole di associazione.
Svolgiamo però una prima analisi per vedere l’andamento delle tre caratteristiche prin-cipali all’interno della sessione sperimentale, confrontando i due gruppi aventi processo di manutenzione diverso a causa della mancanza dei lavaggi in uno dei due gruppi.
6.1.3 Andamento delle variabili e confronto tra gruppi
Sfruttiamo i boxplot della libreria Matplotlib per visualizzare l’andamento delle tre variabili nei due gruppi.
(a) Tempo di erogazione (b) Flusso in tazza (c) Erogato in tazza
Figura 6.2: Distribuzione delle tre variabili principali nella prima sessione sperimentale.
A causa della struttura della sessione sperimentale i tempi di erogazione e i flussi sono molto variabili, poichè è prevista la variazione di macinatura, dose e pressione, che influi-scono in modo significativo sui parametri generali dell’erogazione. In aggiunta, l’erogato,
esclusi alcuni outliers, ha una distribuzione più stretta, con una quantità in tazza che ri-mane praticamente costante. Questo è attribuibile alla taratura della macchina, che pone come obiettivo principale l’erogazione di una quantità costante di caffè.
Confrontando le distribuzioni dei due gruppi, risulta evidente come il gruppo sporco abbia dei tempi più elevati rispetto al gruppo pulito, e questo aspetto è dovuto, proba-bilmente, dovuti a una sporcizia accumulatasi nei condotti della macchina a causa della mancanza dei lavaggi. Analogamente, il flusso del gruppo sporco è più lento rispetto al gruppo pulito.