• Non ci sono risultati.

Progettazione ed analisi degli esperimenti

N/A
N/A
Protected

Academic year: 2021

Condividi "Progettazione ed analisi degli esperimenti"

Copied!
45
0
0

Testo completo

(1)

Metodi Statistici e Probabilistici per l’Ingegneria

FONDAMENTI DI INFERENZA

FONDAMENTI DI INFERENZA

Corso di Laurea in Ingegneria Civile

Facoltà di Ingegneria, Università di Padova

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 1

Docente: Dott. L. Corain

E-mail: livio.corain@unipd.it Home page: www.gest.unipd.it/~livio/Corso_Civile.html

SOMMARIO

¾

Definizioni, principi e fasi del DoE (Design of

Experiments)

¾

ANOVA ad una via

¾

ANOVA ad una via

¾

Confronti multipli

¾

Blocco e covariata

¾

ANOVA a due vie

¾

ANOVA multivia

¾

ANOVA multivia

¾

Piani 2k

¾

Fattori fissi e fattori casuali e studi di ripetibilità

(2)

PRINCIPI E FASI DEL DOE

z Un esperimento è una serie di prove in cui lo

sperimentatore fa variare deliberatamente dei fattori (controllabili) di input di un processo/sistema, osserva la risposta in un uscita e quindi, grazie ad opportune elaborazioni statistiche inferenziali determina quali fattori elaborazioni statistiche inferenziali, determina quali fattori inducono una variazione significativa nella risposta.

z Nell’esperimento sono sempre

presenti anche dei fattori (fonti di variabilità) non controllabili (strumenti di

esecuzione/misurazione della prova materiale sperimentale non

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 3

prova, materiale sperimentale non omogeneo/uniforme,

campionamento, ecc.) i quali inducono una variabilità ulteriore alla risposta che si somma a quella determinata dai fattori controllabili.

PRINCIPI E FASI DEL DOE

z Si noti che mentre la variabile risposta (TWT, ST,

durezza, ecc.) deve necessariamente essere una misura di tipo numerico, i fattori controllabili di input di un processo/sistema possono essere sia qualitativi (tipo di

i l di f i ) i

reagente, materiale di confezionamento, ecc.) sia quantitativi (% di additivo, quantità di ossidante, ecc.).

z In un esperimento fattoriale, tutte le possibili

combinazioni dei livelli dei fattori (detti trattamenti) vengono testati, generalmente ciascuno per un uguale numero di volte pari ad n (esperimento bilanciato).

z In un piano fattoriale frazionato invece non tutte leIn un piano fattoriale frazionato invece non tutte le

combinazioni dei trattamenti vengono testate, ma sono una loro parte (detta frazione del piano).

z Se i trattamenti vengano testati una sola volta, si parla di

esperimento/piano fattoriale non replicato. Esso ha il forte limite di non consentire una analisi inferenziale.

(3)

PRINCIPI E FASI DEL DOE

z Grazie ad un opportuno modello statistico di

rappresentazione dei dati sperimentali è possibile formalizzare il ruolo sia dei fattori controllabili sia di quelli non controllabili: Y =µ + ε,

„ dove Y è la risposta, µ rappresenta il valore medio

della risposta, che può dipendere (linearmente) dai livelli (cioè dai valori) dei fattori controllabili. Ad es.

9µ = µ0i(ANOVA ad una via)

9µ = µ0i+βj(ANOVA ad una via con blocco) 9µ = µ0i+βj+ (τβ)ij(ANOVA a due vie)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 5

j j

„ ε rappresenta il termine di errore sperimentale, dove

confluiscono tutte le fonti (fattori) di variabilità non controllabile e che si assume indipendente ed identicamente distribuito secondo una v.a. gaussiana:

ε∼IIN(0,σ2).

PRINCIPI E FASI DEL DOE

z Gli esperimenti sono largamente utilizzati nell’industria

principalmente nell’area della ricerca e sviluppo e della qualità, ad esempio allo scopo di

„ Ridurre il tempo per progettare/sviluppare nuovip p p g pp

prodotti e processi.

„ Valutazione dei materiali, delle alternative di progetto,

settare componenti e sistemi di tolleranza, ecc.

„ Caratterizzare e migliorare le prestazioni dei processi

esistenti.

„ Migliorare l’affidabilità e le prestazioni dei prodotti.g p p „ Raggiungere robustezza di prodotto e processo. z In generale, tutti gli esperimenti sono progettati ed i dati

ottenuti elaborati con metodi statistici, tuttavia solo alcuni in modo adeguato ed opportuno, altri invece sono pianificati poco e male ed analizzati in modo improprio.

(4)

PRINCIPI E FASI DEL DOE

È importante sottolineare che l’esperimento deve essere debitamente progettato prima della sua esecuzione. In particolare bisogna stabilire:

„ l’idonea risposta (TWT, ST, durezza, ecc.) alla luce del

problema in oggetto;

„ i fattori ed i rispettivi livelli che si vogliono manipolare

nell’esperimento e che ci si aspetta possano influenzare la risposta; esiste un ovvio trade-off tra numero di fattori/livelli e tempi/costi dell’esperimento;

„ il numero n di prove per trattamento (numero di

repliche); in generale si preferisce far sì che ogni

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 7

repliche); in generale si preferisce far sì che ogni trattamento abbia lo stesso numero di prove (esperimento bilanciato);

„ una appropriata assegnazione del materiale

sperimentale ai trattamenti;

„ un idoneo ordine di esecuzione delle prove.

PRINCIPI E FASI DEL DOE

I principi basilari del DoE sono tre: randomizzazione,

replicazione e blocco.

z Randomizzazione: sia l’ordine di esecuzione delle

prove sia l’assegnazione del materiale sperimentale ai trattamenti deve avvenire in modo completamente casuale (randomizzato); questo consente di mediare gli effetti di fattori non controllabili sempre presenti (ma “nascosti”) che vanno così ad incidere in modo uniforme sui vari trattamenti.

z Replicazione: significa che ogni trattamento deve

essere eseguito in più di una prova indipendente; questo essere eseguito in più di una prova indipendente; questo consente di migliorare la precisione della stima dell’effetto dei fattori, riducendo nel contempo la stima dell’errore e del rumore di fondo (si ricordi che l’errore standard della media campionaria è uguale a σ, scarto quadratico medio della popolazione, diviso √n).

(5)

PRINCIPI E FASI DEL DOE

z Blocco: si tratta di un fattore di disturbo noto e

controllabile che quasi certamente produce sulla risposta un effetto, che non interessa però allo sperimentatore. Tuttavia la variabilità che trasmette alla risposta deve essere minimizzata.

z Tipici fattori di disturbo/blocco sono: lotti di materiale

grezzo, operatori, provini, attrezzature, il fattore temporale (turni, giorni, ecc.).

z Se la variabilità del disturbo è nota e controllabile, si può

usare la tecnica dei blocchi; se il fattore di disturbo è noto, osservabile ma non controllabile, si può usare

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 9

noto, osservabile ma non controllabile, si può usare l’analisi di covarianza per rimuovere l’effetto del fattore di disturbo dall’analisi.

z Se il fattore di disturbo non è né noto né controllabile (a

“variabile nascosta”), si spera che la randomizzazione equilibri la sua influenza nei confronti dell’esperimento.

PRINCIPI E FASI DEL DOE

Le linee guida per la pianificazione ed analisi degli esperimenti sono le seguenti:

„ Identificazione e formulazione del problema. „ Scelta dei fattori, livelli ed intervalli.

„ Identificazioni dei blocchi e delle covariate. „ Selezione della variabile di risposta.

„ Scelta del piano sperimentale:

9 determinazione del numero di repliche;

9 assegnazione del materiale sperimentale ai trattamenti; 9 definizione dell’ordine di esecuzione delle prove.p

„ Esecuzione dell’esperimento.

„ Analisi statistica dei dati mediante metodi ANOVA

(Analysis of Variance).

„ Conclusioni e raccomandazioni (eventuale pianificazione

(6)

ANOVA AD UNA VIA

z Consideriamo un esperimento in cui è presente un unico

fattore di interesse (% di cemento, spessore, tipo additivo, fornitore, ecc.) che può assumere a livelli.

z Il primo step è la progettazione dell’esperimento (DoE):p o s ep è a p oge a o e de espe e o ( o ) „ stabilire in numero di repliche sperimentali n e quindi il

numero totale di prove: N = a× n;

„ assegnare in modo casuale il materiale sperimentale

(N provini) agli a trattamenti (1° randomizzazione);

„ stabilire l’ordine di esecuzione delle N prove (2°

randomizzazione)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 11

randomizzazione).

z Il modello di rappresentazione dei dati:

Yij= µ + τjij = µjij, i=1,...,n, j =1,…,a

dove µ è la media generale, τj è l’effetto del j-th trattamento (livello del fattore),Σjτj=0,εij∼IIN(0,σ2).

ANOVA AD UNA VIA

ƒ Il cambiamentodel peso % di cotone cambia la resistenza cambia la resistenza media a trazione? ƒ C’è un livello ottimale di percentuale di cotone?

(7)

z L’obiettivo è stabilire (testate) se al variare degli a livelli

del fattore di interesse la risposta subisce (mediamente) degli scostamenti (variazioni significative).

z Il problema inferenziale riferibile a questo contesto è noto

ANOVA AD UNA VIA

p q

come “ANOVA ad una via” :

„ H01= … =τa= 0 (oµ1= … =µa)

vs. H1:∃τj ≠ 0 (or ∃µj≠µh, j,h = 1,…,a; j≠ h)

se l’ipotesi nulla viene rigettata, allo sarà di interesse approfondire l’analisi considerando

„ H :µ =µ j h = 1 C; j≠ h;

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 13

„ H0(jh)jh, j,h = 1,…,C; j≠ h;

ovvero l’insieme delle C×(C−1)/2 verifiche di ipotesi chiamate “confronti a coppie o multipli”.

z Prima di tutto è necessario sviluppare un procedura

idonea a testare l’ipotesi nulla (globale) H0contro H1.

ANOVA AD UNA VIA

z L’acronimo ANOVA − “ANalysis Of Variance” si riferisce

al fatto che la variabilità totale della variabile risposta viene ripartita in componenti che sono coerenti con il modello di rappresentazione dei dati dell’esperimento.pp p

z La variabilità totale SST viene rappresentata dalla

somma totale dei quadrati:

z La partizione ANOVA viene definita come:

2 .. 1 1 ( ) a n T ij j i SS y y = = =

∑∑

− 2 2 ( ) [( ) ( )] a n a n yy = yy + yy

∑∑

..

∑∑

. .. . 1 1 1 1 2 2 . .. . 1 1 1 ( ) [( ) ( )] ( ) ( ) ij j ij j j i j i a a n j ij j j j i T Trattamenti E y y y y y y n y y y y SS SS SS = = = = = = = = + = − + − = +

∑∑

∑∑

∑∑

(8)

V l i l i di SS ifl l i l i d i T Trattamenti E

SS

=

SS

+

SS

ANOVA AD UNA VIA

„ Valori elevati di SSTrattamenti riflettono elevati valori dei

parametri τj e quindi grandi differenze nelle medie dei trattamenti (evidenza contro H0);

„ Piccoli valori di SSTrattamentisuggeriscono che non ci sono

differenze nelle medie dei trattamenti (ovvero che i τj sono tutti uguali a zero; evidenza a favore di H0);

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 15 „ Mentre le somme dei quadrati non possono essere

direttamente confrontate tra loro (il numero di addendi è diverso), possono invece essere confrontati i cosiddetti quadrati medi definiti come la somma dei quadrati diviso i corrispondenti gradi di libertà.

„ I quadrati medi sono definiti come la somma dei quadrati

diviso i corrispondenti gradi di libertà :

1 1 ( 1)

Totale Trattamenti Errore

df df df

an a a n

= +

− = − + −

ANOVA AD UNA VIA

„ Se Ie medie dei trattamenti fossero tutte uguali (τj tutti

uguali a zero), i quadrati medi dei trattamenti e dell’errore sarebbero (teoricamente) anche’essi uguali.

1 1 ( 1) , 1 ( 1) Trattamenti E Trattamenti E an a a n SS SS MS MS a a n = + = = − −

„ Se Ie medie dei trattamenti fossero diverse, i quadrati

medi dei trattamenti sarebbero maggiori dei quadrati medi dell’errore. Ne consegue che, calcolando il rapporto tra i due quadrati medi, possiamo ottenere una misura dell’evidenza empirica contro l’ipotesi H0.

(9)

„ Questi calcoli vengono usualmente riportati nella

cosiddetta tabella dell’Analisi della Varianza:

ANOVA AD UNA VIA

„ La distribuzione di riferimento della statistica test F è la

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 17 „ La distribuzione di riferimento della statistica test F0è la

distribuzione F(a−1,N−a) (F di Fisher con a−1 e N−a gdl).

„ L’ipotesi nulla (uguaglianza delle medie dei trattamenti)

deve essere rifiutata se

oss ;a 1,N a

F

>

F

α

Output dell’esperimento di resistenza alla trazione (tabella ANOVA e dotplot con medie campionarie):

ANOVA AD UNA VIA

en g h t 25 20 15

Dotplot of Strenght vs Cotton%

p )

General Linear Model: Strenght versus Cotton%

Factor Type Levels Values

Cotton% fixed 5 15; 20; 25; 30; 35

Analysis of Variance for Strenght, using Adjusted SS for Tests

Cotton% St r 35 30 25 20 15 10 5 y g g j

Source DF Seq SS Adj SS Adj MS F P Cotton% 4 475.76 475.76 118.94 14.76 0.000 Error 20 161.20 161.20 8.06

Total 24 636.96

(10)

ANOVA AD UNA VIA

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 19 „ Qual è il meccanismo di funzionamento e perché il

metodo ANOVA funziona correttamente?

2 2

1 0 ( 1)

2 2

Stiamo campionando da popolazioni normali, quindi se è vera, e Treamtents E a a n SS SS H − − ∼χ ∼χ σ σ

ANOVA AD UNA VIA

il teorema di Cochran prova l'independenza di queste due variabili casuali di tipo chi-quadrato.

Qu σ σ 2 1 0 2 1, ( 1) ( 1) / ( 1) / ( 1) indi / [ ( 1)] / [ ( 1)] Trattmenti a a a n E a n a SS a a F F SS a n a n − − − − − − = − ∼ − ∼ χ χ 2 1 2 2 Infine, ( ) e ( ) 1

Perciò un test unilateriale (coda destra) risulta essere appropriato

j j Trattmenti E n E MS E MS a F = = + = −

τ σ σ .

(11)

Quando il fattore di interesse è tipo numerico, si può applicare all’esperimento anche un modello alternativo di rappresentazione dei dati detto modello di regressione (polinomiale):

ANOVA AD UNA VIA

(p ) Yi= β0+ Σq s=1βsXsii, i=1,...,n, enght 25 20 15

Scatterplot of Strenght vs Cotton%

Nel caso dell’esperimento di resistenza alla trazione, assumendo un polinomio di terzo grado, otteniamo un

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 21

Cotton% St re 35 30 25 20 15 15 10 5 modello empirico che ci

consente di stabilire che la percentuale di cotone che massimizza la risposta è attorno al 28-29%.

ANOVA AD UNA VIA

ƒ Il controllo delle assunzioni attraverso l’analisi dei residuiè una fase importante.

ƒ Le assunzioni sono riassunte inεij∼IIN(0,σ2), ovvero

1 Normalità 1. Normalità

2. Varianza costante (omoschedasticità) 3. Indipendenza

del termine di errore casuale ε (non osservabile) che compare nel modello di rappresentazione dei dati.

ƒ I residui sono definiti come

e

ij

=

y

ij

y

ˆ

ij

=

y

ij

y

i. ovvero come la differenza tra dato osservato e valore previsto da modello.

ƒ Se gli errori rispettassero le assunzioni, i residui (da

considerare delle realizzazioni della variabile casuale

(12)

99 90

5.0

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Strenght

ANOVA AD UNA VIA

Residual Pe rc e n t 5.0 2.5 0.0 -2.5 -5.0 90 50 10 1 Fitted Value Re si d ua l 20.0 17.5 15.0 12.5 10.0 2.5 0.0 -2.5 -5.0 4.8 5.0

Histogram of the Residuals Residuals Versus the Order of the Data

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 23

Residual Fr e qu e nc y 6 4 2 0 -2 -4 3.6 2.4 1.2 0.0 Observation Order Re si du a l 24 22 20 18 16 14 12 10 8 6 4 2 2.5 0.0 -2.5 -5.0

„ L’esito di un esperimento dipende da molti aspetti, incluso

quale tipo di esperimento viene proposto, come sarà condotto, le risorse e lasensitività desiderata.

„ La sensitività si riferisce alladifferenza tra le medie che

ANOVA AD UNA VIA

La sensitività si riferisce alladifferenza tra le medie che lo sperimentatore desidera mettere in evidenza.

„ Generalmente, al crescere del numero di repliche cresce la sensitività nel senso che diventano più facile mettere in evidenza anche piccole differenze tra le medie.

„ Si può pensare di scegliere una dimensione campionaria

opportuna per indagare una specifica differenza tra le opportuna per indagare una specifica differenza tra le medie a prefissati e desiderati valori di errore di I e II tipo.

„ Errore di I Tipo: – rifiutare H0quando è vera (α). „ Errore di II Tipo: non rifiutare H0quando è falsa (β). „ Potenza = 1−β: rifiutare H0quando è falsa.

(13)

„ A questo scopo sono state sviluppate le curve OC

(operative caratteristiche) per il modello ad effetti fissi.

„ Un modo molto comune per usare queste carte è definire

una differenza tra due medie d di interesse il minimo

ANOVA AD UNA VIA

una differenza tra due medie d di interesse, il minimo valore di d/σ è

„ Tipicamente funziona in termini di rapporto tra Φ2: si

ricercano valori di n fino a che non sia raggiunta la 2 2 2

2

nD

a

σ

Φ =

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 25

potenza desiderata.

ANOVA AD UNA VIA

(14)

ANOVA AD UNA VIA

„ Potenza del test nel caso del test a due campioni.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 27

d =⏐δ⏐/ σ

ANOVA AD UNA VIA

„ Potenza del test nel caso dell’ANOVA ad una via.

β = 0.10

β ≈ 0.40

(15)

„ Il metodo dell’analisi della varianza sottopone a verifica

l’ipotesi di uguaglianza delle medie dei trattamenti (delle medie degli a livelli del fattore di interesse).

„ Se questa ipotesi viene rigettata, non sappiamo però

CONFRONTI MULTIPLI

quale specifica media differisce (si veda la specificazione dell’ipotesi alternativa).

„ Stabilire quali specifiche medie differiscono a seguito di

una analisi ANOVA viene chiamato problema dei Confronti Multipli (o Confronti a Coppie).

„ Ci sono diverse per affrontare questo problema.

C id i i i t tt il t d d i t t t i

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 29

Consideriamo innanzi tutto il metodo dei t-test a coppie sulle differenze delle medie, chiamato metodo Fisher’s Least Significant Difference – LSD:

0= 2 j h N a E Y Y T t MS n − − ⋅ i i

„ Si rigetta l’ipotesi nulla H0(jh)jh, j,h=1,…,a; j ≠ h se

„ È importante notare che quando il numero di confronti

che da realizzare simultaneamente cresce (a aumenta)

/2;

|

|

/2;

2

oss N C j h N C E

t

>

t

α

y

i

y

i

>

LSD t

=

α

MS n

CONFRONTI MULTIPLI

che da realizzare simultaneamente cresce (a aumenta), la probabilità di identificare almeno un falso positivo (un test statisticamente significativo, quando invece è vera l’ipotesi nulla H0(jh)), aumenta anch’esso.

„ Questo problema (noto come multiplicity issue –

questione della molteplicità) è legato al controllo dell’errore di I tipo globale (relativo a tutti i confronti) che dell errore di I tipo globale (relativo a tutti i confronti) che tende a crescere all’aumentare del numero di confronti.

„ Allo scopo di superare facilmente il problema, si deve

applicare la cosiddetta correzione di Bonferroni:

α*=α/a×(a−1)/2, cioè si utilizza non l’α nominale ma corretto in modo che l’errore globale sia ≤α.

(16)

No. of Sim. y11 y21 y31 y41 y12 y22 y32 y42 y13 y23 y33 y43 y1-bar y2-bar y3-bar y-bar SSTreat SSE F0 p -value check 1 69.766 68.348 72.404 70.104 69.52 70.154 68.752 69.022 70.856 69.391 70.579 69.459 70.16 69.36 70.07 69.86 1.52 11.33 0.60 0.57 0 2 71.372 69.187 70.751 70.032 69.069 69.963 69.595 71.101 69.017 70.627 71.64 67.933 70.34 69.93 69.80 70.02 0.61 13.05 0.21 0.81 0 3 70.389 70.769 69.088 70.138 69.714 69.854 71.151 70.063 67.638 71.361 70.409 71.842 70.10 70.20 70.31 70.20 0.09 13.43 0.03 0.97 0 4 68.955 70.158 68.837 70.015 69.312 70.309 69.77 70.547 68.793 70.317 70.007 69.599 69.49 69.98 69.68 69.72 0.50 3.66 0.61 0.56 0 5 70.729 68.182 72.48 69.227 70.17 71.541 70.261 70.586 69.168 69.275 69.328 70.646 70.15 70.64 69.60 70.13 2.14 13.13 0.74 0.51 0 6 70 088 69 199 71 592 68 91 71 039 71 452 69 386 69 706 70 099 69 438 70 736 70 151 69 95 70 40 70 11 70 15 0 41 8 23 0 23 0 80 0

CONFRONTI MULTIPLI

6 70.088 69.199 71.592 68.91 71.039 71.452 69.386 69.706 70.099 69.438 70.736 70.151 69.95 70.40 70.11 70.15 0.41 8.23 0.23 0.80 0 7 70.645 69.306 72.181 69.608 72.025 67.441 69.875 69.108 69.553 70.439 69.757 69.299 70.44 69.61 69.76 69.94 1.54 16.62 0.42 0.67 0 8 68.873 69.134 70.064 69.596 70.864 68.661 69.872 70.129 70.772 70.766 69.638 70.013 69.42 69.88 70.30 69.87 1.55 4.30 1.62 0.25 0 9 68.404 71.883 69.832 69.208 69.942 68.029 69.812 69.846 69.16 70.393 69.001 69.561 69.83 69.41 69.53 69.59 0.38 10.34 0.17 0.85 0 10 69.773 71.273 69.233 69.93 70.873 70.795 70.352 72.419 71.373 70.14 70.84 71.224 70.05 71.11 70.89 70.69 2.50 5.61 2.01 0.19 0 11 70.531 71.152 69.849 69.304 70.254 71.698 71.459 69.877 69.753 71.691 70.43 69 70.21 70.82 70.22 70.42 0.99 8.25 0.54 0.60 0 12 68.733 70.244 71.16 68.205 69.138 69.725 70.119 68.39 69.914 69.703 70.951 69.788 69.59 69.34 70.09 69.67 1.16 8.26 0.63 0.55 0 13 70.909 70.885 70.421 70.894 68.937 70.287 71.363 68.939 70.798 68.961 70.82 69.629 70.78 69.88 70.05 70.24 1.81 6.83 1.19 0.35 0 14 70.336 68.647 71.108 70.2 69.555 70.926 69.723 69.165 70.571 69.63 69.518 68.078 70.07 69.84 69.45 69.79 0.79 8.10 0.44 0.66 0 15 71.615 68.202 70.451 69.147 69.636 68.528 70.499 67.774 70.307 69.173 69.631 69.566 69.85 69.11 69.67 69.54 1.20 11.68 0.46 0.64 0 16 69.135 69.957 70.714 70.449 70.293 70.009 72.263 70.544 70.425 68.38 70.824 69.406 70.06 70.78 69.76 70.20 2.18 8.14 1.21 0.34 0 17 71.436 70.123 71.512 70.275 70.748 69.109 69.581 71.118 69.585 69.132 71.866 70.581 70.84 70.14 70.29 70.42 1.08 8.75 0.55 0.59 0 18 69.891 68.729 70.336 68.246 68.899 69.881 69.993 69.877 70.246 70.899 70.378 70.927 69.30 69.66 70.61 69.86 3.67 4.01 4.12 0.05 0 19 69.731 70.15 69.761 69.744 70.378 69.346 70.651 70.552 71.551 68.908 70.082 71.435 69.85 70.23 70.49 70.19 0.85 5.90 0.65 0.55 0 20 71.194 70.01 71.634 70.829 71.332 69.999 70.734 71.097 69.437 68.966 71.184 68.394 70.92 70.79 69.50 70.40 4.95 6.78 3.28 0.08 0 21 71.549 68.581 70.755 69.638 68.305 70.814 69.403 70.589 72.319 71.912 69.575 70.89 70.13 69.78 71.17 70.36 4.22 13.58 1.40 0.30 0 22 70.477 70.355 68.928 70.944 70.765 70.319 69.549 72.001 70.904 69.34 70.149 70.958 70.18 70.66 70.34 70.39 0.48 7.17 0.30 0.75 0 23 71.031 70.321 69.518 68.971 70.078 69.801 68.583 69.734 69.372 70.339 70.782 70.055 69.96 69.55 70.14 69.88 0.73 4.81 0.68 0.53 0

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 31

24 69.702 68.845 70.705 69.416 71.434 69.811 71.928 70.289 68.157 70.436 70.969 69.64 69.67 70.87 69.80 70.11 3.45 9.21 1.69 0.24 0 25 70.001 68.594 69.646 71.155 69.993 71.381 72.179 70.745 67.652 69.393 70.697 69.715 69.85 71.07 69.36 70.10 6.21 10.77 2.60 0.13 0 26 68.072 70.381 69.37 69.098 66.921 70.523 67.981 70.498 70.286 68.404 70.307 69.109 69.23 68.98 69.53 69.25 0.60 15.25 0.18 0.84 0 27 69.682 70.344 69.8 70.656 68.781 69.609 68.478 70.903 70.931 70.254 70.234 67.669 70.12 69.44 69.77 69.78 0.92 10.37 0.40 0.68 0 28 67.321 69.995 69.874 69.159 71.264 69.044 68.961 70.404 70.736 68.72 71.224 69.534 69.09 69.92 70.05 69.69 2.19 12.18 0.81 0.48 0 29 70.504 71.244 71.268 71.255 71.241 69.642 70.786 71.369 69.074 69.61 70.484 69.826 71.07 70.76 69.75 70.53 3.81 3.30 5.20 0.03 1 30 69.981 69.19 69.964 69.979 68.836 69.522 71.17 68.36 70.186 70.101 70.209 69.947 69.78 69.47 70.11 69.79 0.82 5.03 0.73 0.51 0 31 70.45 68.606 69.884 69.549 71.331 70.187 70.876 69.972 70.106 71.078 70.593 69.868 69.62 70.59 70.41 70.21 2.13 3.83 2.50 0.14 0 32 70.096 69.601 70.207 70.574 70.918 69.601 70.478 69.089 71.305 69.52 68.993 69.893 70.12 70.02 69.93 70.02 0.07 5.48 0.06 0.94 0 33 69.809 69.719 72.207 71.647 70.253 68.796 69.794 70.678 68.996 70.85 70.094 68.272 70.85 69.88 69.55 70.09 3.61 10.73 1.52 0.27 0 34 70.679 69.745 69.436 68.978 69.762 69.403 70.577 71.559 67.944 71.022 70.685 70.327 69.71 70.33 69.99 70.01 0.76 10.15 0.34 0.72 0

„ In alternativa (e con esito ovviamente equivalente), si

può opportunamente aggiustare il valore del p-value:

p* = p ⋅ a×(a−1)/2.

„ L’inconveniente del metodo della correzione di

CONFRONTI MULTIPLI

„ L inconveniente del metodo della correzione di

Bonferroni è evidente: al crescere del numero di confronti a coppie diminuisce la potenza complessiva della procedura e questo a causa di un aumento dell’errore di II tipo.

„ Si dice che la correzione di Bonferroni è eccessivamente

ti ( ti il i tt d l li ll i l

conservativa (garantisce il rispetto del livello nominale ma a discapito della potenza) e questo è causato dal fatto che l’effettivo valore dell’errore family-wise (dell’intera set di verifiche di ipotesi) può risultare anche molto inferiore al livello prescelto α.

(17)

„ Una metodo alternativo (un po’ più potente) è la

cosiddetta procedura di Tukey (o Tukey-Cramer) del range studentizzato:

CONFRONTI MULTIPLI

dove Q è la statistica del range studentizzato, i cui percentili sono stati tabulati per diversi valori di a e N−a (i gradi di libertà dell’MSE).

max min ; = 2 E C N C Y Y Q q MS n − − ⋅ ∼

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 33 „ Si rigetta l’ipotesi nulla H0(jh)jh, j,h=1,…,a; j ≠ h se

( ;

)

j h E

y

y

HSD q c N a

MS n

i

i

>

=

α

− ⋅

( ;

)

oss

q

>

q a N a

α

Bonferroni Simultaneous Tests Response Variable Strenght

All Pairwise Comparisons among Levels of Cotton% Cotton% = 15 subtracted from:

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 20 5.600 1.796 3.1188 0.0541 25 7.800 1.796 4.3441 0.0031

Tukey Simultaneous Tests Response Variable Strenght

All Pairwise Comparisons among Levels of Cotton% Cotton% = 15 subtracted from:

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 20 5.600 1.796 3.1188 0.0385 25 7.800 1.796 4.3441 0.0026

CONFRONTI MULTIPLI

30 11.800 1.796 6.5718 0.0000 35 1.000 1.796 0.5569 1.0000 Cotton% = 20 subtracted from:

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 25 2.200 1.796 1.225 1.0000 30 6.200 1.796 3.453 0.0251 35 -4.600 1.796 -2.562 0.1859 Cotton% = 25 subtracted from:

30 11.800 1.796 6.5718 0.0000 35 1.000 1.796 0.5569 0.9798 Cotton% = 20 subtracted from:

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 25 2.200 1.796 1.225 0.7373 30 6.200 1.796 3.453 0.0189 35 -4.600 1.796 -2.562 0.1163 Cotton% = 25 subtracted from:

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 30 4.000 1.796 2.228 0.3754 35 -6.800 1.796 -3.787 0.0116 Cotton% = 30 subtracted from:

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 35 -10.80 1.796 -6.015 0.0001

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 30 4.000 1.796 2.228 0.2101 35 -6.800 1.796 -3.787 0.0091 Cotton% = 30 subtracted from:

Difference SE of Adjusted Cotton% of Means Difference T-Value P-Value 35 -10.80 1.796 -6.015 0.0001

(18)

„ Formalmente, la questione della molteplicità è legata al

problema del controllo degli errori inferenziali di tutto l'insieme della famiglia delle S=a×(a−1)/2 ipotesi nulle.

„ Le procedure per i confronti multipli − MCPs (Multiple

CONFRONTI MULTIPLI

p p p ( p

Comparisons Procedures) sono metodi dedicati al controllo del cosiddetto FWER (Family-wise Error Rate).

„ In senso forte, FWER è la probabilità di rigettare almeno

una ipotesi nulla vera Hi contenuta in un sottoinsieme di ipotesi nulle S, formalmente:

FWER(S) = Pr (Rigettare almeno una H0i, i ∈ S | H0i è

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 35

( ) ( g 0i, | 0i

vera per tutti gli i ∈ S).

„ Mentre i metodi di Bonferroni e Tukey sono tipicamente

procedure di tipo single-step, in letteratura sono state proposte delle procedure MCPs di tipo step-wise che si rivelano più potenti nel controllo dell’FWER.

metodo diBonferroni-Holm:

„ si ordinano i p-value dal più piccolo al più grande, ovvero

p(1)<p(2)<…< p(S);

„ il primo p-value p(1)viene testato a livello di significatività

CONFRONTI MULTIPLI

il primo p value p(1)viene testato a livello di significatività

α/S. Se p(1)>α/S la corrispondente ipotesi nulla non può

essere rifiutata e possiamo concludere che anche tutte le altre ipotese nulle sono vere;

„ se p(1)≤α/S si deve proseguire con il secondo p-value

ordinato, ma a livello α/(S−1), e così via, e l’s-esimo p-value sarà confrontato con il livello α/(S−s+1) fino a che value sarà confrontato con il livello α/(S s+1), fino a che una ipotesi nulla non verrà rifiutata (o fino che si arriva al

(19)

metodo diBonferroni-Holm-Shaffer:

„ si ordinano i p-value dal più piccolo al più grande, ovvero

p(1)<p(2)<…< p(S);

„ l’s-esimo p-value deve essere confrontato con il livello di

CONFRONTI MULTIPLI

l s esimo p value deve essere confrontato con il livello di significatività α/S*, dove S* rappresenta il numero

massimo di possibili ipotesi nulle vere al passo s-esimo della procedura, condizionate al numero di rifiuti ottenuti al passo precedente:

Ordered p-value

No of groups (C) and of

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 37 No. of groups (C) and of

pair-wise comparisons (S) p(1) p(2) p(3) p(4) p(5) p(6) p(7) p(8) p(9) p(10) p(11) p(12) p(13) p(14) p(15) C = 3 – S = 3 3 1 1 C = 4 – S = 6 6 3 3 3 2 1 C = 5 – S = 10 10 6 6 6 6 4 4 3 2 1 C = 6 – S = 15 15 10 10 10 10 10 7 7 7 6 4 4 3 2 1

BLOCCO E COVARIATA

„ Blocco e covariata rappresentano due tipologie di fattore

di disturbo noto di cui è possibile tener debitamente conto per fare in modo che lo studio sul possibile effetto dei fattori di interesse sulla risposta sia condotto in modo appropriato.

„ Blocco: si tratta di un fattore di disturbo noto e

controllabile (quasi sempre di tipo qualitativo) che molto probabilmente produce sulla risposta un effetto, che non interessa però allo sperimentatore. Tuttavia la variabilità che trasmette alla risposta deve essere minimizzata.

„ Tipici fattori di disturbo/blocco sono: lotti di materiale „ Tipici fattori di disturbo/blocco sono: lotti di materiale

grezzo, operatori, provini, attrezzature, il fattore temporale (turni, giorni, ecc.).

„ La presenza del fattore di blocco incide sul problema da

due punti di vista: 1. in sede di pianificazione dell’esperimento e 2. in sede di analisi statistica dei dati.

(20)

BLOCCO

„ Il blocco, in sede di pianificazione, rappresenta una

restrizione alla randomizzazione, nel senso che la randomizzazione dovrà essere vincolata in modo tale da essere realizzata indipendentemente per ciascuno dei b livelli del fattore di blocco B.

„ Il fattore di blocco verrà formalmente incluso nel modello

statistico di rappresentazione dei dati (ANOVA una via): Yijk= µ + τi+ βj+ εijk,

con i=1,...,a, j=1,...,b, k=1,...n.

„ Quindi, al momento di eseguire l’analisi statistica, una

parte della variabilità totale verrà assegnata all’effetto del

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 39

parte della variabilità totale verrà assegnata all effetto del blocco, e di conseguenza la tabella dell’ANOVA conterrà una riga aggiuntiva in cui si potrà eseguire una formale verifica di ipotesi sulla significatività del fattore di blocco, ovvero si sottoporrà a verifica l’ipotesi H0B: β1=…=βb=0 contro H1B: βj≠ 0 per almeno un livello j.

BLOCCO

„ Esempio: per studiare le prestazioni di resistenza di travi

di cemento in relazione ai giorni di stagionatura (3,7,28), si utilizzano due distinte macchine (A,B) per la conduzione della prova sperimentale, misurando sup p , alcuni provini la forza massima di rottura.

„ Modello statistico:

Yijk=µ +τi+ βjijk i=3,7,28; j=A,B; k=1,…,4

„ Statistica descrittiva:

40000

Boxplot of Forza Max by Stagion

40000

Boxplot of Forza Max by Macchina

Stagion Fo rz a M a x 28 7 3 35000 30000 25000 20000 Macchina Fo rz a M a x B A 35000 30000 25000 20000

(21)

BLOCCO

of Fo rza M ax 40000 37500 35000 32500 Stagion Macchina

Main Effects Plot (fitted means) for Forza Max

Factor Type Levels Values Stagion fixed 3 3; 7; 28 Macchina fixed 2 A; B Analysis of Variance for Forza Max

Source DF Seq SS Adj SS Adj MS F P

Me an o 28 7 3 30000 27500 25000 B A 99 1000

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Forza Max

Stagion 2 887893652 887893652 443946826 856.72 0.000 Macchina 1 44772836 44772836 44772836 86.40 0.000 Error 20 10363813 10363813 518191

Total 23 943030301

S = 719.855 R-Sq = 98.90% R-Sq(adj) = 98.74%

Tukey Simultaneous Tests Response Variable Forza Max

All Pairwise Comparisons among Levels of Stagion Stagion = 3 subtracted from:

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 41

Residual Pe rc en t 2000 1000 0 -1000 -2000 99 90 50 10 1 Fitted Value Re si du al 40000 35000 30000 25000 1000 500 0 -500 -1000 Residual Fr eq ue n cy 1000 500 0 -500 -1000 -1500 8 6 4 2 0 Observation Order Re si du a l 24 22 20 18 16 14 12 10 8 6 4 2 1000 500 0 -500 -1000

Histogram of the Residuals Residuals Versus the Order of the Data

Difference SE of Adjusted Stagion of Means Difference T-Value P-Value 7 11670 359.9 32.42 0.0000 28 13856 359.9 38.50 0.0000 Stagion = 7 subtracted from:

Difference SE of Adjusted Stagion of Means Difference T-Value P-Value 28 2185 359.9 6.072 0.0000

BLOCCO

„ Nel caso sia pari ad 1 il numero di repliche per

trattamento (definito dalle a×b combinazioni dei livelli del fattore di interesse A e del fattore di blocco B), il modello statistico di rappresentazione dei dati diventa:

Yij= µ + τi+ βj+ εij, con i=1,...,a, j=1,...,b.

e si parla in questo caso di RCB (Randomized Complete Block) design.

„ Si consideri uno studio dove si vuole determinare se 4

differenti punte (Tip) producono diverse durezze (in media) leggendole in un durometro Rockwell. I 4 coupon a disposizione sono

a disposizione sono piuttosto disomogenei, quindi vengono trattati come fattore di blocco (è possibile applicare

(22)

BLOCCO

„ Da notare la struttura a due vie dell’esperimento.

„ Ancora una volta, siamo interessati a testare

l’uguaglianza delle medie dei trattamenti (punte dei penetratori), ma bisogna rimuovere la variabilità associata al fattore di disturbo (blocchi, ovvero i coupon).

„ La variabilità totale deve essere scomposta

considerando anche il fattore di blocco:

2 2 .. . .. . .. . . .. 1 1 1 1 2 2 2 ( ) [( ) ( ) ( )] ( ) ( ) ( ) a b a b ij i j ij i j i j i j a b a b i j ij i j y y y y y y y y y y b y y a y y y y y y = = = = − = − + − + − − + = + − + − + − − +

∑∑

∑∑

∑∑

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 43 „ I gradi di libertà per la somma dei quadrati sono:

ab− 1 = (a − 1) + (b − 1) + (a − 1)×(b − 1) . .. . .. . . .. 1 1 1 1 ( i ) ( j ) ( ij i j ) i j i j T Trattamenti Blocchi E y y y y y y y y SS SS SS SS = = = = = + +

∑∑

BLOCCO

„ I rapporti tra le somme dei quadrati e i rispettivi gdl

definiscono i quadrati medi, e il rapporto tra il quadrato medio dei trattamenti e il quadrato medio dell’errore definisce una statistica F che può essere usata per testare l’ipotesi di uguaglianza delle medie tra gli a livelli del fattore di interesse.

(23)

BLOCCO

Factor Type Levels Values

Tip fixed 4 1; 2; 3; 4 Coupon fixed 4 1; 2; 3; 4 Analysis of Variance for Hardness

Source DF Seq SS Adj SS Adj MS F P Tip 3 0.38500 0.38500 0.12833 14.44 0.001 Coupon 3 0.82500 0.82500 0.27500

Error 9 0.08000 0.08000 0.00889 Total 15 1.29000

S = 0.0942809 R-Sq = 93.80% R-Sq(adj) = 89.66%

Tukey Simultaneous Tests Response Variable Hardness

All Pairwise Comparisons among Levels of Tip Tip = 1 subtracted from:

Difference SE of Adjusted Tip of Means Difference T-Value P-Value 2 0.0250 0.06667 0.375 0.9809 3 -0.1250 0.06667 -1.875 0.3028 4 0.3000 0.06667 4.500 0.0067 Tip = 2 subtracted from:

Difference SE of Adjusted Factor Type Levels Values

Tip fixed 4 1; 2; 3; 4

Source DF Seq SS Adj SS Adj MS F P Tip 3 0.38500 0.38500 0.12833 1.70 0.220 Error 12 0.90500 0.90500 0.07542

Total 15 1.29000

S = 0.274621 R-Sq = 29.84% R-Sq(adj) = 12.31%

10.0 Coupon Tip

Main Effects Plot (fitted means) for Hardness

99

90 0.1

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Hardness

Difference SE of Adjusted Tip of Means Difference T-Value P-Value 3 -0.1500 0.06667 -2.250 0.1816 4 0.2750 0.06667 4.125 0.0113 Tip = 3 subtracted from:

Difference SE of Adjusted Tip of Means Difference T-Value P-Value 4 0.4250 0.06667 6.375 0.0006

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 45

Me an o f Ha rd ne ss 4 3 2 1 9.9 9.8 9.7 9.6 9.5 9.4 4 3 2 1 Residual Pe rc en t 0.2 0.1 0.0 -0.1 -0.2 50 10 1 Fitted Value Re si du al 10.2 9.9 9.6 9.3 0.0 -0.1 Residual Fr eq ue n cy 0.16 0.12 0.08 0.04 0.00 -0.04 -0.08 -0.12 4.8 3.6 2.4 1.2 0.0 Observation Order Re si du a l 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0.1 0.0 -0.1

Histogram of the Residuals Residuals Versus the Order of the Data

BLOCCO

„ L’RCB design utilizza un modello additivo: è importante

notare che nessuna interazione tra trattamenti e blocchi è ammessa.

„ La presenza simultanea di due fonti di variabilità di

di t b bbli l’ tili di lt i ti l i di i disturbo obbliga l’utilizzo di un ulteriore tipologia di piano sperimentale: ilpiano a quadrati Latini.

„ Anche in questo caso, una assunzione importante è che

i trattamenti e i 2 fattori di disturbo non interagiscono.

„ Esempio di quadrato latino 5×5:

„ In caso via siano 3 fattori i blocco, si utilizza il piano a quadrati Greco-Latini.

(24)

COVARIATA

„ Se il fattore di disturbo è noto, osservabile ma non

controllabile, si può usare l’analisi della covarianza per rimuovere l’effetto del fattore di disturbo dall’analisi.

„ Tipiche covariate sono: temperatura, umidità, ecc. (in

generale variabili continue che caratterizzano il generale variabili continue che caratterizzano il contesto/l’ambiente sperimentale).

„ La presenza di (una o più) covariate non incide nella

pianificazione, ma solo nella fase di analisi statistica.

„ Il modello statistico di rappresentazione dei dati diventa:

Yij= µ + τi+ Xijγ + εij, con i=1,...,a, j=1,..., n,

dove Xijè il valore della(e) covariata(e).

in sede di analisi statistica na parte della ariabilità

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 47 „ in sede di analisi statistica, una parte della variabilità

totale verrà assegnata all’effetto della covariata e la tabella dell’ANOVA conterrà una riga aggiuntiva in cui si potrà eseguire una formale verifica di ipotesi sulla significatività della covariata, ovvero si sottoporrà a verifica l’ipotesi H0COV:γ =0 contro H1COV:γ ≠ 0.

COVARIATA

„ In uno studio sulle proprietà meccaniche di un nuova

barra di fibra di carbonio si vogliono confrontare le prestazioni in termini di tensione di rottura rispetto a tre diversi fornitori (A,B,C). Nel condurre le prove si è voluto tenere conto della massa lineica delle barre, in quanto è possibile che anche da essa possa dipendere in modo rilevante la tensione stessa.

Factor Type Levels Values Fornitore fixed 3 A; B; C

Analysis of Variance for Tensione rottura

e a n o f T e ns io ne r o tt ur a 3500 3000 2500 2000

Main Effects Plot (fitted means) for Tensione rottura

Term Coef SE Coef T P Constant -2198 1113 -1.98 0.055 Massa lineica 29.690 6.737 4.41 0.000 Source DF SS MS F P Massa lineica 1 264056 2264056 19.42 0.000 Fornitore 2 2649091 1324546 11.36 0.000 Error 41 4779190 116566 Total 44 7444345 Fornitore M e C B A 1500 1000

(25)

COVARIATA

All Pairwise Bonferroni Simultaneous Comparisons among Levels of Fornitore Fornitore = A subtracted from:

Difference SE of Adjusted Fornitore of Means Difference T-Value P-Value B -2473 557.2 -4.438 0.0002 C -107 137.5 -0.778 1.0000 Fornitore = B subtracted from:

Difference SE of Adjusted Fornitore of Means Difference T-Value P-Value C 2366 500.9 4.723 0.0001 P er ce nt 99 90 50 R es id ua l 800 400 0

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Tensione rottura

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 49

Residual P 500 0 -500 -1000 10 1 Fitted Value R 3000 2750 2500 2250 2000 -400 -800 Residual Fr eq ue nc y 600 400 200 0 -200 -400 -600 -800 10.0 7.5 5.0 2.5 0.0 Observation Order Re si du al 45 40 35 30 25 20 15 10 5 1 800 400 0 -400 -800

Histogram of the Residuals Residuals Versus the Order of the Data

z Nell’ANOVA a due vie si vuole stabilire se l’effetto dei due

fattori di interesse A e B e della loro interazione ha un impatto significativo sulla risposta.

z Si definisce interazione la possibile sinergia dei due

ANOVA A DUE VIE

p g

fattori che si verifica quando l’effetto del fattore A sulla risposta è diverso a seconda dei livelli del fattore B.

z Il modello di rappresentazione dei dati è il seguente:

Yijk = µ + τi+ βj+ (τβ)ij+ εijk, con i=1,...,a, j=1,...,b, k=1,...n.

z Le analisi inferenziali di interesse corrispondono alle

verifiche d’ipotesi:

ƒ

H0A1=…=τa=0 contro H1Ai≠ 0 per almeno un livello i;

ƒ

H0B: β1=…=βb=0 contro H1B: βj≠ 0 per almeno un livello j;

ƒ

H0AB: (τβ)11= …=(τβ)ab= 0 contro H1AB: (τβ)ij≠0 per almeno una combinazione di livelli ij.

(26)

Ad esempio, in uno studio sui materiali di costruzione viene misurato lo stato tensionale in relazione allo stato di degrado dei mattoni e delle malte. L’obiettivo è stabilire se degrado dei mattoni e delle malte, così come la loro interazione,

ANOVA A DUE VIE

2 5 Degr. mattoni Degr. malte

Main Effects Plot (fitted means) for Stato tens. [Mpa]

3.0 Degr.

Interaction Plot (fitted means) for Stato tens. [Mpa]

causa una variazione nello stato tensionale. I valori medi campionari della risposta, per ciascun livello dei singoli fattori (main effect plot) e per i 4 trattamenti in questione (interaction plot), possono fornire una preliminare indicazione descrittiva sul problema.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 51

M ean o f S tat o t en s. [ M pa ] SI NO 2.5 2.0 1.5 1.0 0.5 SI NO Degr. malte Me an SI NO 2.5 2.0 1.5 1.0 0.5 mattoni NO SI

Per sviluppare una formale verifica di ipotesi, per ciascuna delle tre ipotesi H0 di interesse, è necessario considerare la seguente scomposizione della somma dei quadrati della risposta.

ANOVA A DUE VIE

2 2 2 ... .. ... . . ... 1 1 1 1 1 2 2 . .. . . ... . 1 1 1 1 1 ( ) ( ) ( ) ( ) ( ) a b n a b ijk i j i j k i j a b a b n ij i j ijk ij i j i j k y y bn y y an y y n y y y y y y = = = = = = = = = = − = − + − + − − + + −

∑∑∑

∑∑

∑∑∑

p

gradi di libertà:

1

1

1 (

1)(

1)

(

1)

T A B AB E

SS

SS

SS

SS

SS

df

abn

a

b

a

b

ab n

=

+

+

+

− = − + − + −

− +

(27)

Grazie all’assunzione di normalità del termine di errore casuale, è possibile considerare tre statistiche test di tipo F, riassunte nella usuale tabella ANOVA.

ANOVA A DUE VIE

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 53

Qualora uno o più p-value fossero inferiori al livello α prefissato, si potrebbe rigettare la corrispondente ipotesi H0 e concludere che i relativi effetti sono significativi.

ANOVA A DUE VIE

Se applichiamo l’analisi inferenziale ANOVA al caso studio sul degrado delle malte otteniamo i seguenti risultati. Fissato il livello α al 5%, si può concludere che sia il degrado delle malte, sia quello dei mattoni sia la loro interazione ha un

Factor Type Levels Values Degr. mattoni fixed 2 NO; SI Degr. malte fixed 2 NO; SI

Analysis of Variance for Stato tens. [Mpa], using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P

q

effetto significativo sullo stato tensionale.

Source DF Seq SS Adj SS Adj MS F P Degr. mattoni 1 0.6765 0.6765 0.6765 56.13 0.000 Degr. malte 1 11.8164 11.8164 11.8164 980.45 0.000 Degr. mattoni*Degr. malte 1 2.1683 2.1683 2.1683 179.91 0.000 Error 12 0.1446 0.1446 0.0121

Total 15 14.8058

(28)

ANOVA A DUE VIE

Tukey Simultaneous Tests - Response Variable Stato tens. [Mpa]

ll i i i l f i* l

Grazie all’applicazione della procedura dei confronti a coppie (metodo di Tukey) possiamo affermare che tutti i 4 trattamenti differiscono significativamente tra loro (a livelloα=5%).

All Pairwise Comparisons among Levels of Degr. mattoni*Degr. malte Degr. mattoni = NO

Degr. malte = NO subtracted from:

Degr. Degr. Difference SE of Adjusted mattoni malte of Means Difference T-Value P-Value NO SI -2.455 0.07763 -31.63 0.0000 SI NO -1.147 0.07763 -14.78 0.0000 SI SI -2.130 0.07763 -27.44 0.0000 Degr. mattoni = NO

Degr. malte = SI subtracted from:

Degr. Degr. Difference SE of Adjusted

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 55

g g j

mattoni malte of Means Difference T-Value P-Value SI NO 1.3075 0.07763 16.843 0.0000 SI SI 0.3250 0.07763 4.187 0.0060 Degr. mattoni = SI

Degr. malte = NO subtracted from:

Degr. Degr. Difference SE of Adjusted mattoni malte of Means Difference T-Value P-Value SI SI -0.9825 0.07763 -12.66 0.0000

ANOVA A DUE VIE

L’analisi dei residui indica che l’assunzione di normalità del termine di errore è ragionevole, mentre vi sono delle perplessità sull’assunzione di omogeneità dalla varianza (ipotesi di omoschedasticità). ( p ) Residual Pe rc en t 0.2 0.1 0.0 -0.1 -0.2 99 90 50 10 1 Fitted Value Re si du a l 3 2 1 0.2 0.1 0.0 -0.1 -0.2

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for Stato tens. [Mpa]

Residual Fr e que ncy 0.2 0.1 0.0 -0.1 -0.2 4.8 3.6 2.4 1.2 0.0 Observation Order Re si du a l 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0.2 0.1 0.0 -0.1 -0.2

(29)

z E’ importante notare che la procedura dell’ANOVA tratta

ogni fattore come se fosse qualitativo, indipendentemente dal fatto che sia qualitativo o quantitativo.

ANOVA A DUE VIE

q

z A volte un esperimento può coinvolgere sia fattori

quantitativichequalitativi.

z Questo fatto può essere considerato nell’analisi

statistica in riferimento ad unmodello di regressione, per i fattori quantitativi a ciascun livello (o combinazione dei livelli) dei fattori qualitativi. Si tratta di una analisi

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 57

aggiuntiva (e seguente a quella ANOVA) che può essere implementata sugli stessi dati sperimentali.

z Queste curve e/o superfici di risposta sono spesso un

aiuto considerevole nell’interpretazione pratica dei risultati.

Si consideri uno studio sulla durata di vita di una batteria in funzione della temperatura di esercizio (fattore A) ed del tipo di materiale utilizzato (fattore B).

ANOVA A DUE VIE

In questo caso, separatamente per ciascun materiale, è possibile applicare anche un modello di regressione, ad es.

Yi= β0+ β1Ti+ β1Ti2+ ε

(30)

ANOVA A DUE VIE

L’applicazione dell’analisi inferenziale ANOVA a due vie al caso studio sulla durata della batteria mette in luce i seguenti risultati. Fissato il livello α al 5%, si può concludere che sia il materiale sia la temperatura di esercizio, così come la loro

Factor Type Levels Values Materiale fixed 3 1; 2; 3 Temper fixed 3 15; 70; 125

Analysis of Variance for Batteri, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P

p

interazione, hanno un effetto significativo sulla durata della batteria.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 59

Source DF Seq SS Adj SS Adj MS F P Materiale 2 10683.7 10683.7 5341.9 7.91 0.002 Temper 2 39118.7 39118.7 19559.4 28.97 0.000 Materiale*Temper 4 9613.8 9613.8 2403.4 3.56 0.019 Error 27 18230.7 18230.7 675.2 Total 35 77647.0 S = 25.9849 R-Sq = 76.52% R-Sq(adj) = 69.56%

ANOVA A DUE VIE

Analizzando i main effect e interaction plot (dopo l’analisi inferenziale) possiamo stabilire quale sia il materiale migliore e peggiore e quale sia l’effetto della temperatura (relazione inversa con la durata). Inoltre si desume che al variare del

150 140 130

Materiale Temper

Main Effects Plot (fitted means) for Durata

150 125 Materiale 3 1 2

Interaction Plot (fitted means) for Durata

)

materiale, l’effetto della temperatura non è lo stesso (ogni materiale ha un proprio profilo di durata in funzione della temperatura). Me a n of Du ra ta 3 2 1 130 120 110 100 90 80 70 60 125 70 15 Temper Me a n 125 70 15 100 75 50

(31)

ANOVA A DUE VIE

L’analisi dei residui non evidenzia alcuna criticità rispetto alle tre assunzioni (normalità, indipendenza ed omoschedasticità) sul termine di errore casuale del modello.

Residual Pe rc en t 50 25 0 -25 -50 99 90 50 10 1 Fitted Value Re si d u al 150 125 100 75 50 50 25 0 -25 -50 50

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Histogram of the Residuals Residuals Versus the Order of the Data

Residual Plots for Durata

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 61

Residual F re q ue nc y 45 30 15 0 -15 -30 -45 -60 10.0 7.5 5.0 2.5 0.0 Observation Order Re si du al 35 30 25 20 15 10 5 1 50 25 0 -25 -50

ANOVA A DUE VIE

Dal momento che uno dei due fattori è di tipo quantitativo (temperatura) è possibile stimare una curva di risposta (polinomiale di 2° grado) per ciascuno dei tre materiali. Dai risultati si possono desumere delle importanti indicazioni sul

ura ta 200 150 100 Materiale 3 1 2 Scatterplot of Durata vs Temper

profili di durata per i tre materiali.

Temper D u 140 120 100 80 60 40 20 0 50 0

(32)

In uno studio sulle frodi alimentari, si vuole stabilire se i due fattori “origine della produzione” (due livelli: standard o commerciale) e “tipo di produzione” (due livelli: allevamento o pescato) e la loro interazione hanno un impatto

ANOVA A DUE VIE

significativo sulla quantità di grasso nella carne di branzino. I valori medi campionari della risposta, per ciascun livello dei singoli fattori (main effect plot) e per i 4 trattamenti in questione (interaction plot), possono fornire una preliminare indicazione descrittiva sul problema.

Origine

Interaction Plot (fitted means) for grasso

Origine Tipo Prod

Main Effects Plot (fitted means) for grasso

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 63

Tipo Prod Me an Pescato Allevam 6 5 4 3 2 O g e Comm Std Me an of gr a ss o Std Comm 6.0 5.5 5.0 4.5 4.0 Pescato Allevam Origine Tipo Prod

ANOVA A DUE VIE

Se applichiamo l’analisi inferenziale ANOVA al caso studio sulle frodi alimentari dei branzini otteniamo i seguenti risultati. Fissato il livello α al 5%, si può concludere che sia il tipo di produzione, sia l’origine sia la loro interazione ha un

Factor Type Levels Values Origine fixed 2 Comm; Std

Tipo Prod fixed 2 Allevam; Pescato

Analysis of Variance for grasso, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P

p p g

effetto significativo sulla quantità di grasso nella carne.

Source DF Seq SS Adj SS Adj MS F P Origine 1 88.630 93.720 93.720 12.83 0.001 Tipo Prod 1 30.892 68.671 68.671 9.40 0.003 Origine*Tipo Prod 1 122.552 122.552 122.552 16.78 0.000 Error 102 745.100 745.100 7.305 Total 105 987.173 S = 2.70276 R-Sq = 24.52% R-Sq(adj) = 22.30%

(33)

ANOVA A DUE VIE

Grazie all’applicazione della procedura dei confronti multipli a coppie (metodo di Tukey) possiamo concludere che solamente lo standard/pescato differisce (ha meno grasso, si veda l’interaction plot) rispetto agli altri 3 trattamenti, che

Tukey Simultaneous Tests Response Variable grasso

All Pairwise Comparisons among Levels of Origine*Tipo Prod Origine = Comm, Tipo Prod = Allevam subtracted from:

Difference SE of Adjusted Origine Tipo Prod of Means Difference T-Value P-Value Comm Pescato 0.561 0.6605 0.849 0.8308 Std Allevam 0.280 0.7616 0.368 0.9829 Std Pescato -3.620 0.7742 -4.676 0.0001

presentano invece tra loro uguale valore medio di grasso.

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 65 Origine = Comm, Tipo Prod = Pescato subtracted from:

Difference SE of Adjusted Origine Tipo Prod of Means Difference T-Value P-Value Std Allevam -0.281 0.7659 -0.367 0.9831 Std Pescato -4.181 0.7784 -5.371 0.0000 Origine = Std, Tipo Prod = Allevam subtracted from:

Difference SE of Adjusted Origine Tipo Prod of Means Difference T-Value P-Value Std Pescato -3.900 0.8659 -4.504 0.0001

ANOVA A DUE VIE

L’analisi dei residui indica che l’assunzione di normalità del termine di errore è ragionevole, mentre qualche perplessità rimane sull’assunzione di omogeneità dalla varianza (ipotesi di omoschedasticità). Residual Pe rc en t 10 5 0 -5 -10 99.9 99 90 50 10 1 0.1 Fitted Value Re si du al 6 5 4 3 2 10 5 0 -5

Normal Probability Plot of the Residuals Residuals Versus the Fitted Values

Residual Plots for grasso

) Residual F re que ncy 9 6 3 0 -3 -6 24 18 12 6 0 Observation Order Re si du al 100 90 80 70 60 50 40 30 20 10 1 10 5 0 -5

(34)

ANALISI DELLA VARIANZA MULTIVIA

Modello statistico (3 fattori)

( ) ( ) ( ) ( )

⎪ ⎪ ⎪ ⎨ ⎧ = = + + + + + + + + = k b j a i

Yijkl i j k ij ik jk ijk ijkl

2 1 ,..., 2 , 1 ,..., 2 , 1 ε τβγ βγ τγ τβ γ β τ µ Numero di osservazioni totali: abcn ⎪ ⎪ ⎩ = = n l c k j ijk jk ik ij j j ,..., 2 , 1 ,..., 2 , 1 ‰ Yijkl  è variabile casuale che indica l’ijkl‐esima osservazione   ‰ µ è il valore atteso totale, è un parametro comune a tutti i livelli  dell’esperimento   ‰ τi è l’effetto dell’i‐esimo livello del fattore A   ‰ βj è l’effetto del j‐esimo livello del fattore B   ‰ γkè l’effetto del k‐esimo livello del fattore C   ‰ ( )τβ ijè l’effetto dell’interazione tra il fattore A e il fattore B 

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 67

( )β ij ‰ ( )τγ ikè l’effetto dell’interazione tra il fattore A e il fattore C  ‰ ( )βγ jk è l’effetto dell’interazione tra il fattore B e il fattore C  ‰ ( )τβγ ijk è l’effetto dell’interazione tra il fattore A, il fattore B e il fattore C  ‰ εijkl  rappresenta la componente dell’errore casuale avente distribuzione  normale con media zero e varianza σ2. 

z La procedura di base è simile al caso a due fattori; tutti le abc…k combinazioni dei fattori (trattamenti) , ciascuna

replicata n volte, vengono realizzate in ordine casuale.

ANALISI DELLA VARIANZA MULTIVIA

z Anche l’analisi ANOVA è simile e si basa sulla

scomposizione della somma dei quadrati del tipo:

T A B AB AC ABC AB K E

SS

SS

SS

SS

SS

SS

SS

SS

=

+

+ +

+

+

+

+ +

+

z Per quanto riguarda l’analisi inferenziale, si avranno

tante verifiche di ipotesi (cosiddette sugli effetti principali) quanti sono i k fattori, così come si andrà a testare la significatività delle interazioni a due, a tre e così via.

(35)

PIANI 2K

z Lo studio sulle frodi alimentari è un esempio di piano 22,

ovvero di piano 2kcon k=2. In generale, un piano 2kè un caso particolare di piano multivia quando si considerano k fattori, ciascuno dei quali su 2 livelli (detti con-venzionalmente “alto”/”basso” o “presenza”/“assenza” venzionalmente alto / basso o presenza / assenza , rispettivamente per fattori quantitativi o qualitativi).

z Si noti che il modello di rappresentazione dei dati include

k effetti principali, e interazioni a 2 e a 3 e così via.

z Il piano 2k è particolarmente utile nelle fasi iniziali della

sperimentazione quando è probabile che ci siano molti fattori da analizzare. Dato che tale piano determina un

2 k ⎛ ⎞ ⎜ ⎟ ⎝ ⎠ 3 k ⎛ ⎞ ⎜ ⎟ ⎝ ⎠

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 69

numero di trattamenti che il minimo valore possibile per lo studio di k fattori, il piano 2k viene ampiamente utilizzato negli esperimenti di screening.

z Dato che si considerano solamente due livelli per fattore,

si assume implicitamente che la risposta vari linearmente nel range dei livelli scelti del fattore.

Esempio: si consideri il processo di riempimento di una bevanda gasata dove la risposta (differenza dell’altezza del livello target) è in funzione di 3 fattori, quali A: % di carbonazione, B: pressione e C: velocità del macchinario.

P i d li 8 i li 2

PIANI 2K

Per ciascuno degli 8 trattamenti sono state realizzate n=2 repliche.

(36)

PIANI 2K

Term Effect Coef SE Coef T P Constant 1.0000 0.1976 5.06 0.001 A 3.0000 1.5000 0.1976 7.59 0.000 B 2 2500 1 1250 0 1976 5 69 0 000

Risultati dell’analisi inferenziale.

B 2.2500 1.1250 0.1976 5.69 0.000 C 1.7500 0.8750 0.1976 4.43 0.002 A*B 0.7500 0.3750 0.1976 1.90 0.094 A*C 0.2500 0.1250 0.1976 0.63 0.545 B*C 0.5000 0.2500 0.1976 1.26 0.242 A*B*C 0.5000 0.2500 0.1976 1.26 0.242 S = 0.790569 R-Sq = 93.59% R-Sq(adj) = 87.98% Analysis of Variance for Y (coded units)

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 71 Source DF Seq SS Adj SS Adj MS F P

Main Effects 3 68.500 68.500 22.8333 36.53 0.000 2-Way Interactions 3 3.500 3.500 1.1667 1.87 0.214 3-Way Interactions 1 1.000 1.000 1.0000 1.60 0.242 Residual Error 8 5.000 5.000 0.6250 Pure Error 8 5.000 5.000 0.6250 Total 15 78.000

PIANI 2K

Main effect e interaction plot.

30 25 200 250 4 2 A 10 12

Interaction Plot (data means) for Y

A B C 2 0 4 2 0 12 B 25 30 Y 2 1 0 A B

Main Effects Plot (data means) for Y

Me an o f 12 10 25 30 250 200 2 1 0 C

(37)

Hold Values A 10 B 25

Surface Plots of Y

PIANI 2K

Surface e contour plot.

30.0 Y -2 0 27.5 2 B 10 A11 12 25.0 240 Y -2 -1 0 1 220 C 10 A11 12 200 240 Y -2 -1 0 1 220 C 25.0 27.5 200 30.0 B C 200 B*A 30.0 27.5 C*A 240 220 Y -1 - 0 0 - 1 1 - 2 > 2 < -2 -2 - -1 Contour Plots of Y

PROGETTAZIONE ED ANALISI DEGLI ESPERIMENTI 73

12.0 11.5 11.0 10.5 10.0 25.0 12.0 11.5 11.0 10.5 10.0 200 C*B 30.0 27.5 25.0 240 220 200 Hold Values A 10 B 25 C 200 2 z ESEMPIO

PIANI 2K

Riferimenti

Documenti correlati

(2005) risulta difficile nel caso in cui sia presente un elevato errore di misura, a causa del basso valore del determinante della matrice di informazione in fase di

Abbiamo letto questo libro con interesse per le magistrali esegesi che propone e lo segnaliamo volentieri ai colleghi come opera di prim’ordine di filosofia della storia della

` E stato, inoltre, esami- nato un modello di calcolo, la Macchina di Turing, al fine di formalizzare la nozione di algoritmo e fornire al tempo stesso una descrizione delle nozioni

Le esercitazioni del corso di Progettazione di Processo e Analisi dei Costi vertono sulla progettazione di base e sull’analisi economica del processo di idrodealchilazione (HDA) del

• determinare tramite integrazione numerica del modello a pistone del reattore la conversione, la selettività e il tempo di residenza in funzione della temperatura di

Si consideri che sia l’efficienza della trasformazione reale (scostamento dalla trasformazione ideale adiabatica isoentropica) che quella del motore elettrico all'albero sia

 Intervallo di confidenza è l'intervallo di valori entro i quali si stima che cada, con un livello di probabilità scelto a piacere, il valore vero della popolazione (0.95 0

di una nuova geometria con aumento di sicurezza e prestazioni per la grande rotatoria. di Via di Levante / Viale Nazario Sauro,