ESERCITAZIONE SU
ANALISI DI REGRESSIONE
ESEMPIO N. 1
Si vuole studiare il livello di corrosione di una certa sostanza metallica esponendola ad una atmosfera di ossigeno puro, ad una temperatura di 500 gradi Celsius. L’aumento relativo di massa della sostanza viene utilizzato come indicatore della quantità di ossigeno che ha reagito. Si osservano i seguenti dati sperimentali:
Ore di esposizione 1.0 2.0 2.5 3.0 3.5 4.0
Incremento % di massa 0.02 0.03 0.035 0.042 0.05 0.054
Quale tipo di relazione è possibile ipotizzare tra il tempo di esposizione e l’incremento percentuale di massa?
ESEMPIO N. 1
X Y X*X X*Y Y^ SQTOT SQE RESIDUO RES STD
1 0.02 1 0.02 0.018929 0.000342 1.15E-06 0.001071 0.80339212 2 0.03 4 0.06 0.030671 7.23E-05 4.51E-07 -0.00067 -0.50345906
2.5 0.035 6.25 0.0875 0.036543 1.23E-05 2.38E-06 -0.00154 -1.15688465 3 0.042 9 0.126 0.042414 1.23E-05 1.72E-07 -0.00041 -0.31064495 3.5 0.05 12.25 0.175 0.048286 0.000132 2.94E-06 0.001714 1.285427392 4 0.054 16 0.216 0.054157 0.00024 2.47E-08 -0.00016 -0.11783084
Totali 16 0.231 48.5 0.6845 0.231 0.000812 7.11E-06 -1.7E-17 -1.2879E-14 Medie 2.666667 0.0385
B1 0.011743 VAR(B0) 2.46E-06 Intervalli di Confidenza Intervalli di Predizione B0 0.007186 VAR(B1) 3.05E-07 Livello di confidenza 0.9 livello di probabilità 0.9
MSQR 0.000804 X 2 GdL 4 GdL 4
MSQE 1.78E-06 VAR(Y^|X) 4.32E-07
R2 0.991233 VAR(Y^ - Y|X) 2.21E-06 Lower limit Upper limit Lower limit Upper limit
F 452.2651 B0 0.003839 0.010533 Y|X 0.0275018 0.03384101
PVALUE 2.89E-05 B1 0.010566 0.01292
E(Y|X) 0.02927 0.032073
ESEMPIO N. 2
In una sperimentazione vengono raccolti i seguenti dati che mettono in relazione la percentuale di acqua, contenuta in un certo materiale in una delle fasi della lavorazione, con la densità del prodotto finito.
% di acqua 5 6 7 10 12 15 18 19
densità 7.4 9.3 10.6 15.4 18.1 22.2 24.1 24.8
Trovare un modello empirico che descriva la dipendenza della densità dalla percentuale di acqua.
ESEMPIO N. 2 - PAG. 1
N X Y X*X X*Y Y^ SQTOT SQE RESIDUO RES STD
1 5 7.4 25 37 8.304126 82.58266 0.817444 -0.90413 -0.915477097 2 6 9.3 36 55.8 9.563107 51.66016 0.069225 -0.26311 -0.266409979 3 7 10.6 49 74.2 10.82209 34.66266 0.049323 -0.22209 -0.224875582 4 10 15.4 100 154 14.59903 1.182656 0.641554 0.800971 0.81102669 5 12 18.1 144 217.2 17.11699 2.600156 0.966308 0.98301 0.995350938 6 15 22.2 225 333 20.89393 32.63266 1.705814 1.306068 1.322465037 7 18 24.1 324 433.8 24.67087 57.95016 0.325897 -0.57087 -0.578040841 8 19 24.8 361 471.2 25.92985 69.09766 1.276571 -1.12985 -1.144039165 Totali 92 131.9 1264 1776.2 131.9 332.3688 5.852136
Medie 11.5 16.4875
B1 1.258980583 B0 2.009223301 SQR 326.5166141 MSQR
MSQE
326.5166141 0.975355987 R2 0.982392641 F 334.7666067 PVALUE 1.7172E-06
ESEMPIO N. 2 - PAG. 2
N X Y X*X X*Y Y^ SQTOT SQE RESIDUO RES STD
1 5 7.4 25 37 7.2859 82.58266 0.013019 0.1141 0.357396178 2 6 9.3 36 55.8 9.1221 51.66016 0.031648 0.1779 0.557237335 3 7 10.6 49 74.2 10.8695 34.66266 0.07263 -0.2695 -0.844156616 4 10 15.4 100 154 15.5789 1.182656 0.032005 -0.1789 -0.560369642 5 12 18.1 144 217.2 18.2745 2.600156 0.03045 -0.1745 -0.546587493 6 15 22.2 225 333 21.6519 32.63266 0.300414 0.5481 1.716817221 7 18 24.1 324 433.8 24.2301 57.95016 0.016926 -0.1301 -0.407513082 8 19 24.8 361 471.2 24.9119 69.09766 0.012522 -0.1119 -0.350505103 Totali 92 131.9 1264 1776.2 131.9248 332.3688 0.509614
Medie 11.5 16.4875
B2 -0.0444 B1 2.3246 B0 -3.2271 SQR 331.8591358 MSQR 165.9295679 22832 MSQE
R2
0.1019 0.998466721 F 1627.992126 PVALUE 9.20562E-08
SQ(B2|B1,B0) 5.342521762 MSQE2 0.101922832 F 52.41732061 PVALUE 0.000784702
ESEMPIO N. 3
Si vuole studiare la relazione che, nelle albicocche vesuviane, lega le variabili “residuo secco rifrattometrico” e “durezza della polpa” alla “estensione del sopraccolore” (misurata in percentuale della superficie del frutto). Viene effettuata una specifica sperimentazione, nella quale su di un certo numero di esemplari vengono misurate le variabili di interesse, ottenendo i seguenti risultati:
Sopraccolore 10 15 20 25 30 35 40 45 50 55
durezza 7.8 6.3 6.9 5.2 5.8 5.0 4.5 5.1 5.2 3.8
Sopraccolore 60 65 70 75 80 85 90 95 100
durezza 3.8 3.8 3.5 3.6 3.6 3.5 2.7 2.9 2.5
Sopraccolore 10 15 20 25 30 35 40 45 50 55
Residuo secco 9.8 10.8 10.7 10.7 10.6 11.3 11.2 12.0 11.8 11.8
Sopraccolore 60 65 70 75 80 85 90 95 100
Residuo secco 12.2 12.0 12.2 13.2 13.8 13.9 13.7 14.7 14.2
Sulla base di tali osservazioni, determinare:
• un modello empirico che descriva la dipendenza del “residuo secco” dalla “estensione del sopraccolore”
• un modello empirico che descriva la dipendenza della “durezza della polpa” dalla “estensione del sopraccolore”.
ESEMPIO N. 3 - PAG. 1
Residuo Secco Rifrattometrico vs estensione del sovraccolore
N X = ES Y = RSR X*X X*Y Y^ SQTOT SQE residuo 1 10 9.8 100 98 9.957895 5.460831 0.024931 0.157895 2 15 10.8 225 162 10.2 1.787147 0.36 -0.6 3 20 10.7 400 214 10.44211 2.064515 0.06651 -0.25789 4 25 10.7 625 267.5 10.68421 2.064515 0.000249 -0.01579 5 30 10.6 900 318 10.92632 2.361884 0.106482 0.326316 6 35 11.3 1225 395.5 11.16842 0.700305 0.017313 -0.13158 7 40 11.2 1600 448 11.41053 0.877673 0.044321 0.210526 8 45 12 2025 540 11.65263 0.018726 0.120665 -0.34737 9 50 11.8 2500 590 11.89474 0.113463 0.008975 0.094737 10 55 11.8 3025 649 12.13684 0.113463 0.113463 0.336842 11 60 12.2 3600 732 12.37895 0.003989 0.032022 0.178947 12 65 12 4225 780 12.62105 0.018726 0.385706 0.621053 13 70 12.2 4900 854 12.86316 0.003989 0.439778 0.663158 14 75 13.2 5625 990 13.10526 1.130305 0.008975 -0.09474 15 80 13.8 6400 1104 13.34737 2.766094 0.204875 -0.45263 16 85 13.9 7225 1181.5 13.58947 3.108726 0.096427 -0.31053 17 90 13.7 8100 1233 13.83158 2.443463 0.017313 0.131579
18 95 14.7 9025 1396.5 14.07368 6.569778 0.392271 -0.62632 19 100 14.2 10000 1420 14.31579 4.25662 0.013407 0.115789 Somme 1045 230.6 71725 13373 35.86421 2.453684
Medie 55 12.13684
B1 0.048421 VAR(B0) 0.038236 Intervalli di Confidenza Intervalli di Predizione B0 9.473684 VAR(B1) 1.01E-05 Livello di confidenza 0.9 Livello di probabilità 0.9
MSQR 33.41053 X 55 GdL 17 GdL 17
MSQE 0.144334 VAR(Y^|X) AR(Y-Y^|X)
0.007597
0.151931 L
L
R2
F
0.931584 231.4801
V ower Upper ower Upper
B0 9.133521 9.813847 Y|X 11.45877 12.81491
PVALUE 2.47E-11 B1 0.042885 0.053957
Y^ 12.13684 E(Y|X) 11.98522 12.28846
ESEMPIO N. 3 - PAG. 2
Indice Penetrometrico vs estensione del sovraccolore
N X = ES Y = IP X*X X*Y Y^ SQTOT SQE
1 10 7.8 100 78 6.680526 10.89 1.253221 1.119474 2 15 6.3 225 94.5 6.438246 3.24 0.019112 -0.13825 3 20 6.9 400 138 6.195965 5.76 0.495665 0.704035 4 25 5.2 625 130 5.953684 0.49 0.56804 -0.75368 5 30 5.8 900 174 5.711404 1.69 0.007849 0.088596 6 35 5 1225 175 5.469123 0.25 0.220076 -0.46912 7 40 4.5 1600 180 5.226842 7.89E-31 0.528299 -0.72684 8 45 5.1 2025 229.5 4.984561 0.36 0.013326 0.115439 9 50 5.2 2500 260 4.742281 0.49 0.209507 0.457719 10 55 3.8 3025 209 4.5 0.49 0.49 -0.7 11 60 3.8 3600 228 4.257719 0.49 0.209507 -0.45772 12 65 3.8 4225 247 4.015439 0.49 0.046414 -0.21544 13 70 3.5 4900 245 3.773158 1 0.074615 -0.27316 14 75 3.6 5625 270 3.530877 0.81 0.004778 0.069123 15 80 3.6 6400 288 3.288596 0.81 0.096972 0.311404
16 85 3.5 7225 297.5 3.046316 1 0.205829 0.453684 17 90 2.7 8100 243 2.804035 3.24 0.010823 -0.10404 18 95 2.9 9025 275.5 2.561754 2.56 0.11441 0.338246 19 100 2.5 10000 250 2.319474 4 0.03259 0.180526
Somme 1045 85.5 71725 4012 38.06 4.601035
Medie 55 4.5
B1 -0.04845614 VAR(B0) 0.0716983 Intervalli di Confidenza Intervalli di Predizione B0 7.165087719 VAR(B1) 1.899E-05 Livello di confidenza 0.9 Livello di probabilità 0.9
MSQR 33.45896491 X 55 GdL 17 GdL 17
MSQE 0.270649123 VAR(Y^|X) 0.0142447
R2 0.879111007 VAR(Y-Y^|X) 0.2848938 Lower Upper Lower Upper F 123.6248785 B0 6.699281 7.630894 Y|X 3.571477 5.428523
PVALUE 3.20261E-09 B1 -0.05604 -0.04087
Y^ 4.5 E(Y|X) 4.292376 4.707624
ESEMPIO N. 3 - PAG. 3
Indice Penetrometrico vs estensione del sovraccolore
N X = ES Y = IP X*X X*Y Y^ SQTOT SQE Residui
1 10 7.8 100 78 7.1727 10.89 0.393505 0.6273 2 15 6.3 225 94.5 6.7664 3.24 0.217529 -0.4664 3 20 6.9 400 138 6.3794 5.76 0.271024 0.5206 4 25 5.2 625 130 6.0117 0.49 0.658857 -0.8117 5 30 5.8 900 174 5.6633 1.69 0.018687 0.1367 6 35 5 1225 175 5.3342 0.25 0.11169 -0.3342 7 40 4.5 1600 180 5.0244 7.89E-31 0.274995 -0.5244 8 45 5.1 2025 229.5 4.7339 0.36 0.134029 0.3661 9 50 5.2 2500 260 4.4627 0.49 0.543611 0.7373 10 55 3.8 3025 209 4.2108 0.49 0.168757 -0.4108 11 60 3.8 3600 228 3.9782 0.49 0.031755 -0.1782 12 65 3.8 4225 247 3.7649 0.49 0.001232 0.0351
13 70 3.5 4900 245 3.5709 1 0.005027 -0.0709 14 75 3.6 5625 270 3.3962 0.81 0.041534 0.2038 15 80 3.6 6400 288 3.2408 0.81 0.129025 0.3592 16 85 3.5 7225 297.5 3.1047 1 0.156262 0.3953 17 90 2.7 8100 243 2.9879 3.24 0.082886 -0.2879 18 95 2.9 9025 275.5 2.8904 2.56 9.22E-05 0.0096 19 100 2.5 10000 250 2.8122 4 0.097469 -0.3122
Somme 1045 85.5 71725 4012 38.06 3.337967
Medie 55 4.5
B2 0.000386
B1 B0
-0.09091
8.0432
MSQR 34.72203283 SQ(B2|B1,B0) 1.2630679
MSQE 0.208622948 MSQE2 0.2086229
R2 0.912297237 F 6.0543096
F 166.4343887 PVALUE 0.0256256
PVALUE 3.29893E-10
ESEMPIO N. 3 - PAG. 4
Indice Penetrometrico vs estensione del sovraccolore
N X = ES LOG(X) Y = IP X*X X*Y Y^ SQTOT SQE
1 10 2.302585 7.8 5.301898 17.96016 7.74776 10.89 0.002729 2 15 2.70805 6.3 7.333536 17.06072 6.889899 3.24 0.347981 3 20 2.995732 6.9 8.974412 20.67055 6.281237 5.76 0.382867 4 25 3.218876 5.2 10.36116 16.73815 5.809122 0.49 0.37103 5 30 3.401197 5.8 11.56814 19.72694 5.423376 1.69 0.141845 6 35 3.555348 5 12.6405 17.77674 5.097233 0.25 0.009454 7 40 3.688879 4.5 13.60783 16.59996 4.814715 7.89E-31 0.099045 8 45 3.806662 5.1 14.49068 19.41398 4.565516 0.36 0.285674 9 50 3.912023 5.2 15.30392 20.34252 4.3426 0.49 0.735135 10 55 4.007333 3.8 16.05872 15.22787 4.140948 0.49 0.116245 11 60 4.094345 3.8 16.76366 15.55851 3.956854 0.49 0.024603
12 65 4.174387 3.8 17.42551 15.86267 3.787504 0.49 0.000156 13 70 4.248495 3.5 18.04971 14.86973 3.63071 1 0.017085 14 75 4.317488 3.6 18.6407 15.54296 3.484739 0.81 0.013285 15 80 4.382027 3.6 19.20216 15.7753 3.348192 0.81 0.063407 16 85 4.442651 3.5 19.73715 15.54928 3.219926 1 0.078442 17 90 4.49981 2.7 20.24829 12.14949 3.098993 3.24 0.159195 18 95 4.553877 2.9 20.73779 13.20624 2.9846 2.56 0.007157 19 100 4.60517 2.5 21.20759 11.51293 2.876077 4 0.141434 Somme 1045 72.91494 85.5 287.6534 311.5447 38.06 2.996771
Medie 55 3.837628 4.5
B1 -2.11575 VAR(B0) 0.340718 Intervalli di Confidenza Intervalli di Predizione B0 12.61944 VAR(B1) 0.022505 Livello di confidenza 0.9 Livello di probabilità 0.9
MSQR 35.06323 X 55 GdL 17 GdL 17
MSQE 0.176281 VAR(Y^|X) 0.009926
R2 F
0.921262 VAR(Y-Y^|X) 0.186207 Lower Upper Lower Upper
198.9057 B0 11.60402 13.63487 Y|X 3.390278 4.891617
PVALUE 8.2E-11 B1 -2.37672 -1.85478
Y^ 4.140948 E(Y|X) 3.967631 4.314264
ESEMPIO N. 4 – HALD DATA
Dati tratti da: “Effect of composition of Portland cement on heat evolved during hardening”, Industrial and Engineering Chemistry, Vol. 24, 1932, pp 1207-1214
Si vuole studiare la dipendenza della quantità di calore sviluppato in un cemento Portland, durante la fase di indurimento, in dipendenza della composizione chimica dello stesso.
Detta Y la variabile dipendente “calore sviluppato” (cal/g), vengono prese in considerazione le seguenti quattro variabili indipendenti:
• X1 quantità (%) di 3CaO Al2O3 (tricalcio alluminato)
• X2 quantità (%) di 3CaO SiO2 (tricalcio silicato)
• X3 quantità (%) di 4CaO Al2O3 Fe2O3 (tetracalcio allumino ferrite)
• X4 quantità (%) di 2CaO SiO2 (di calcio silicato)
misurate in percentuale del peso del clinker da cui il cemento viene ottenuto.
Viene effettuata una specifica sperimentazione, facendo variare il livello delle variabili indipendenti e misurando il corrispondente valore del calore sviluppato nella reazione.
I risultati ottenuti nella sperimentazione sono riportati nella seguente tabella.
N X1 X2 X3 X4 Y
1 7.0 26.0 6.0 60.0 78.5
2 1.0 29.0 15.0 52.0 74.3
3 11.0 56.0 8.0 20.0 104.3
4 11.0 31.0 8.0 47.0 87.6
5 7.0 52.0 6.0 33.0 95.9
6 11.0 55.0 9.0 22.0 109.2
7 3.0 71.0 17.0 6.0 102.7
8 1.0 31.0 22.0 44.0 72.5
9 2.0 54.0 18.0 22.0 93.1
10 21.0 47.0 4.0 26.0 115.9
11 1.0 40.0 23.0 34.0 83.8
12 11.0 66.0 9.0 12.0 113.3
13 10.0 68.0 8.0 12.0 109.4
Sulla base di questi dati si vuole determinare, mediante una procedura “stepwise”, la significatività dei fattori in gioco a partire dal modello empirico lineare:
0 1 1 2 2 3 3 4 4
Y = β + β X + β X + β X + β X + ε
REGRESSIONE MULTIPLA
VARIABILI NEL MODELLO DI REGRESSIONE: X1, X2, X3, X4
Statistica della regressione R al quadrato 0.9824 Errore standard 2.4460
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 4 2667.899 666.975 111.479 4.756E-07
Residuo 8 47.864 5.983
Totale 12 2715.763
Coefficienti Errore standard Stat t Valore di significatività Inferiore 95% Superiore 95%
Intercetta 62.405 70.071 0.891 0.399 -99.179 223.989
X1 1.551 0.745 2.083 0.071 -0.166 3.269
X2 0.510 0.724 0.705 0.501 -1.159 2.179
X3 0.102 0.755 0.135 0.896 -1.638 1.842
X4 -0.144 0.709 -0.203 0.844 -1.779 1.491
METODO STEPWISE
STEP 1
VARIABILE ENTRANTE X1 Statistica della regressione
R al quadrato 0.534 Errore standard 10.727
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 1 1450.076 1450.076 12.603 0.00455
Residuo 11 1265.687 115.062
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 81.479 4.927 16.536 4.067E-09 70.634 92.324 X1 1.869 0.526 3.550 0.00455 0.710 3.027
STEP 1
VARIABILE ENTRANTE X2
Statistica della regressione
R al quadrato 0.666 Errore standard 9.077
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 1 1809.427 1809.427 21.961 0.00066
Residuo 11 906.336 82.394
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 57.424 8.491 6.763 3.10E-05 38.736 76.111 X2 0.789 0.168 4.686 0.00066 0.418 1.160
STEP 1
VARIABILE ENTRANTE X3 Statistica della regressione
R al quadrato 0.286 Errore standard 13.278
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 1 776.363 776.363 4.403 0.0598
Residuo 11 1939.400 176.309
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 110.203 7.948 13.866 2.60E-08 92.710 127.696 X3 -1.256 0.598 -2.098 0.05976 -2.573 0.061
STEP 1
VARIABILE ENTRANTE X4
Statistica della regressione
R al quadrato 0.675 Errore standard 8.964
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 1 1831.896 1831.896 22.799 0.00058
Residuo 11 883.867 80.352
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 117.568 5.262 22.342 1.62E-10 105.986 129.150 X4 -0.738 0.155 -4.775 0.00058 -1.078 -0.398
RIEPILOGO STEP 1
VARIABILI NEL MODELLO VARIABILE ENTRANTE VALORE F (SOGLIA=4.84)
NESSUNA X1 12.603
NESSUNA X2 21.961
NESSUNA X3 4.403
NESSUNA X4 22.799
LA VARIABILE X4 ENTRA NEL MODELLO DI REGRESSIONE
STEP 2
VARIABILE ENTRANTE X1 VARIABILI NEL MODELLO X4
Statistica della regressione
R al quadrato 0.972 Errore standard 2.734
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 2 2641.001 1320.500 176.627 1.581E-08
Residuo 10 74.762 7.476
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 103.097 2.124 48.540 3.320E-13 98.365 107.830 X4 -0.614 0.049 -12.621 1.815E-07 -0.722 -0.506 X1 1.440 0.138 10.403 1.105E-06 1.132 1.748
RESIDUO( X4, COST) = 883.867 RESIDUO( X1, X4, COST) = 74.762 MSQE = 7.476 F VALUE FOR X1 IN = 108.224 P VALUE FOR X1 IN = 1.10528E-06 F 5% = 4.965
STEP 2
VARIABILE ENTRANTE X2 VARIABILI NEL MODELLO X4
Statistica della regressione
R al quadrato 0.680 Errore standard 9.321
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 2 1846.883 923.441 10.628 0.00335
Residuo 10 868.880 86.888
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 94.160 56.627 1.663 0.127 -32.013 220.333 X4 -0.457 0.696 -0.657 0.526 -2.008 1.094
X2 0.311 0.749 0.415 0.687 -1.357 1.979
RESIDUO( X4, COST) = 883.867 RESIDUO( X2, X4, COST) = 868.880 MSQE = 86.888 F VALUE FOR X2 IN = 0.172 P VALUE FOR X2 IN = 0.687 F 5% = 4.965
STEP 2
VARIABILE ENTRANTE X3 VARIABILI NEL MODELLO X4
Statistica della regressione
R al quadrato 0.935 Errore standard 4.192
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 2 2540.025 1270.013 72.267 1.135E-06
Residuo 10 175.738 17.574
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 131.282 3.275 40.089 2.231E-12 123.986 138.579 X4 -0.725 0.072 -10.018 1.564E-06 -0.886 -0.563 X3 -1.200 0.189 -6.348 8.375E-05 -1.621 -0.779
RESIDUO( X4, COST) = 883.867 RESIDUO( X3, X4, COST) = 175.738 MSQE = 17.574 F VALUE FOR X3 IN = 40.295 P VALUE FOR X3 IN = 8.37547E-05 F 5% = 4.965
RIEPILOGO STEP 2
VARIABILI NEL MODELLO VARIABILE ENTRANTE VALORE F (SOGLIA=4.97)
X4 X1 108.224
X4 X2 0.172
X4 X3 40.295
LA VARIABILE X1 ENTRA NEL MODELLO DI REGRESSIONE
STEP 3
VARIABILE ENTRANTE X2
VARIABILI NEL MODELLO X1, X4
Statistica della regressione
R al quadrato 0.982 Errore standard 2.309
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 3 2667.790 889.263 166.832 3.323E-08
Residuo 9 47.973 5.330
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 71.648 14.142 5.066 0.00068 39.656 103.641
X4 -0.237 0.173 -1.365 0.20540 -0.629 0.155
X1 1.452 0.117 12.410 5.781E-07 1.187 1.717
X2 0.416 0.186 2.242 0.05169 -0.004 0.836
RESIDUO( X1, X4, COST) = 74.762 RESIDUO( X2, X1, X4, COST) = 47.973
MSQE = 5.330
F VALUE FOR X2 IN = 5.026 P VALUE FOR X2 IN = 0.052
F 5% = 5.117
STEP 3
VARIABILE ENTRANTE X3
VARIABILI NEL MODELLO X1, X4
Statistica della regressione
R al quadrato 0.981 Errore standard 2.377
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 3 2664.927 888.309 157.266 4.312E-08
Residuo 9 50.836 5.648
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 111.684 4.562 24.479 1.518E-09 101.363 122.005 X4 -0.643 0.045 -14.431 1.578E-07 -0.744 -0.542
X1 1.052 0.224 4.702 0.0011 0.546 1.558
X3 -0.410 0.199 -2.058 0.0697 -0.861 0.041
RESIDUO( X1, X4, COST) = 74.762 RESIDUO( X3, X1, X4, COST) = 50.836
MSQE = 5.648
F VALUE FOR X3 IN = 4.236 P VALUE FOR X3 IN = 0.070
F 5% = 5.117
RIEPILOGO STEP 3
VARIABILI NEL MODELLO VARIABILE ENTRANTE VALORE F (SOGLIA=5.12)
X4, X1 X2 5.026
X4, X1 X3 4.236
LA VARIABILE X2 ENTRA NEL MODELLO DI REGRESSIONE
STEP 4
VARIABILI NEL MODELLO X1, X2, X4 VARIABILE USCENTE X4
Statistica della regressione
R al quadrato 0.979 Errore standard 2.406
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 2 2657.859 1328.929 229.504 4.407E-09
Residuo 10 57.904 5.790
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 52.577 2.286 22.998 5.456E-10 47.483 57.671 X1 1.468 0.121 12.105 2.692E-07 1.198 1.739 X2 0.662 0.046 14.442 5.029E-08 0.560 0.764
RESIDUO( X2, X1, COST) = 57.904 RESIDUO( X2, X1, X4, COST) = 47.973
MSQE = 5.330
F VALUE FOR X4 OUT = 1.863 P VALUE FOR X4 OUT = 0.306
F 5% = 4.965
RIEPILOGO STEP 4
VARIABILI NEL MODELLO VARIABILE USCENTE VALORE F (SOGLIA=4.97)
X1, X2, X4 X4 1.863
LA VARIABILE X4 ESCE DAL MODELLO DI REGRESSIONE
STEP 5
VARIABILE ENTRANTE X3 VARIABILI NEL MODELLO X1, X2
Statistica della regressione
R al quadrato 0.982 Errore standard 2.312
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 3 2667.652 889.217 166.345 3.367E-08
Residuo 9 48.111 5.346
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 48.194 3.913 12.315 6.17159E-07 39.341 57.046
X1 1.696 0.205 8.290 1.66433E-05 1.233 2.159 X2 0.657 0.044 14.851 1.23037E-07 0.557 0.757 X3 0.250 0.185 1.354 0.208889486 -0.168 0.668
RESIDUO( X2, X1, COST) = 57.904 RESIDUO( X3, X2, X1, COST) = 48.111
MSQE = 5.346
F VALUE FOR X3 IN = 1.832 P VALUE FOR X3 IN = 0.209
F 5% = 5.117
RIEPILOGO STEP 5
VARIABILI NEL MODELLO VARIABILE IN INGRESSO VALORE F (SOGLIA=5.12)
X1, X2 X3 1.832
LA VARIABILE X3 NON ENTRA NEL MODELLO DI REGRESSIONE
A seguito della predetta analisi il modello di regressione finale risulta essere il seguente:
1 2
ˆ 52.577 1.468 0.662
Y = + X + X
VARIABILI NEL MODELLO X1, X2 Statistica della regressione
R al quadrato 0.979 Errore standard 2.406
Osservazioni 13 ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 2 2657.859 1328.929 229.504 4.407E-09
Residuo 10 57.904 5.790
Totale 12 2715.763
Coefficienti Errore standard Stat t P value Inferiore 95% Superiore 95%
Intercetta 52.577 2.286 22.998 5.456E-10 47.483 57.671 X1 1.468 0.121 12.105 2.692E-07 1.198 1.739 X2 0.662 0.046 14.442 5.029E-08 0.560 0.764