• Non ci sono risultati.

Capitolo 3: METODI

3.7. Risultati

3.7.7. Modello di Regressione Logistica

Analizziamo adesso l'effetto di due variabili indipendenti (ricerca di informazioni online e iscrizione alla newsletter) sulla variabile dipendente “Acquisto online”. Abbiamo deciso di utilizzare il Modello di Regressione Logistica39 poiché le tre variabili sono bernoulliane ovvero dicotomiche. In realtà la variabile X2 era originariamente di tipo discreto ossia poteva assumere valori da 0 a oltre 10. Per ovviare a questo problema abbiamo trasformato la suddetta variabile in una

bernoulliana convertendo coloro che affermano di essere iscritti a nessuna

newletter nel valore 0 e coloro che risultano iscritti a una o più comunicazioni

39

Fabrizio Martire (2012), “La regressione logistica e i modelli log-lineari nella ricerca sociale”, Franco Angeli Editore - Milano

ContaNumeri - 10. Acquisti online? 10. Acquisti online?

21. Sesso No (passa alla domanda n. 13)Si Totale Risultato

Donna 23 138 161

Uomo 5 71 76

Totale Risultato 28 209 237

Figura 36: Tabella pivot acquisto online-genere. Fonte: Elaborazione personale.

hanno assunto valore 1. A questo punto attraverso una tabella pivot abbiamo riassunto le relazioni tra le tre variabili.

ContaNumeri - Acquisto online? Acquisto online?

2. Prima di effettuare un acquisto ricerchi informazioni online?Sei iscritto ad almeno una newsletter?0 1 Totale Risultato

0 0 6 5 11

1 2 8 10

1 0 5 42 47

1 15 154 169

Totale Risultato 28 209 237

Figura 37: Tabella pivot 3 variabili.

Fonte: Elaborazione personale.

Per agevolare la costruzione del modello tramite il software statistico R ho provveduto a ricostruire la tabella come riportato nella figura sottostante.

Ecco i risultati derivanti dal software R. > ricerca <- c(rep("NO",2), rep ("SI",2)) > newsletter <- c(rep("NO",1), rep("SI",1)) > acquisto <- c(rep("NO",4), rep("SI", 4)) > freq <- c(6,2,5,15,5,8,42,154)

> data <- data.frame(ricerca,newsletter,acquisto,freq) > data

ricerca newsletter acquisto freq 1 NO NO NO 6

2. Prima di effettuare un acquisto ricerchi informazioni online? Sei iscritto ad almeno una newsletter? Acquisto online?

1 1 1 154 0 15 0 1 42 0 5 0 1 1 8 0 2 0 1 5 0 6 Totale Risultato 237

Figura 38: Tabella pivot ricostruita. Fonte: Elaborazione personale.

2 NO SI NO 2 3 SI NO NO 5 4 SI SI NO 15 5 NO NO SI 5 6 NO SI SI 8 7 SI NO SI 42 8 SI SI SI 154

> fit <- glm(acquisto ~ ricerca + newsletter, weights = freq, data = data, family = binomial)

> summary(fit) Call:

glm(formula = acquisto ~ ricerca + newsletter, family = binomial, data = data, weights = freq)

Deviance Residuals:

1 2 3 4 5 6 7 8

-3.141 -2.145 -4.507 -8.665 2.406 2.468 3.437 5.129 Coefficients:

Estimate Std. Error z value Pr(>|z|) (Intercept) 0.2431 0.4948 0.491 0.62323 ricercaSI 1.6475 0.5236 3.147 0.00165 ** newsletterSI 0.5267 0.4485 1.174 0.24028 ---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1) Null deviance: 172.16 on 7 degrees of freedom Residual deviance: 159.86 on 5 degrees of freedom AIC: 165.86

Number of Fisher Scoring iterations: 5

Dai risultati si evidenziano i seguenti coefficienti: β0= 0.2431

β1 = 1.6475

β2 = 0.5267

Ecco la formula del modello completa dei vari coefficienti:

Calcoliamo adesso le varie probabilità.

La probabilità di acquistare online se non si ricercano informazioni sul web prima di un acquisto e non si è iscritti a nessuna newsletter:

La probabilità di acquistare online se si ricercano informazioni sul web prima di un acquisto ma non si è iscritti a nessuna newsletter:

La probabilità di acquistare online se non si ricercano informazioni sul web pri- ma di un acquisto ma si è iscritti ad almeno una newsletter:

La probabilità di acquistare online se si ricercano informazioni sul web prima di un acquisto e si è iscritti ad almeno una newsletter:

Dobbiamo comunque specificare che il modello purtroppo non è statisticamente significativo poiché solo un coefficiente ha un p-value inferiore a 0,05.

Proviamo adesso a costruire il modello con interazione tra le variabili indipendenti, ricerca di informazioni online e iscrizione alla newsletter.

> fit <- glm(acquisto ~ ricerca * newsletter, weights = freq, data = data, family = binomial)

> > summary(fit)

Errore: unexpected '>' in ">" > summary(fit)

Call:

glm(formula = acquisto ~ ricerca * newsletter, family = binomial, data = data, weights = freq)

Deviance Residuals:

1 2 3 4 5 6 7 8

-2.697 -2.537 -4.734 -8.524 2.808 1.889 3.074 5.351 Coefficients:

Estimate Std. Error z value Pr(>|z|) (Intercept) -0.1823 0.6055 -0.301 0.76334

ricercaSI 2.3106 0.7684 3.007 0.00264 ** newsletterSI 1.5686 0.9958 1.575 0.11521 ricercaSI:newsletterSI -1.3679 1.1352 -1.205 0.22818

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1) Null deviance: 172.16 on 7 degrees of freedom Residual deviance: 158.30 on 4 degrees of freedom AIC: 166.3

Number of Fisher Scoring iterations: 5

Di seguito la formula del modello di regressione logistica con interazioni:

Questo modello potrebbe spiegare come varia la probabilità di far acquistare il prodotto per esempio se un'azienda effettua sia una strategia SEO che una di e- mail marketing.

La formula aggiornata con i vari coefficienti:

La probabilità di vendere il prodotto aumenta leggermente se l'azione è simultanea.

Abbiamo poi deciso con il professore di aumentare il numero di variabili nel modello di regressione logistica. Questo il risultato dell'analisi con R:

> fit <- glm(acquisto ~ ricerca + nl + fuorisede + studlav + genere, data = dati, family = binomial)

Call:

glm(formula = acquisto ~ ricerca + nl + fuorisede + studlav + genere, family = binomial, data = dati)

Deviance Residuals:

Min 1Q Median 3Q Max -2.4172 0.3328 0.3786 0.5037 1.3403 Coefficients:

Estimate Std. Error z value Pr(>|z|) (Intercept) 0.6187 0.7133 0.867 0.38575 ricerca 1.4746 0.5455 2.703 0.00686 ** nl 0.7727 0.4720 1.637 0.10160 fuorisede 0.5993 0.4333 1.383 0.16661 studlav -0.1284 0.4700 -0.273 0.78474 genere -0.8654 0.5477 -1.580 0.11411 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 172.16 on 236 degrees of freedom Residual deviance: 154.54 on 231 degrees of freedom AIC: 166.54

Number of Fisher Scoring iterations: 5

Ad ulteriore riprova abbiamo deciso di introdurre tutte le variabili dicotomiche e una variabile sotto forma di dummy.

> dati = data.frame (acquisto, ricerca, nl, fuorisede, studlav, genere + nazionalità + dummySan + dummyUm + dummySc + dummySoc)

> fit <- glm(acquisto ~ ricerca + nl + fuorisede + studlav + genere + nazionalità + dummySan + dummyUm + dummySc + dummySoc, data = dati, family = bino- mial)

> summary(fit) Call:

glm(formula = acquisto ~ ricerca + nl + fuorisede + studlav +

genere + nazionalità + dummySan + dummyUm + dummySc + dummySoc, family = binomial, data = dati)

Deviance Residuals:

Min 1Q Median 3Q Max -2.4310 0.2930 0.3987 0.5011 1.2770

Coefficients:

Estimate Std. Error z value Pr(>|z|) (Intercept) -0.2505 1.0403 -0.241 0.8097 ricerca 1.3894 0.5651 2.459 0.0139 * nl 0.7784 0.4853 1.604 0.1087 fuorisede 0.6187 0.4425 1.398 0.1621 studlav -0.1288 0.4879 -0.264 0.7918 genere -0.6817 0.5672 -1.202 0.2294 nazionalità -0.2018 1.2620 -0.160 0.8729 dummySan 0.6381 0.8692 0.734 0.4629 dummyUm 0.4880 0.8357 0.584 0.5593 dummySc 1.2727 0.9048 1.406 0.1596 dummySoc 0.8298 0.8281 1.002 0.3163 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 172.16 on 236 degrees of freedom Residual deviance: 152.11 on 226 degrees of freedom AIC: 174.11

Number of Fisher Scoring iterations: 5

Purtroppo però risulta sempre significativa solo la variabile “ricerca online” e all'aumentare del numero delle variabili nel modello peggiora anche il valore del p-value. Quindi attraverso le nostre analisi possiamo solo affermare che ricercare informazioni online influisce sulla probabilità di acquistare dal web.

Documenti correlati