• Non ci sono risultati.

Analisi dei risultati

ANALISI DEI RISULTATI

La fase successiva riguarda proprio il processo di analisi ed interpretazione dei risultati (Figura 5).

Figura 5. Il quinto stadio della Content Analysis

Nello specifico, le analisi4 effettuate sono presentate secondo la seguente impostazione5:

A. Analisi preliminare relativa agli articoli di carattere divulgativo (banca dati Lexis Nexis);

B. Analisi della correlazione lineare relativa agli articoli di carattere divulgativo (banca dati Lexis Nexis);

C. ANOVA relativa agli articoli di carattere divulgativo (banca dati Lexis Nexis);

4 Le analisi sono state condotte attraverso l’utilizzo di tre software: R, SPSS ed Excel.

5 Si noti che i dataset relativi alle due banche dati son stati analizzati sia separatamente sia assieme: questo ha permesso di

cogliere anche le differenze che sussistono tra gli articoli di natura prettamente divulgativa e quelli di natura squisitamente scientifica.

- 42 -

D. Analisi preliminare relativa agli articoli di carattere scientifico (banca dati Scopus);

E. Analisi della correlazione lineare relativa agli articoli di carattere scientifico (banca dati Scopus);

F. ANOVA relativa agli articoli di carattere scientifico (banca dati Scopus);

G. Confronto tra gli articoli di carattere divulgativo (Lexis Nexis) e quelli di carattere scientifico (Scopus).

Prima di procedere oltre, è bene chiarire subito che nelle sezioni B, C, E, F e G sono state prese in considerazione solamente le variabili del dizionario di Liwc maggiormente utili al raggiungimento dell’obiettivo, ovvero analizzare in chiave Neo-Istituzionale l’evoluzione della discussione creatasi attorno alla Digital Health, la quale, come spiegato nel capitolo 1, è caratterizzata da alcune logiche6

fondamentali. Nello specifico, dopo un’attenta valutazione del dizionario in questione, sono stati considerati i gruppi di variabili denominati “affect words”7

(Pennebaker, Chung, Ireland, 2007) e “core drives and needs”8 (Pennebaker,

Chung, Ireland, 2007) per stabilire se da un punto di vista teorico il field considerato è sottoposto a legittimazione o meno, e i gruppi denominati

“biological processes”9 (Pennebaker, J., Chung, C., Ireland, 2007) e “personal

concerns”10 (Pennebaker, Chung, Ireland, 2007) per analizzare la dinamica delle

logiche che caratterizzano la Digital Health stessa.

6

Si ricorda che, in base al lavoro di Macnaughtan, Patriotta, Pinnington e Raman (2015), la Digital Health è caratterizzata da cinque logiche: professione medica, cittadino, Stato, mercato e scienza.

7

Si tratta di quel blocco di variabili che identificano tutti i termini che esprimono emozioni positive e negative.

8

Si tratta di quel blocco di variabili che identificano tutti i termini inerenti alle necessità ritenute fondamentali.

9

Si tratta di quel blocco di variabili che identificano tutti i termini inerenti alle tematiche biologiche.

10

- 43 -

A. Analisi preliminare relativa agli articoli di carattere divulgativo (banca dati Lexis Nexis)

In prima istanza, dopo che il dataset relativo agli articoli di Lexis Nexis è stato integrato con il rispettivo output ottenuto dall’analisi del linguaggio, è stata costruita la tabella di distribuzione di frequenza assoluta della variabile ANNO DI

PUBBLICAZIONE DELL’ARTICOLO (Figura 6).

Dalla distribuzione di frequenza assoluta di questo carattere (Figura 6) si può osservare come il suo valore minimo sia l’anno 1983 mentre il suo valore massimo sia l’anno 2019; questo significa che l’articolo più datato risale proprio all’estremo inferiore mentre il più recente all’estremo superiore. In termini assoluti, inoltre, è il 2018 l’anno in cui sono stati pubblicati più articoli divulgativi inerenti alla Digital Health.

Una volta ottenute le frequenze assolute, sono state calcolate anche quelle percentuali11 (Figura 7).

11 La frequenza percentuale è calcolata come prodotto tra frequenza relativa e il valore 100.

Figura 6. Distribuzione di frequenza assoluta della variabile ANNO DI

PUBBLICAZIONE DELL’ARTICOLO

- 44 -

Figura 7. Distribuzione di frequenza percentuale della variabile ANNO

DI PUBBLICAZIONE DELL’ARTICOLO

Dalla distribuzione di frequenza percentuale (Figura 7) è possibile affermare che: il 28.6% degli articoli che parlano di Digital Health sono stati pubblicati appena due anni fa, ovvero nel 2018, il 19% circa nel 2017 e il 14.5% nel 2016. Ciò significa che in questi tre anni (2016, 2017 e 2018) si concentra il grosso degli articoli che parlano della tematica in questione.

Successivamente, è stato costruito anche il grafico a barre relativo alle frequenze assolute del carattere ANNO DI PUBBLICAZIONE DELL’ARTICOLO (Grafico 1).

Grafico 1. Grafico a barre per il carattere ANNO DI PUBBLICAZIONE

DELL'ARTICOLO (frequenze assolute)

1 1 1 1 2 4 2 5 12 5 4 1 24 15 18 29 48 30 50 59 129183 297 418 550 822 167 0 100 200 300 400 500 600 700 800 900 1983 1989 1994 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019

- 45 -

Il Grafico 1 permette di visualizzare ancora meglio l’evoluzione della pubblicazione degli articoli; da esso si evince che nel corso degli anni, l’interesse da parte della Stampa (di natura divulgativa, in quanto si ricorda ancora una volta che i dati si riferiscono agli articoli di Lexis Nexis) verso la tematica oggetto di studio è sicuramente aumentato. Tutto ciò conferma l’impressione secondo la quale, in effetti, si tratta di un argomento piuttosto attuale e, quindi, perlomeno dal punto di vista quantitativo, di maggior interesse rispetto al passato.

In seconda istanza, è stata effettuata un’analisi geografica per capire quali fossero i Continenti in cui la discussione sulla Digital Health fosse maggiormente presente. Per fare ciò, sono state eseguite alcune manipolazioni sulla variabile

NOME DELLA RIVISTA. Come prima cosa è stata creata la variabile PAESE

ricercando online le Nazioni in cui le varie riviste (contenenti gli articoli scaricati da Lexis Nexis) effettuano la propria pubblicazione principale. Successivamente, al fine di fornire una rappresentazione globale, si è optato per un raggruppamento in base alla loro appartenenza a ciascuno dei cinque Continenti12; è stata così creata la

variabile CONTINENTE (Tabella 5).

12

Si noti che è stato seguito il modello a cinque Continenti. In esso non si include l'Antartide, considerando così solamente i Continenti abitati dall'uomo.

- 46 -

Tabella 5. Distribuzione di frequenza assoluta della variabile

CONTINENTE

Continente

Frequenza assoluta

America

549

Europa

1.515

Africa

93

Asia

269

Oceania

451

TOT

2.877

Dalla Tabella 5 è possibile osservare come il valore assoluto maggiore sia quello relativo al Continente Europa, pari a 1.515; ciò significa che su 2.877 articoli (ovvero l’universo degli articoli trattanti la Digital Health nel database di Lexis Nexis), 1.515 effettuano la propria pubblicazione principale in Europa (in altre parole sono pubblicati su riviste Europee).

Inoltre, per effettuare un confronto più scrupoloso tra le varie modalità della variabile presa in considerazione sono state calcolate anche le frequenze relative13

e le rispettive frequenze percentuali (Tabella 6).

13 La frequenza relativa è calcolata come rapporto tra la corrispondente frequenza assoluta e la numerosità N delle

- 47 -

Tabella 6. Distribuzione di frequenza assoluta, relativa e percentuale

della variabile CONTINENTE

Continente

Frequenza

assoluta

Frequenza

relativa

Frequenza

percentuale

America

549

0.19

19%

Europa

1.515

0.53

53%

Africa

93

0.03

3%

Asia

269

0.09

9%

Oceania

451

0.16

16%

TOT

2.877

1

100%

Dalla distribuzione di frequenza percentuale è possibile affermare che: fra il totale delle riviste (in cui sono stati pubblicati i 2.877 articoli) il 53% coincide con riviste Europee e il 19% con riviste Americane. Ciò significa che poco più della metà delle riviste che presentano articoli relativi alla tematica Digital Health sono riviste Europee.

Dunque, il Continente in cui si discute maggiormente della tematica oggetto di studio (perlomeno sotto il profilo divulgativo), rispetto agli altri, è proprio l’Europa.

Di seguito, il grafico a nastri relativo alle frequenze assolute del carattere

- 48 -

Grafico 2. Grafico a nastri per il carattere CONTINENTE (frequenze

assolute)

B. Analisi della correlazione lineare relativa agli articoli di carattere divulgativo (banca dati Lexis Nexis)

Prima di passare all’applicazione della correlazione lineare, è utile riassumere brevemente le principali caratteristiche del coefficiente di correlazione lineare.

Il coefficiente di correlazione lineare (ρ)

Il coefficiente di correlazione lineare (ρ) misura la forza della relazione lineare tra due variabili quantitative x e y, e indica il grado in cui la variazione di una variabile è legata alla variazione dell’altra. Da un punto di vista numerico, esso può assumere valori compresi all’interno dell’intervallo: -1 ≤ ρ ≤ +1. Da un punto di vista interpretativo, vale che: il segno di ρ indica la direzione del legame lineare tra le due variabili (+, relazione lineare positiva; -, relazione lineare negativa)

549 1515 269 93 451 0 200 400 600 800 1000 1200 1400 1600 AMERICA EUROPA ASIA AFRICA OCEANIA

- 49 -

mentre il suo valore numerico esprime la forza del legame lineare tra le due variabili (0 assenza di relazione lineare, 1 relazione lineare perfetta).

Infine, perlomeno in ambito descrittivo, si ritiene che un valore del coefficiente di correlazione ≥ 0.70 suggerisca l’esistenza di un legame, negativo o positivo che sia, piuttosto forte tra le variabili e si dice che esse sono correlate, appunto. Però, quando i dati costituiscono un campione - come in questo caso - la sua interpretazione diventa leggermente piò complessa. In questo caso si parla di

coefficiente di correlazione lineare campionario (r). Esso può essere impiegato

per verificare se tra due variabili quantitative x e y esiste una correlazione lineare significativa nella popolazione corrispondente ma per fare ciò è necessario fare inferenza su r. Fare ciò significa valutare se la correlazione lineare campionaria r possa ritenersi significativa per l’intera popolazione oppure no: se è significativa, allora la relazione campionaria può essere estesa alla popolazione, altrimenti no. Nello specifico, il metodo di gran lunga più utilizzato per studiare la significatività (o meno) è quello del p-value. In pratica, calcolato proprio quest’ultimo valore e scelto un livello di significatività (α) (di solito α pari a 0.02 o 0.05) vale che: se p-value < α, allora si può ritenere che la correlazione sia significativa, altrimenti se p-value > α, la correlazione non si può ritenere significativa.

Quindi, da un punto di vista interpretativo, in ambito inferenziale, è assolutamente necessario controllare il p-value in relazione al livello di significatività.

Analisi della correlazione lineare

Ricollegandosi a quanto detto all’inizio del presente capitolo, l’analisi della correlazione lineare è stata impiegata per studiare l’evoluzione nel tempo sia del modo in cui si parla della Digital Health in generale sia delle sue principali logiche; come vedremo, relativamente a quest’ultimo aspetto, sono emersi dei risultati interessanti in merito a due temi specifici.

- 50 -

Per quanto riguarda l’evoluzione nel tempo del modo in cui la Stampa divulgativa parla della Digital Health, si osservi inizialmente la Figura 8, ma prima di commentare ciò che vi è riportato, è utile precisare quanto segue. La Figura 8 coincide con la matrice di correlazione lineare tra la variabile ANNO DI

PUBBLICAZIONE e il blocco di variabili del dizionario di Liwc denominato ”affect words”; all’interno di ogni cella della Figura 8 (così come in ognuna delle

altre Figure presenti in questa sezione) sono riportati i seguenti valori: N (ovvero la numerosità totale delle osservazioni), Sig. (2-tailed) (quel valore che rappresenta il p-value, il quale, come anticipato sopra, va considerato in relazione ad un altro valore, ovvero α14) e Pearson Correlation (quel valore che fornisce

informazioni proprio sulla direzione e sulla forza della correlazione lineare, ovviamente qualora quest’ultima esistesse).

14

Per il presente elaborato è stato scelto un valore di α pari a 0.05.

Figura 8. Matrice di correlazione lineare relativa al blocco di variabili

“AFFECT WORDS” (dizionario Liwc) + la variabile ANNO DI

- 51 -

Una volta chiarito quanto sopra, si consideri finalmente la Figura 8. Da questa è possibile osservare come la variabile ANNO DI PUBBLICAZIONE sia positivamente correlata con il gruppo di variabili del dizionario di Liwc denominato “affect words”; di fatto, nel corso del tempo, è aumentato l’utilizzo di termini emozionali . Nella fattispecie, la variabile ANNO DI PUBBLICAZIONE è correlata positivamente con la variabile (del suddetto gruppo) denominata “negemo”. Dunque, nel corso del tempo, l’utilizzo dei termini che esprimono preoccupazione (sulla tematica oggetto di indagine, ovviamente) è aumentato; in particolar modo, sono le variabili “anger” (rabbia) e, soprattutto, “anxiety” (ovvero, ansia) a determinare tali emozioni negative.

Se si considera poi la correlazione tra la variabile ANNO DI PUBBLICAZIONE e il blocco di variabili del dizionario Liwc definito ”core drives and needs” (Figura 9), vediamo come la variabile ANNO DI PUBBLICAZIONE sia positivamente correlata con le variabili del dizionario “risk”, “achieve” e “reward”.

Figura 9. Matrice di correlazione lineare relativa al blocco di variabili

“CORE DRIVES AND NEEDS” (dizionario Liwc) + la variabile ANNO

- 52 -

Quindi, da un lato vale che oltre ad essere aumentato l’utilizzo di termini negativi, più precisamente di termini che coincidono con un’emozione negativa (come visto nella Figura 8), è aumentato anche l’uso di termini che si concentrano sul rischio, mentre dall’altro vale che è aumentato anche l’uso di termini che si concentrano sui benefici e sui risultati raggiunti.

Ne consegue che nel corso del tempo la preoccupazione nei confronti della Digital Health sembrerebbe essere aumentata e ciò è sottolineato anche dal fatto che l’utilizzo di termini che si concentrano sui rischi ha sperimentato un incremento. Però, accanto a questo discorso negativo e orientato la rischio, è cresciuto anche un altro discorso che evidenzia, al contrario, i risultati raggiunti e i possibili benefici del tema trattato. Relativamente al secondo aspetto trattato, ovvero l’evoluzione nel tempo delle logiche centrali alla Digital Health, si osservi innanzitutto la Figura 10.

Figura 10. Matrice di correlazione lineare relativa al blocco di variabili

“BIOLOGICAL PROCESSES” (dizionario Liwc) + la variabile

ANNO

- 53 -

Considerando ancora una volta la variabile ANNO DI PUBBLICAZIONE (Figura 10), è possibile osservare come essa sia positivamente correlata con le variabili del dizionario “bio” e “health”; quest’ultima, peraltro, è racchiusa proprio all’interno della macro-variabile “bio”. Ciò significa che, nel corso del tempo, è aumentato l’utilizzo dei termini che fanno riferimento ai processi biologici e, nello specifico, il tema relativo alla sfera della salute sembrerebbe aver assunto un’importanza particolare all’interno della discussione sulla Digital Health. E al contrario di quello che si potrebbe pensare, non si tratta affatto di un risultato scontato; infatti, come già anticipato, la tematica oggetto di studio è caratterizzata da diverse logiche fondamentali, e il fatto che il tema specifico della salute (tema più in linea con la logica del cittadino) abbia sperimentato un aumento potrebbe voler dire che altri temi (connessi ad altre logiche), al contrario, abbiano avuto un andamento opposto nel corso del tempo. Proprio a tal fine si osservi la Figura 11.

Figura 11. Matrice di correlazione lineare relativa al blocco di variabili

“PERSONAL CONCERNS” (dizionario Liwc) + la variabile ANNO DI

- 54 -

Dalla Figura 11, in effetti, si può affermare che la variabile ANNO DI

PUBBLICAZIONE è correlata negativamente con la tematica “work” e ciò significa

che nel corso del tempo il tema del lavoro (tema connesso alla logica del mercato), ha trovato meno spazio all’interno della discussione pubblica sulla Digital Health; in altre parole, tale logica sembrerebbe esser divenuta meno rilevante all’interno della discussione stessa.

Per approfondire la questione sono state poi calcolate le correlazioni tra le due tematiche e le emozioni ad esse associate nonché le correlazioni tra le due tematiche stesse e la variabile “risk” (Figura 12, Figura 13 e Figura 14).

Il tema “health” risulta essere correlato positivamente con la variabile “negemo”; in particolar modo, il tema in questione è correlato positivamente con la variabile

“anxiety” e negativamente con la variabile “anger” (Figura 12). Al contrario, il tema “work” risulta essere positivamente correlato con la variabile “posemo” ma

negativamente correlata con la variabile “negemo”; nello specifico, rispetto a

Figura 12. Matrice di correlazione lineare relativa al blocco di variabili

“AFFECT WORDS” (dizionario Liwc) + la variabile “HEALTH”

- 55 -

quest’ultima correlazione, la variabile “work” è correlata negativamente con la variabile “anxiety”, “anger” e “sad” (ovvero le tre variabili che costituiscono la variabile “negemo” stessa) (Figura 13).

In pratica vale che: all’aumentare dei termini che identificano il tema “health” aumentano anche i termini che esprimono emozioni negative, al contrario all’aumentare dei termini che identificano il tema “work” diminuiscono i termini che esprimono emozioni negative.

Figura 13. Matrice di correlazione lineare relativa al blocco di variabili

“AFFECT WORDS” (dizionario Liwc) + la variabile “WORK”

- 56 -

Infine, dalla Figura 14 si osserva che la variabile “work” è correlata negativamente con la variabile “risk” e, al contrario, quest’ultima risulta essere correlata positivamente con la variabile “health”. Inoltre, la variabile “work” risulta essere correlata negativamente con la variabile “health”. Pertanto, sembrano essere presenti due logiche contrapposte, tramite le quali il tema della Digital Health viene considerata, da un lato, attraverso una lente più positiva e finalizzata a evidenziarne gli aspetti legati al mercato e, dall’altro, attraverso un focus più negativo e riguardante i rischi per la salute.

Di fatto, da quest’ultima correlazione emerge che all’aumentare del numero di termini che identificano il tema “work” diminuisce il numero dei termini che si concentrano sul rischio, al contrario all’aumentare dei termini che identificano il tema

“health” aumentano anche i termini che si concentrano sul rischio.

Dunque, dalle considerazioni effettuate finora emerge che nel corso del tempo il tema

“work” (tema legato alla logica del mercato) è passato in secondo piano all’interno

della discussione sulla Digital Health mentre il tema “health” (maggiormente inerente alla logica del cittadino) è emerso come tema fondamentale nella discussione stessa. Inoltre, vale che: maggiore è la presenza della tematica “health” negli articoli considerati maggiore è l’utilizzo sia dei termini che esprimono preoccupazione sia di

Figura 14. Matrice di correlazione lineare tra le variabili “HEALTH”

(dizionario Liwc), la variabile “RISK” (dizionario Liwc) e la variabile

- 57 -

quelli che si concentrano sui rischi, mentre maggiore è la presenza della tematica

“work” minore è l’utilizzo sia dei termini che esprimono preoccupazione sia di quelli

che si concentrano sui rischi. Infine, come anticipato sopra, si noti che le variabili

“work” e “health” sono correlate negativamente: ciò significa che gli articoli che

parlano di un tema tendenzialmente non parlano dell’altro, i due discorsi sono cioè ben contrapposti l’uno all’altro.

C. ANOVA relativa agli articoli di carattere divulgativo (banca dati Lexis Nexis)

Anche in questo caso, prima di passare all’applicazione dell’ANOVA, è utile vederne le caratteristiche principali.

Associazione tra variabili miste: l’ANOVA

L’ANOVA, acronimo dell’espressione inglese Analysis Of Variance, raggruppa un insieme di tecniche statistiche da utilizzare in ambito inferenziale nel caso di associazione tra variabili miste, ovvero una variabile x qualitativa e una y quantitativa, per esempio. Infatti, quando i dati sono il risultato di un campionamento - come in questo caso - è possibile ricorrere alla verifica di ipotesi per stabilire se le medie della variabile quantitativa y differiscono in maniera significativa rispetto alla variabile qualitativa x anche nella popolazione, oppure no. Nello specifico, l’ANOVA è quella procedura inferenziale che permette di confrontare le medie di più gruppi suddividendo la variabilità totale in una variabilità dovuta alle differenze tra i gruppi (Between) e in una variabilità dovuta alle differenze all’interno dei gruppi (Within). L’analisi della varianza si basa sul confronto fra la varianza tra i gruppi (Between) e la varianza entro i gruppi (Within) mediante la statistica test F.

- 58 -

Dal punto di vista interpretativo vale che: scelto il livello di significatività (α), quando il valore della statistica test F osservato sul campione è tale che il p-value < α allora la differenza tra le medie è significativa, al contrario quando il valore della statistica test F osservato sul campione è tale che il p-value > α, allora la differenza tra le medie non si può ritenere significativa.

Applicazione dell’ANOVA

L’ANOVA, nel caso specifico, è stata condotta per studiare le (eventuali) differenze esistenti tra i cinque Continenti; in effetti, anche dal punto di vista geografico, sono emersi degli aspetti interessanti sia rispetto alla questione relativa al modo in cui la Stampa divulgativa tratta il tema oggetto di studio sia rispetto alla questione legata alle sue logiche.

In primo luogo, è stata effettuata l’ANOVA tra la variabile indipendente

CONTINENTE e il blocco di variabili del dizionario di Liwc denominato “affect words” (variabili dipendenti) con particolare attenzione nei confronti della

variabile “negemo, variabile che da un punto di vista temporale (si veda la sezione B) ha registrato un aumento, e la variabile “posemo” (Figura 15 e Figura 16).

Figura 15. ANOVA tra la variabile CONTINENTE e le variabili

“NEGEMO” + “POSEMO” (dizionario Liwc)

- 59 -

Dalla Figura 15 si osserva che il valore della statistica test F è tale che il p-value < α (per entrambe le variabili): in sostanza, le medie della variabile “negemo” e quelle della variabile “posemo” differiscono in maniera significativa rispetto alla variabile indipendente CONTINENTE. Esiste cioè una differenza significativa circa e l’utilizzo di termini che esprimono preoccupazione e l’utilizzo di termini che coincidono con emozioni positive. Per completezza si osservi anche la Figura 16: nel caso della variabile “negemo”, la media più alta risulta essere quella del Continente OCEANIA, mentre quella più bassa risulta essere quella del Continente AFRICA, nel caso della variabile “posemo”, la media più alta risulta essere quella dell’ASIA, mentre quella più bassa risulta essere quella dell’OCEANIA.

Poiché l’analisi della varianza è risultata significativa (in entrambi i casi), è stata effettuata anche l’analisi POST-HOC; quest’ultima è stata condotta per poter effettuare un confronto tra i vari Continenti (Figura 17 e Figura 18).

Figura 16. ANOVA tra la variabile CONTINENTE e le variabili

“NEGEMO” + “POSEMO” (dizionario Liwc)

- 60 -

Dall’analisi POST-HOC con il metodo di Bonferroni (Figura 17) emerge che le uniche differenze che non sono significative sono quella tra AFRICA-ASIA ed

Documenti correlati