• Non ci sono risultati.

Regressione Logistica Binaria dividendo il dataset in decadi

CAPITOLO 4 ANALISI DEI RISULTATI

4.4 Analisi 4: Regressione logistica binaria

4.4.2 Regressione Logistica Binaria dividendo il dataset in decadi

Nuovamente si procede alla suddivisione del dataset in sei decadi, al fine di valutare, decade per decade, quali sono le variabili più predittive del successo e se queste sono sempre le stesse oppure cambiano nel corso del tempo.

4.4.2.1 Decade ‘60s

Le tabelle dell’output che verranno riportare saranno le medesime di cui sopra (relative al blocco 1), al fine di rendere più chiara l’interpretazione dei risultati (Tabella n.53).

Tabella n.53 – Log di verosimiglianza e indire R quadro decade ‘60s

Il valore del -2LL è piuttosto elevato il che indica che vi è buona parte della variabilità del modello che non è spiegata e, quindi, una limitata capacità di previsione dei modelli statistici (-2LL = 9321.293). Inoltre, si nota subito un’importante novità rispetto ai risultati rilevati su tutto il campione, ovverosia il modello si arresta all’iterazione numero 20, che è il numero massimo consentito, senza trovare una soluzione finale.

Anche in questo caso il Chi-quadrato non è stato riportato per privilegiare la sintesi, ma il suo valore di significatività è, anche in questo caso, inferiore a .05, dimostrando che la previsione migliora se si considerano i predittori.

Il valore 𝑅 di Nagelkerke, che è quello che si preferisce considerare, presenta un valore inferiore rispetto a quello complessivo pari a .353, dimostrando un adattamento più contenuto ai dati rispetto al caso precedente. Resta comunque un valore piuttosto soddisfacente che può condurre ad affermare che il modello spiega ancora piuttosto bene il successo o insuccesso musicale di un brano.

Riepilogo del modelloa

Fase Logaritmo della verosimiglianza -2 R-quadrato di Cox e Snell R-quadrato di Nagelkerke

1 9321,293b 0,265 0,353

a. decade = 1960

Tabella di classificazionea,b Osservato Previsto target Percentuale di correttezza 0 1 Fase 1 target 0 2883 1438 66,7 1 928 3393 78,5 Percentuale globale 72,6 a. decade = 1960 b. Il valore di divisione è ,500

Tabella n.54 – Tabella di classificazione decade ‘60s

La tabella di classificazione indica come il modello predice l’appartenenza al gruppo delle “Hit” o dei “Flop”. Il modello attuale classifica correttamente2883canzoni che sono “Flop”, me ne classifica non correttamente altre 1438 (classifica correttamente il 66.7% dei casi). Il modello classifica correttamente anche 3393 “Hit”, ma ne presenta altre non elencate correttamente (928), in questo caso classifica correttamente il 78.5% dei casi. L’accuratezza complessiva della classificazione è pari a 72.6% (Tabella n.54).

Ciò può essere confrontato con la situazione di sola inclusione della costante, dove erano classificate correttamente il 50% delle canzoni, ma con l’inclusione dei predittori, questo valore è salito al 72.6%, quasi in linea con il modello elaborato su tutto il dataset (73%).

Variabili nell'equazionea

β S.E. Wald gl Sign. Exp(B) Fase 1b danceability 1,468 0,227 41,697 1 0,000 4,342 energy 0,919 0,233 15,569 1 0,000 2,508 loudness 0,028 0,009 9,608 1 0,002 1,029 mode 0,884 0,062 203,019 1 0,000 2,420 speechiness -6,964 0,584 141,953 1 0,000 0,001 acousticness -1,174 0,110 113,821 1 0,000 0,309 instrumentalness -2,337 0,113 426,303 1 0,000 0,097 liveness 0,463 0,156 8,825 1 0,003 1,589 valence 0,424 0,161 6,894 1 0,009 1,528 tempo 0,004 0,001 20,606 1 0,000 1,004

duration_ms 0,000 0,000 1,696 1 0,193 1,000 chorus_hit 0,000 0,001 0,218 1 0,640 1,000 sections -0,081 0,009 90,213 1 0,000 0,922 time_signature1 -22,792 40374,782 0,000 1 1,000 0,000 time_signature3 -21,951 40374,782 0,000 1 1,000 0,000 time_signature4 -22,227 40374,782 0,000 1 1,000 0,000 time_signature5 -23,361 40374,782 0,000 1 1,000 0,000 key_1 0,429 0,125 11,725 1 0,001 1,536 key_2 -0,185 0,101 3,381 1 0,066 0,831 key_3 0,269 0,134 4,001 1 0,045 1,308 key_4 0,039 0,113 0,119 1 0,730 1,040 key_5 0,072 0,099 0,531 1 0,466 1,075 key_6 0,415 0,147 7,977 1 0,005 1,514 key_7 0,012 0,096 0,017 1 0,897 1,012 key_8 0,195 0,123 2,517 1 0,113 1,215 key_9 -0,025 0,105 0,056 1 0,813 0,975 key_10 0,475 0,114 17,438 1 0,000 1,609 key_11 0,516 0,141 13,441 1 0,000 1,675 Costante 21,882 40374,782 0,000 1 1,000 3186792641,029 a. decade = 1960

b. Variabili inserite nella fase 1: danceability, energy, loudness, mode, speechiness, acousticness, instrumentalness, liveness, valence, tempo, duration_ms, chorus_hit, sections, time_signature1, time_signature3, time_signature4, time_signature5, key_1, key_2, key_3, key_4, key_5, key_6, key_7, key_8, key_9, key_10, key_11.

Tabella n.55 – Variabili nell’equazione decade ‘60s

Partendo anche in questo caso dall’osservazione dei β si notano dei cambiamenti anche rilevanti rispetto all’andamento generale (Tabella n.55).

La ballabilità risulta ancora in testa alla classifica dei migliori predittori del successo di un brano musicale, anche se i valori che presenta si sono notevolmente ridimensionati (1.468).

L’energia, invece, assume adesso un valore positivo di β (0.919), contrariamente a quanto rilevato nella sezione precedente. Altre variabili che hanno invertito i loro ruoli rispetto all’andamento generale sono “liveness”, “chorus_hit” che presentano non più un valore negativo ma neutro (.00), la tonalità 7 (SOL), che si aggiunge alle altre covariate come predittrice del successo musicale e, infine,

“tempo” che mentre prima assumeva un valore pari a 0, adesso è correlato alle “Hit” in maniera positiva, seppur con piccoli valori.

Tutte le altre covariate non citate presentano ancora correlazione negativa con le “Hit”, con la particolarità che molte adesso assumono valori ancora più elevati, ad esempio “speechiness” e tutte le varianti di “time_signature”, sottolineando il fatto che queste variabili sono molto predittive dei “Flop”.

Dalla colonna della significatività, si deduce che fra i risultati non significativi ci sono quelli relativi a “duration_ms”, “chorus_hit”, tutti quelli relativi al tempo musicale (proprio come era accaduto nella precedente sezione) e, infine, quelli di “key_2, 4, 5, 7, 8, 9”; gli altri non citati sono tutti più o meno significativi.

Fra i valori più altamente significativi vi sono, come per l’andamento generale, “danceability”, “energy”, “speechiness”, “acousticness”, “instrumentalness”, “valence”, questa volta anche “tempo”, “sections” e “key_1, 6, 10, 11”.

Nuovamente vengono citati anche i risultati della statistica di Wald, per valutare la significatività dei singoli parametri. Le variabili che presentano dei coefficienti β significativamente diversi da zero sono: “danceability”, “speechiness”, “instrumentalness”, e tutti i tempi musicali: tutti questi stanno dando un contributo significativo alla previsione del risultato (successo o insuccesso).

Per una maggior accuratezza, si tende ancora a considerare il rapporto di probabilità anziché la statistica di Wald.

Osservandone i risultati, si rileva che la variabile con un valore più elevato di tutte è ancora la ballabilità, seguita da “energy”, “mode”, “loudness” (anche se minore rispetto all’andamento generale), “liveness”, “valence” e, infine tutte le tonalità eccetto la 2 e la 9. Tutte queste variabili presentano valori superiori ad 1, dimostrando che se il predittore aumenta, la probabilità che il risultato (successo) si verifichi aumenta.

Altre covariate presentano un valore esattamente pari ad 1, interpretabile in modo quasi analogo a quello delle variabili sopra menzionate, si tratta di “tempo”, “chorus_hit” e “duration_ms”, tutte le

altre, invece, presentano valori inferiori ad uno, dimostrando che all’aumentare del predittore, la probabilità che si verifichi il successo di un brano si riduce.

In conclusione, fra i migliori predittori del successo/insuccesso (quelli che lo spiegano meglio) si può annoverare senz’altro la ballabilità al primo posto, a seguire “energy” “mode”, “liveness”, “valence” “loudness”, “key_1, 3, 4, 5, 6, 7, 8, 10, 11” e tutte le altre che presentano segno positivo del coefficiente β.

4.4.2.2 Decade ‘70s

Riepilogo del modelloa

Fase Logaritmo della verosimiglianza -2 R-quadrato di Cox e Snell R-quadrato di Nagelkerke

1 8398,731b 0,263 0,350

a. decade = 1970

b. Stima terminata all'iterazione numero 5 perché le stime dei parametri sono state modificate in misura inferiore a ,001.

Tabella n.56 - Log di verosimiglianza e indire R quadro decade ‘70s

Esaminando la Tabella n.56, si nota come il valore del logaritmo di verosimiglianza si sia ridotto rispetto alla decade dei ‘60s e che questo risultato sia stato raggiunto con 5 iterazioni, numero molto contenuto rispetto a quanto rilevato nella precedente decade.

Anche il valore 𝑅 di Nagelkerke si è leggermente ridotto, restando sempre comunque molto in linea con gli anni ’60, confermando il fatto che il modello spiega piuttosto adeguatamente il successo o insuccesso di una canzone.

Ancora una volta i risultati della statistica Chi-quadrato presentano un livello di significatività inferiore a .05, dimostrando che la previsione migliora se si considerano i predittori.

Tabella di classificazionea,b Osservato Previsto target Percentuale di correttezza 0 1 Fase 1 target 0 2507 1376 64,6 1 812 3071 79,1 Percentuale globale 71,8 a. decade = 1970 b. Il valore di divisione è ,500

Tabella n.57 – Tabella di classificazione decade ‘70s

Di nuovo i risultati appaiono piuttosto in linea che quelli degli anni ’60 e dell’andamento in generale, con una piccolissima flessione.

Adesso il modello classifica correttamente 2507 “Flop”, me ne classifica non correttamente altre 1376 (classifica correttamente il 64.6% dei casi). Il modello classifica correttamente anche 3701 “Hit”, ma ne presenta altre non elencate correttamente (812), in questo caso classifica correttamente il 79.1% dei casi. L’accuratezza complessiva della classificazione è pari a 71.8%. Confrontando questo risultato con quello di sola inclusione della costante, vediamo che il modello migliora notevolmente passando dal 50% dei brani classificati correttamente al 71.8% (Tabella n.57).

Variabili nell'equazionea

β S.E. Wald gl Sign. Exp(B) Fase 1b danceability 2,928 0,230 161,798 1 0,000 18,691 energy 0,230 0,233 0,972 1 0,324 1,258 loudness 0,031 0,010 9,572 1 0,002 1,031 mode 0,422 0,063 45,485 1 0,000 1,525 speechiness -7,653 0,592 166,891 1 0,000 0,000 acousticness -1,413 0,112 158,208 1 0,000 0,244 instrumentalness -2,927 0,128 519,570 1 0,000 0,054 liveness -0,126 0,153 0,685 1 0,408 0,881 valence -0,362 0,156 5,418 1 0,020 0,696 tempo 0,001 0,001 1,146 1 0,284 1,001 duration_ms 0,000 0,000 0,180 1 0,671 1,000 chorus_hit 0,000 0,001 0,006 1 0,940 1,000

sections -0,004 0,005 0,698 1 0,403 0,996 time_signature1 -0,141 0,497 0,080 1 0,777 0,869 time_signature3 0,645 0,377 2,939 1 0,086 1,907 time_signature4 1,224 0,367 11,105 1 0,001 3,401 key_1 0,243 0,141 2,970 1 0,085 1,275 key_2 -0,309 0,103 9,026 1 0,003 0,734 key_3 0,437 0,181 5,812 1 0,016 1,548 key_4 -0,156 0,116 1,801 1 0,180 0,856 key_5 -0,038 0,113 0,114 1 0,736 0,963 key_6 0,006 0,158 0,002 1 0,968 1,006 key_7 -0,315 0,104 9,159 1 0,002 0,730 key_8 -0,223 0,143 2,427 1 0,119 0,800 key_9 -0,174 0,104 2,826 1 0,093 0,840 key_10 0,231 0,133 3,041 1 0,081 1,260 key_11 -0,141 0,134 1,110 1 0,292 0,869 Costante -1,054 0,460 5,243 1 0,022 0,349 a. decade = 1970

b. Variabili inserite nella fase 1: danceability, energy, loudness, mode, speechiness, acousticness, instrumentalness, liveness, valence, tempo, duration_ms, chorus_hit, sections, time_signature1, time_signature3, time_signature4, key_1, key_2, key_3, key_4, key_5, key_6, key_7, key_8, key_9, key_10, key_11.

Tabella n.58 – Variabili nell’equazione decade ‘70s

Esaminando la Tabella n.58, si nota come ancora una volta la ballabilità presenti il più elevato valore del coefficiente β, salendo rispetto agli anni ‘60 (2.928).

L’energia ha ancora un valore positivo, ma ridotto passando da 0.919 a 0.230.

Altre variabili che continuano ad avere valori positivi sono “mode” e “loudness”, ma anche le tonalità 1, 3, 5, 6, 8 e 10.

Vi sono poi delle covariate che, mentre prima sembravano predire più un insuccesso, adesso fanno il contrario, in particolare si parla di “time_signature3 e 4”, mentre gli altri tempi, seppur con valore negativo, si sono notevolmente ridimensionati. “Speechiness” ha un valore negativo più elevato rispetto a quanto visto nelle precedenti sezioni, caratterizzando ancora di più i “Flop”.

Per tutte le altre variabili non citate i risultati continuano ad essere in linea con l’andamento pregresso e quello generale.

I risultati non significativi riguardano:” energy”, “liveness” “tempo”, “duration_ms”, “chorus_hit”, “sections”, “time_signature1”, “time_signature3”, e tutte le tonalità eccetto la 2, 3 e 7.

Fra i valori più altamente significativi vi sono “danceability”, “mode”, “speechiness”, “acousticness”, “instrumentalness”, “valence”, “time_signature4”, “key_2, 3 e 7”.

Infine, osservando i valori del rapporto di probabilità, si rileva che la variabile con un valore più elevato di tutte è ancora la ballabilità, seguita dal 4/4, 3/4, poi “key_3”, “mode” “energy”, “loudness, “liveness”, “valence” e, infine tutte le tonalità eccetto la 2, 4, 5, 7, 8, 9 e la 11. Tutte queste variabili presentano valori superiori ad 1, dimostrando che se il predittore aumenta, la probabilità che il risultato (successo) si verifichi aumenta.

Altre covariate presentano un valore esattamente pari ad 1 come “tempo”, “chorus_hit” e “duration_ms”, tutte le altre, invece, presentano valori inferiori ad uno, il che indica che all’aumentare del predittore, la probabilità che si verifichi il successo di un brano si riduce.

Fra i migliori predittori del successo, quindi, vi sono la ballabilità, “time_signature3 e 4”, la terza tonalità (RE#/Mib), ancora “energy”, “mode”, “loudness” e, a seguire, le altre con β positivo, ma si abbandonano “valence” e “liveness”.

4.4.2.3 Decade ‘80s

Riepilogo del modelloa

Fase Logaritmo della verosimiglianza -2 R-quadrato di Cox e Snell R-quadrato di Nagelkerke

1 6717,139b 0,339 0,452

a. decade = 1980

b. Stima terminata all'iterazione numero 6 perché le stime dei parametri sono state modificate in misura inferiore a ,001.

Tabella n.59 - Log di verosimiglianza e indice R quadro decade ‘80s

Passando agli anni ’80, i valori del logaritmo di verosimiglianza migliorano notevolmente rispetto alle precedenti decadi e all’andamento generale, così come l’indice 𝑅 che adesso presenta un valore

pari a .45, indicando che il modello spiega correttamente quasi il 50% della variabile “target” (Tabella n.59).

Tabella di classificazionea,b

Osservato Previsto target Percentuale di correttezza 0 1 Fase 1 target 0 2425 1029 70,2 1 586 2868 83,0 Percentuale globale 76,6 a. decade = 1980 b. Il valore di divisione è ,500

Tabella n.60 – Tabella di classificazione decade ‘80s

Anche osservando la Tabella n.60, si nota come il modello stia andando verso un miglioramento, in quanto l’accuratezza complessiva della classificazione è ora pari a 76.6%, valore superiore rispetto alle precedenti decadi e all’andamento generale.

Variabili nell'equazionea

β S.E. Wald gl Sign. Exp(B) Fase 1b danceability 4,387 0,248 311,796 1 0,000 80,379 energy -0,726 0,255 8,102 1 0,004 0,484 loudness 0,101 0,012 74,493 1 0,000 1,106 mode 0,281 0,069 16,717 1 0,000 1,324 speechiness -16,793 0,908 341,925 1 0,000 0,000 acousticness -2,179 0,147 220,795 1 0,000 0,113 instrumentalness -4,057 0,194 437,200 1 0,000 0,017 liveness -0,780 0,173 20,231 1 0,000 0,458 valence -0,437 0,158 7,647 1 0,006 0,646 tempo 0,000 0,000 0,033 1 0,856 1,000 duration_ms 0,000 0,000 1,168 1 0,280 1,000 chorus_hit -0,001 0,001 1,994 1 0,158 0,999 sections 0,011 0,008 2,067 1 0,151 1,011 time_signature1 -0,172 0,663 0,067 1 0,796 0,842 time_signature3 -0,422 0,466 0,819 1 0,365 0,656

time_signature4 0,255 0,446 0,327 1 0,568 1,290 key_1 0,040 0,143 0,078 1 0,780 1,041 key_2 -0,129 0,119 1,172 1 0,279 0,879 key_3 -0,244 0,190 1,653 1 0,199 0,783 key_4 -0,139 0,130 1,143 1 0,285 0,870 key_5 -0,021 0,136 0,024 1 0,876 0,979 key_6 0,117 0,166 0,496 1 0,481 1,124 key_7 -0,151 0,120 1,591 1 0,207 0,860 key_8 0,194 0,171 1,285 1 0,257 1,214 key_9 -0,088 0,117 0,567 1 0,452 0,916 key_10 0,173 0,152 1,291 1 0,256 1,189 key_11 0,189 0,142 1,762 1 0,184 1,207 Costante 0,854 0,535 2,553 1 0,110 2,349 a. decade = 1980

b. Variabili inserite nella fase 1: danceability, energy, loudness, mode, speechiness, acousticness, instrumentalness, liveness, valence, tempo, duration_ms, chorus_hit, sections, time_signature1, time_signature3, time_signature4, key_1, key_2, key_3, key_4, key_5, key_6, key_7, key_8, key_9, key_10, key_11.

Tabella n.61 – Variabili nell’equazione decade ‘80s

La ballabilità è ancora la covariata con il valore più elevato di β, che è cresciuto rispetto alle decadi precedenti, mentre l’energia è tornata ad essere correlata negativamente con il successo.

“Loudness”, “mode” e “time_signature4” continuano ad avere valori positivi, come le tonalità 1, 6, 8, 10 e 11, in aggiunta vi è “sections” che fino ad ora era più predittiva dei “Flop”.

La parlabilità peggiora ancora di più nella decade in questione come anche “acousticness” e “instrumentalness”.

I risultati sono altamente significativi per tutte le variabili da “danceability” a “valence” compresa, mentre per tutte le successive non lo sono affatto.

Si osservano, poi, i valori del rapporto di probabilità. La variabile con un valore più elevato di tutte è ancora la ballabilità, seguita da “mode” “time_signature4”, poi “key_, 6, 8, 10, 11” e “loudness”. Tutte queste variabili presentano valori superiori ad 1, dimostrando che se la variabile aumenta, la probabilità che il risultato (successo) si verifichi aumenta. Sono questi i migliori predittori del successo in questa decade (Tabella n.61).

4.4.2.4 Decade ‘90s

Riepilogo del modelloa

Fase Logaritmo della verosimiglianza -2 R-quadrato di Cox e Snell R-quadrato di Nagelkerke

1 4686,928b 0,416 0,554

a. decade = 1990

b. Stima terminata all'iterazione numero 6 perché le stime dei parametri sono state modificate in misura inferiore a ,001.

Tabella n.62 - Log di verosimiglianza e indire R quadro decade ‘90s

Come si nota dalla Tabella n.62, il Log verosimiglianza va verso una progressiva riduzione, testimoniando il fatto che il modello statistico sta affinando la sua capacità di previsione del successo musicale.

Anche l’𝑅 di Nagelkerke supera il .50, dimostrando che il modello spiega ben oltre la metà dei dati.

Senza riportarne la relativa tabella, i risultati soddisfacenti sono confermati anche dal fatto che la percentuale di correttezza adesso è dell’80.9%.

Variabili nell'equazionea

β S.E. Wald gl Sign. Exp(B) Fase 1b danceability 7,242 0,315 528,468 1 0,000 1397,153 energy -1,614 0,313 26,566 1 0,000 0,199 loudness 0,161 0,016 105,796 1 0,000 1,175 mode 0,216 0,084 6,632 1 0,010 1,241 speechiness -2,290 0,503 20,708 1 0,000 0,101 acousticness -2,982 0,183 265,352 1 0,000 0,051 instrumentalness -4,038 0,219 340,164 1 0,000 0,018 liveness -1,034 0,221 21,982 1 0,000 0,356 valence -1,882 0,195 93,558 1 0,000 0,152 tempo 0,001 0,001 3,181 1 0,074 1,001 duration_ms 0,000 0,000 2,426 1 0,119 1,000 chorus_hit 0,001 0,001 1,533 1 0,216 1,001 sections 0,075 0,010 54,557 1 0,000 1,077

time_signature1 0,245 0,777 0,099 1 0,753 1,278 time_signature3 0,477 0,510 0,876 1 0,349 1,612 time_signature4 0,426 0,487 0,766 1 0,381 1,532 key_1 0,411 0,168 6,009 1 0,014 1,509 key_2 -0,220 0,154 2,048 1 0,152 0,802 key_3 0,014 0,229 0,004 1 0,953 1,014 key_4 0,044 0,166 0,070 1 0,791 1,045 key_5 0,187 0,163 1,309 1 0,252 1,206 key_6 0,473 0,173 7,473 1 0,006 1,605 key_7 0,180 0,148 1,487 1 0,223 1,197 key_8 0,441 0,191 5,335 1 0,021 1,554 key_9 -0,079 0,153 0,267 1 0,606 0,924 key_10 0,586 0,188 9,752 1 0,002 1,797 key_11 0,592 0,177 11,229 1 0,001 1,807 Costante -0,762 0,628 1,473 1 0,225 0,467 a. decade = 1990

b. Variabili inserite nella fase 1: danceability, energy, loudness, mode, speechiness, acousticness, instrumentalness, liveness, valence, tempo, duration_ms, chorus_hit, sections, time_signature1, time_signature3, time_signature4, key_1, key_2, key_3, key_4, key_5, key_6, key_7, key_8, key_9, key_10, key_11.

Tabella n.63 – Variabili nell’equazione decade ‘90s

La Tabella n.63 sopra riportata evidenzia una coerenza con quanto rilevato nel corso delle decadi precedenti. La ballabilità rimane stabile come covariata con il valore più elevato di β, sempre in aumento nel corso del tempo, che è cresciuto rispetto alle decadi precedenti. Adesso, oltre che il tempo 4/4, anche gli altri presentano valori positivi di β ed anche quasi tutte le tonalità eccetto la 2 e la 9.

La parlabilità presenta, invece, un valore sempre negativo di β, ma che va verso un ridimensionamento.

I risultati sono altamente significativi per tutte le variabili da “danceability” a “valence” compresa, per “sections” e per le tonalità 1, 5, 8, 10 e 11 mentre per tutte le altre non lo sono.

Per quanto riguarda il rapporto di probabilità, la ballabilità è di gran lunga la variabile che predice meglio il successo di un brano, seguita poi dalle altre con valori nettamente inferiori, ma pur sempre

che superano il limite di 1 (“mode”, “loudness”, tutti i tempi musicali, “sections”, se pur con valori molto ridotti, ed alcune tonalità visibili in tabella). Queste sono i migliori predittori del successo in questa decade.

4.4.2.5 Decade ‘00s

Riepilogo del modelloa

Fase Logaritmo della

verosimiglianza -2 R-quadrato di Cox e Snell R-quadrato di Nagelkerke 1 4664,368b 0,447 0,596 a. decade = 2000

b. Stima terminata all'iterazione numero 20 perché è stato raggiunto il numero massimo di iterazioni. Impossibile trovare la soluzione finale.

Tabella n.64 - Log di verosimiglianza e indire R quadro decade ’00s

I valori riportati nella Tabella n.64 confermano ancora il miglioramento del modello a mano a mano che si va avanti nel tempo, infatti il logaritmo di verosimiglianza si è ridotto e l’𝑅 , invece, è aumentato arrivando alla soglia del .60.

Anche i valori presenti nella tabella di classificazione confermano questo continuo miglioramento, presentando un’accuratezza complessiva della regressione dell’82.5% (quasi tutti i brani musicali sono correttamente classificati).

Variabili nell'equazionea

β S.E. Wald gl Sign. Exp(B) Fase 1b danceability 5,540 0,302 337,457 1 0,000 254,656 energy -6,307 0,360 306,523 1 0,000 0,002 loudness 0,459 0,023 406,818 1 0,000 1,583 mode 0,629 0,081 60,091 1 0,000 1,877 speechiness 0,104 0,403 0,067 1 0,796 1,110 acousticness -2,142 0,213 100,886 1 0,000 0,117 instrumentalness -5,963 0,399 223,189 1 0,000 0,003 liveness -0,606 0,232 6,805 1 0,009 0,546 valence -0,311 0,195 2,558 1 0,110 0,733 tempo 0,000 0,000 2,043 1 0,153 1,000 duration_ms 0,000 0,000 4,136 1 0,042 1,000

chorus_hit 0,000 0,001 0,000 1 0,997 1,000 sections -0,035 0,011 10,928 1 0,001 0,966 time_signature1 11,039 40210,130 0,000 1 1,000 62243,365 time_signature3 11,741 40210,130 0,000 1 1,000 125593,561 time_signature4 12,179 40210,130 0,000 1 1,000 194687,149 time_signature5 12,505 40210,130 0,000 1 1,000 269568,927 key_1 0,363 0,158 5,283 1 0,022 1,438 key_2 0,036 0,154 0,055 1 0,815 1,037 key_3 0,907 0,241 14,198 1 0,000 2,478 key_4 0,438 0,168 6,803 1 0,009 1,549 key_5 0,540 0,174 9,660 1 0,002 1,716 key_6 0,440 0,178 6,146 1 0,013 1,553 key_7 0,234 0,154 2,302 1 0,129 1,264 key_8 0,361 0,178 4,126 1 0,042 1,435 key_9 0,179 0,159 1,267 1 0,260 1,196 key_10 0,586 0,179 10,686 1 0,001 1,796 key_11 0,117 0,168 0,487 1 0,485 1,125 Costante -6,911 40210,130 0,000 1 1,000 0,001 a. decade = 2000

b. Variabili inserite nella fase 1: danceability, energy, loudness, mode, speechiness, acousticness, instrumentalness, liveness, valence, tempo, duration_ms, chorus_hit, sections, time_signature1, time_signature3, time_signature4, time_signature5, key_1, key_2, key_3, key_4, key_5, key_6, key_7, key_8, key_9, key_10, key_11.

Tabella n.65 - Variabili nell’equazione decade ‘00s

La Tabella n.65 espone dei cambiamenti piuttosto rilevanti.

In particolare, la ballabilità, nonostante presenti ancora un valore piuttosto elevato, riduce il suo β rispetto agli anni ’90, ma osservando i valori della significatività e del rapporto di probabilità, la possiamo ritenere ancora la miglior predittrice del successo musicale.

L’energia continua ad essere correlata più ai “Flop” e, addirittura, il valore di β (negativo) è ancora più grande.

Per la prima volta, però, “speechiness” non è più correlata negativamente alle “Hit”, ma presenta un coefficiente non negativo, seppur di ridotte dimensioni, come a significare il progredire verso l’importanza del testo per una canzone di successo.

Infine, tutti i tempi musicali e, per la prima volta, tutte le tonalità presentano un β positivo, in particolare tutte e cinque le varianti di “time_signature” hanno incrementato notevolmente il loro valore superando la ballabilità, anche del rapporto di probabilità. Nonostante ciò, i risultati per queste ultime variabili citate non sono affatto significativi.

Altre variabili presentano risultati non significativi, quali: “speechiness”, “valence”, “tempo”, “chorus_hit”, key_1, 7, 9 e 11”, tutti gli altri sono invece significativi.

I miglior predittori del successo sono ancora “danceability”, “loudness”, “mode” ed alcune tonalità quali il DO#/REb (“key_1”), RE#/Mib (“key_3”), MI (“key_4”), FA (“key_5”), FA#/SOLb (“key_6”), SOL#/Lab (“key_8”) e LA#/Sib (“key_10”). “Duration_ms”, invece, ha un coefficiente β nullo, ma un valore di significatività entro la soglia di .05 e un valore pari ad 1 del rapporto di probabilità, si può considerare come neutra nei confronti del successo o insuccesso musicale.

4.4.2.6 Decade ‘10s

Riepilogo del modelloa

Fase Logaritmo della verosimiglianza -2 R-quadrato di Cox e Snell R-quadrato di Nagelkerke

1 5559,919b 0,404 0,538

a. decade = 2010

b. Stima terminata all'iterazione numero 20 perché è stato raggiunto il numero massimo di iterazioni. Impossibile trovare la soluzione finale.

Tabella n.66 - Log di verosimiglianza e indire R quadro decade ‘10s

Infine, l’ultima decade presenta un andamento in controtendenza rispetto a quello rilevato in tutte le precedenti decadi: per la prima volta il logaritmo di verosimiglianza, anziché ridursi cresce ed anche l’ 𝑅 si è contratto rispetto alla decade precedente, restando comunque piuttosto elevato (.538), come si può notare dalla Tabella n.66.

Anche l’accuratezza complessiva della classificazione si è leggermente contratta, ritornando ai valori degli anni ‘90 (80.9%).

Variabili nell'equazionea

β S.E. Wald gl Sign. Exp(B) Fase 1b danceability 3,031 0,258 137,998 1 0,000 20,711 energy -5,962 0,331 323,653 1 0,000 0,003 loudness 0,384 0,020 362,281 1 0,000 1,467 mode 0,215 0,073 8,778 1 0,003 1,240 speechiness 0,266 0,343 0,604 1 0,437 1,305 acousticness -1,528 0,186 67,510 1 0,000 0,217 instrumentalness -7,990 0,584 187,208 1 0,000 0,000 liveness -0,414 0,206 4,030 1 0,045 0,661 valence -0,395 0,171 5,304 1 0,021 0,674 tempo 0,000 0,000 0,042 1 0,838 1,000 duration_ms 0,000 0,000 0,270 1 0,603 1,000 chorus_hit 0,000 0,000 0,843 1 0,358 1,000 sections -0,032 0,011 7,561 1 0,006 0,969 time_signature1 15,459 40246,674 0,000 1 1,000 5173177,647 time_signature3 15,037 40246,674 0,000 1 1,000 3393649,095 time_signature4 15,938 40246,674 0,000 1 1,000 8355224,819 time_signature5 16,298 40246,674 0,000 1 1,000 11970599,314 key_1 0,023 0,139 0,027 1 0,869 1,023 key_2 -0,117 0,146 0,641 1 0,423 0,890 key_3 0,332 0,220 2,270 1 0,132 1,393 key_4 -0,024 0,157 0,024 1 0,877 0,976 key_5 0,146 0,155 0,879 1 0,348 1,157 key_6 0,092 0,152 0,363 1 0,547 1,096 key_7 -0,096 0,138 0,479 1 0,489 0,909 key_8 0,316 0,163 3,774 1 0,052 1,371 key_9 0,035 0,147 0,056 1 0,812 1,036 key_10 0,195 0,163 1,434 1 0,231 1,216 key_11 -0,088 0,145 0,365 1 0,546 0,916 Costante -9,801 40246,674 0,000 1 1,000 0,000 a. decade = 2010

b. Variabili inserite nella fase 1: danceability, energy, loudness, mode, speechiness, acousticness, instrumentalness, liveness, valence, tempo, duration_ms, chorus_hit, sections, time_signature1, time_signature3, time_signature4, time_signature5, key_1, key_2, key_3, key_4, key_5, key_6, key_7, key_8, key_9, key_10, key_11.

Anche osservando la Tabella n.67 si notano dei cambiamenti, per esempio la ballabilità, pur restando il miglior predittore presente, contrae il suo coefficiente β che adesso si attesta pressappoco ai livelli degli anni ’70 (3.03). Anche i valori di “loudness” e “mode” si sono leggermente ridotti, mentre “speechiness” ha un β ancora non negativo e leggermente superiore rispetto agli anni 2000.

Alcune tonalità, invece, sono tornate a caratterizzare di più i “Flop”, come la 2, 4, 7 e 11.

I risultati ottenuti non sono significativi per “speechiness”, “tempo”, “duration_ms”, “chorus_hit” e tutte le successive presenti in Tabella n.67 eccetto “sections.

Una particolarità nel corso dell’analisi è emersa per la variabile “time_signature5”, ovvero si nota come questa scompaia in alcune decadi, come negli anni ’70, ’80 e ’90. Questo è dovuto probabilmente al fatto che, nel dataset, non vi fossero canzoni scritte in 5/4 in quelle decadi.

Le variabili che predicono meglio il successo sono ancora “danceability”, “loudness” e “mode”, queste tre sono le uniche che hanno sempre caratterizzato in maniera positiva le “Hit” e che hanno sempre svolto, con un’importanza più o meno rilevante, il loro ruolo di intuizione del successo musicale.

Infine, si riporta nuovamente una sintesi dei risultati più rilevanti in merito alla regressione logistica binaria (vedi Tabella n.68).

REGRESSIONE LOGISTICA BINARIA Dataset completo ‘60s ‘70s ‘80s ‘90s ‘00s ‘10s - 𝑅 = .379 - accuratezza = 73% - Migliori predittori del successo: “danceability” “valence” “mode” “key_1, 3, 5, 6, 8,