• Non ci sono risultati.

Tabelle di contingenza per “Hit” e “Flop”

CAPITOLO 4 ANALISI DEI RISULTATI

4.3 Analisi 3: risultati delle analisi su variabili categoriche

4.3.1 Tabelle di contingenza per “Hit” e “Flop”

La prima variabile presa in considerazione è “time_signature” la quale rappresenta, come già riportato nel precedente capitolo, una convenzione di numerazione usata nella notazione musicale occidentale per specificare quanti battiti (impulsi) sono contenuti in ogni misura (battuta) e quale valore di nota è equivalente a un battito. Nel dataset sono contenute metriche che vanno da 0/4 a 5/4, passando per il conosciutissimo 4/4, utilizzato molto comunemente.

Tavola di contingenza time_signature * target

target Totale 0 1 time_signature 0 Conteggio 2 1 3 % in time_signature 66,7% 33,3% 100,0% 1 Conteggio 300 71 371 % in time_signature 80,9% 19,1% 100,0% 3 Conteggio 2650 1190 3840 % in time_signature 69,0% 31,0% 100,0% 4 Conteggio 17140 19157 36297 % in time_signature 47,2% 52,8% 100,0% 5 Conteggio 461 134 595 % in time_signature 77,5% 22,5% 100,0% Totale Conteggio 20553 20553 41106 % in time_signature 50,0% 50,0% 100,0%

Tabella n.37 – Tabella di contingenza “time_signature” x target

Come si può osservare dalla Tabella n.37, il primo output che compone questo tipo di analisi espone, se debitamente richiesto nei comandi, la percentuale di “Hit” e “Flop” caratterizzate da un certo

tempo, termine che indica la pulsazione regolare presa come unità di misura (elemento che viene scandito con il metronomo).

0/4 risulta essere una ritmica trascurabile di importanza, in quanto solo 3 canzoni in totale ne sono contraddistinte, di cui due “Flop” e una “Hit”.

1/4, in musica, determina la somma dei valori da inserire in ciascuna battuta. Indica una pulsazione della durata di 1/4. In sintesi, la battuta è composta da una sola nota del valore di 1/4 e ne sono caratterizzati in totale 371 brani, di cui la maggioranza schiacciante appartiene al gruppo dei “Flop” (80.9%). Vi è poi il 3/4 che è classificabile come tempo semplice il quale, ancora una volta, caratterizza in modo spiccato i “Flop” con il 69% dei casi rispetto alle “Hit” (31%).

Il 4/4 è l’unico, fra tutti i tempi, che è presente per oltre il 50% nelle “Hit” (52.8%) e questo giustifica il fatto che la maggior parte delle canzoni sia scritta con questa metrica.

L’ultimo tempo musicale è il 5/4 che torna a caratterizzare in maniera piuttosto decisa i “Flop”. In sintesi, quando viene usato il 4/4, la maggior parte delle canzoni risultano essere “Hit”, con tutti gli altri tempi musicali avviene l’esatto opposto.

Prima di passare alla verifica della significatività del test chi-quadrato, si procede alla verifica del rispetto anche del secondo presupposto sopra esposto.

In questo caso, solo un valore atteso è pari ad 1 e non più del 20% di questi risulta essere inferiore a 5, quindi il test è in grado di rilevare un effetto reale e non si subiscono ingenti perdite di informazione.

Al fine di determinare se questi risultati sono significativi o meno, si passa all’osservazione del test chi – quadrato (Tabella n.38).

Test del chi-quadrato

Valore gl Significatività asintotica (bilaterale)

Rapporto di verosimiglianza 1023,933 4 0,000

Associazione lineare per lineare 452,182 1 0,000 N di casi validi 41106

a. 2 celle (20,0%) hanno un conteggio previsto inferiore a 5. Il conteggio previsto minimo è 1,50.

Tabella n.38 – Test chi – quadrato variabile “time signature” per target

Se il valore di significatività è abbastanza piccolo (convenzionalmente Sig. deve essere inferiore a .05) allora si respinge l'ipotesi che le variabili siano indipendenti e si acquista fiducia nell'ipotesi che siano in qualche modo correlate.

Utilizzando il programma per analisi statistiche SPSS, questo produrrà semplicemente una stima della probabilità precisa di ottenere una statistica chi-quadro almeno grande come (in questo caso) 988.584, se non ci fosse associazione nella popolazione tra le variabili. I gradi di libertà sono calcolati mediante la formula (r-1) (c-1), in questo caso dl= (5-1) (2-1) = 4.

Il valore della statistica del chi-quadrato (988.584) risulta essere molto significativo (p < .001), indicando che il tempo musicale ha avuto un effetto importante sul successo o insuccesso di un brano. Sotto la tabella chi-quadrato ci sono diverse note a piè di pagina relative all'ipotesi che i conteggi attesi dovrebbero essere superiori a 5. SPSS automaticamente dà un riassunto del numero di conteggi attesi sotto 5. In questo caso, ve ne erano solo 2 rispettando la soglia del 20%, quindi la statistica del chi-quadrato dovrebbe essere abbastanza accurata.

Il risultato, altamente significativo, indica che esiste un'associazione molto forte fra il ritmo (o tempo) e il successo o insuccesso di una canzone. Ciò che si intende per associazione è che il modello di risposte (es. la proporzione di “Hit” rispetto a quella di “Flop”) nei diversi tempi musicali è significativamente diverso. Questa scoperta rilevante riflette il fatto che quando il 4/4 è usato come tempo, circa il 52.8% delle canzoni è una “Hit” e la restante percentuale un “Flop”, mentre quando sono usate le altre metriche, la maggior parte delle canzoni è un “Flop”.

Pertanto, si può concludere affermando che il tipo di tempo musicale utilizzato influenza in modo significativo il successo delle canzoni.

Dopo aver analizzato questa prima variabile categorica, l’attenzione si sposta verso la successiva, ovvero “mode” che può assumere due valori: 0 che indica il modo minore e 1 che indica il maggiore.

Tavola di contingenza mode * target

target Totale 0 1 Mode 0 Conteggio 7057 5548 12605 % in mode 56,0% 44,0% 100,0% 1 Conteggio 13496 15005 28501 % in mode 47,4% 52,6% 100,0% Totale Conteggio 20553 20553 41106 % in mode 50,0% 50,0% 100,0%

Tabella n.39 - Tabella di contingenza “mode” x target

Anche in questo caso si può notare una chiara tendenza, ovvero le “Hit” sono caratterizzate per il 52.6% dal modo maggiore e per solo il 44% da quello minore (Tabella n.39).

Come per la precedente variabile, per determinare se i risultati sono significativi o meno si osserva il test chi–quadrato visibile nella seguente Tabella n.40 .

Test del chi-quadrato Valore gl Significatività asintotica

(bilaterale) Sign. esatta (bilaterale) Sign. esatta (unilaterale) Chi-quadrato di Pearson 260,544a 1 0,000 Correzione di continuitàb 260,199 1 0,000 Rapporto di verosimiglianza 261,015 1 0,000

Test esatto di Fisher 0,000 0,000 Associazione lineare per

lineare

N di casi validi 41106 a. 0 celle (,0%) hanno un conteggio previsto inferiore a 5. Il conteggio previsto minimo è 6302,50.

b. Calcolato solo per una tabella 2x2

Tabella n.40 – Test chi-quadrato variabile “mode” per target

A differenza del caso precedente, sono disponibili altre statistiche come la correzione di continuità, la quale rappresenta il chi-quadrato corretto dalla continuità di Yates, test molto spesso ignorato, ma che conferma il risultato del test principale chi-quadrato. L’altra misura disponibile è il Test esatto di Fisher, il quale ha messo a punto un metodo per calcolare l'esatta probabilità della statistica del chi- quadrato che è accurata quando le dimensioni del campione sono piccole. Questo metodo è chiamato test esatto di Fisher (Fisher, 1922) anche se non è tanto un test quanto un modo di calcolare l'esatta probabilità della statistica del chi-quadrato. Questa procedura è normalmente usata su tabelle di contingenza 2x2 (es. due variabili ciascuna con due opzioni) e con piccoli campioni. Tuttavia, può essere utilizzato su tabelle di contingenza più grandi e con campioni di grandi dimensioni, ma su tabelle di contingenza più grandi diventa computazionalmente intensivo e si potrebbe rilevare che SPSS ha bisogno di molto tempo per dare una risposta. Nei campioni di grandi dimensioni non ha davvero senso perché è stato progettato per superare il problema dei piccoli campioni, quindi non è necessario utilizzarlo quando i campioni sono grandi, anche se SPSS lo produce automaticamente. Osservando ancora le note a piè di pagina, si nota che, in questo caso, non vi sono celle che presentano un valore atteso < 5, quindi, ancora una volta, la statistica del chi-quadrato dovrebbe essere accurata. I risultati, tutti altamente significativi (Sig. = .000), indicano che esiste un'associazione tra il tipo di modalità e se il brano è una “Hit” o un “Flop”.

Infine, si passa all’analisi riguardante l’ultima variabile qualitativa: “key”, che rappresenta la chiave complessiva stimata della traccia, la tonalità.

Tavola di contingenza key * target

target Totale 0 1

Key 0 (DO) Conteggio 2565 2565 5130 % in key 50,0% 50,0% 100,0% 1 (DO#/REb) Conteggio 1455 1823 3278 % in key 44,4% 55,6% 100,0% 2 (RE) Conteggio 2502 2117 4619 % in key 54,2% 45,8% 100,0% 3 (RE#/Mib) Conteggio 764 666 1430 % in key 53,4% 46,6% 100,0% 4 (MI) Conteggio 1739 1584 3323 % in key 52,3% 47,7% 100,0% 5 (FA) Conteggio 1940 1850 3790 % in key 51,2% 48,8% 100,0% 6 (FA#/SOLb) Conteggio 1020 1197 2217 % in key 46,0% 54,0% 100,0% 7 (SOL) Conteggio 2534 2428 4962 % in key 51,1% 48,9% 100,0% 8 (SOL#/Lab) Conteggio 1097 1248 2345 % in key 46,8% 53,2% 100,0% 9 (LA) Conteggio 2341 2128 4469 % in key 52,4% 47,6% 100,0% 10 (LA#/Sib) Conteggio 1229 1499 2728 % in key 45,1% 54,9% 100,0% 11 (SI) Conteggio 1367 1448 2815 % in key 48,6% 51,4% 100,0% Totale Conteggio 20553 20553 41106 % in key 50,0% 50,0% 100,0%

Tabella n.41 - Tabella di contingenza variabile “key” x target

Come si può osservare nella Tabella n.41, la tonalità 0 è l’unica che presenta il 50% di casi nelle “Hit” e nei “Flop”, mentre le altre tonalità caratterizzano di più l’uno o l’altro gruppo di canzoni.

Ad esempio, le tonalità 1 (“Hit” =55.6%), 6 (“Hit” = 54.0%), 8 (“Hit” = 53.2%), 10 e 11 sono più tipiche dei successi, mentre le rimanenti sono più riconducibili agli insuccessi, come la n.2 che è piuttosto netta.

In ultima istanza, si determina la significatività o meno dei risultati osservando i valori del test chi- quadrato (Tabella n.42).

Test del chi-quadrato

Valore gl Significatività asintotica (bilaterale)

Chi-quadrato di Pearson 154,811a 11 0,000

Rapporto di verosimiglianza 155,013 11 0,000

Associazione lineare per lineare 4,014 1 0,045 N di casi validi 41106

a. 0 celle (,0%) hanno un conteggio previsto inferiore a 5. Il conteggio previsto minimo è 715,00.

Tabella n.42 – Test chi-quadrato variabile “key” per target

Ancora una volta otteniamo un valore elevato del chi – quadrato (154.811), il quale è altamente significativo, indice del fatto che esiste un'associazione molto forte fra la tonalità utilizzata e il successo o insuccesso di una canzone.

In sintesi, quando sono utilizzate le tonalità 1 (DO#/REb), 6 (FA#/SOLb), 8 (SOL#/Lab), 10 (LA#/Sib) e 11 (SI) la maggioranza delle canzoni è una “Hit” e, nei restanti casi, sono “Flop”. Anche in questo caso i conteggi, riportati come nota alla tabella, confermano che non vi sono valori attesi inferiori a 5, confermando nuovamente l’accuratezza della misura.