• Non ci sono risultati.

Nota metodologica sull’analisi statistica S.G.

Basic Emotions Colors 1 Alessandro Castellano, 1 Saverio Giulin

1. Nota metodologica sull’analisi statistica S.G.

Si è utilizzato il sistema HSB in modo da aver riassunto in un unico parametro (H) tutte le informazioni relative alla tonalità.

Si sono raggruppate le risposte in cluster utilizzando la forma più semplice di k- nearest neighbor (k=1), che permette la spontanea aggregazione dei dati, in modo non supervisionato e senza aver fissato a priori il numero delle classi: in dettaglio, ad ogni passo sono state unite le due classi più vicine, in termini dell’usuale distanza, con l’avvertenza di considerare ogni classe come un singolo punto avente peso pari al numero di elementi della classe stessa e posizione coincidente con quella del punto medio.

Per rendere possibile un processo statistico rigoroso e per una più intuitiva lettura dei risultati si sono dovuti adottare alcuni accorgimenti.

Innanzi tutto, poiché H è un parametro angolare espresso in gradi e valori prossimi a 360° e a 0° sono tra loro vicini, come tonalità, ma numericamente molto distanti, si è utilizzata l’abituale convenzione di rappresentare tale parametro con un punto del piano di lunghezza unitaria ed angolo pari ad H, rispetto ad un asse verticale.

La rappresentazione tridimensionale più usuale della terna HSB suggerirebbe un rescaling del vettore correlato al parametro H, tramite una omotetia di fattore S, seguita da una traslazione verticale pari a B.

Tuttavia, per i nostri scopi, una tale rappresentazione, seppure più completa risulterebbe di non agevole lettura.

Si è quindi preferito confrontare i parametri HSB a due a due. Le coppie (H,S) e (H,B) sono state rappresentate tramite punti nel piano di direzione corrispondente all’angolo H e lunghezza pari rispettivamente a S e B. In entrambi i casi le immagini corrispondono quindi a punti del piano contenuti in un cerchio di raggio 100 e ad essi è stato applicato, separatamente, il processo di aggregazione. Poiché il numero di classi non è (né poteva essere) fissato a priori, si sono operate differenti strategie per valutare la significatività dei risultati ottenuti: si è verificato che le suddivisioni più interessanti si ottenevano arrestando il processo di clusterizzazione quando la distanza tra i punti medi dei vari gruppi superavano il 45% della dimensione del raggio e si è adottato questo valore in tutti i casi presi in esame.

Il confronto tra le clusterizzazioni ottenute con questo procedimento per lo stesso tipo di emozione, ma separatamente per le due coppie di parametri (H,S) e (H,B), è

risultato di elevata significatività sia statistica che visiva (assai maggiore, a nostro avviso, che non operando la consueta rappresentazione tridimensionale).

Per completezza si è esaminata anche la restante coppia di parametri (S,B) in termini di correlazione. I risultati appaiono tuttavia, ad una prima lettura, assai meno informativi che non i precedenti e sono stati utilizzati unicamente come compendio a questi ultimi. Riteniamo inoltre importante sottolineare un’osservazione troppo spesso trascurata: la terna (H, S, B) deve essere intesa come una variabile aleatoria: la scelta di attribuire ad un’emozione una terna, ad esempio, (242, 88, 67) è affetta dal caso, nel senso che, lo stesso soggetto, in un secondo tempo potrebbe attribuire alla stessa emozione una terna leggermente diversa, (245,86,66) oppure (239,91,70), più difficilmente (200,100,50), mai (30,50,40). Appare naturale considerare ogni terna scelta, non come qualcosa di fissato, ma, più correttamente, una distribuzione normale centrata su tale scelta e più o meno rapidamente decrescente a 0.

Come conseguenza di tale osservazione sembra corretto attribuire ad ogni classe non solo il valore medio degli elementi che la compongono, ma piuttosto un settore di corona circolare la cui ampiezza, sia angolare che lineare, dipende dalla varianza dei dati stessi. I grafici relativi alle coppie (H, S) e (H, B) sono stati realizzati assegnando al parametro mancante il valore medio relativo all’emozione considerata.

1.1. Felicità

Per questa emozione i due grafici relativi ai parametri S e B sono del tutto simili. Appare evidente che sono presenti 3 gruppi ben definiti per entrambi i parametri. Questi tre gruppi rappresentano, nel loro insieme il 78,8% di tutte le risposte.

Per quanto riguarda i valori generali di saturazione e brillantezza si osserva che sono entrambi molto elevati:

S 81,3 r 16,9 B 86,8 r 15,8

1.2. Sorpresa

Anche in questo caso vi è un ottimo accordo tra i raggruppamenti relativi ai due parametri S e B. Tuttavia si manifestano più gruppi significativi anche se meno numerosi. L’unica osservazione riguarda i gruppi 3 e 6 del parametro S che nel caso di B non appaiono in realtà separati.

Fig. 1 – Felicità, grafici di relazione tra saturazione (S) e tonalità (H), a sinistra e brillantezza (B) e tonalità (H), a destra. Gruppo 1 (45,5%) Gruppo 2 (26,5%) Gruppo 3 ( 6,8%)

H 56,3 r 9,1 H 0,5 r 16,1* H 196,2 r 15,5 S 87,8 r 14,5 S 85,6 r 4,5 S 70,3 r 19,4

B 94,6 r 7,1 B 88,8 r 5,2 B 84,4 r 15,5 * si deve intendere l’intervallo da 344,4 a 16,6

Fig. 2 – Sorpresa, grafici di relazione tra saturazione (S) e tonalità (H), a sinistra e brillantezza (B) e tonalità (H), a destra. Gruppo 1 (36,7%) Gruppo 3+6 (21,9%) Gruppo 4 (15,6%) Gruppo 2 (14,5%)

H 349,2 r 20,1 H 118,4 r 28,7 H 197,2 r 14,4 H 55,7 r 5,6 S 78,2 r 14,8 S 73,0 r 17,0 S 64,1 r 23,7 S 84,1 r 13,3 B 91,7 r 7,4 B 74,6 r 12,2 B 85,3 r 9,0 B 90,6 r 12,2

Per omogeneità si sono considerati i gruppi 1, 3+6 , 4 e 2 che in complesso rappresentano l’89,1% delle risposte.

Si può osservare come i vari gruppi risultano cromaticamente ben differenziati: la sorpresa presenta una maggiore varietà di tonalità rispetto alla felicità.

Anche in questo caso i valori di saturazione e brillantezza risultano molto elevati, anche se inferiori al caso della felicità (e con maggiore variabilità, per quanto riguarda S):

S 72,8 r 21,7 B 83,9 r 15,3

1.3. Paura

Per questa emozione i parametri S e B svolgono un ruolo più importante che la tonalità. Come si vede chiaramente dalle figure la classe numericamente più importante

Fig. 3 – Paura, grafici di relazione tra saturazione (S) e tonalità (H), a sinistra e brillantezza (B) e tonalità (H), a destra. Gruppo 1 (58,6%) Gruppo 3 (13,3%) Gruppo 2 (10,9%)

H 296,6r 55,9 H 277,6 r 18,1 H 227,1 r 13,9 S 21,1 r 20,2 S 59,9 r 14,4 S 84,5 r 13,1

B 19,0 r 15,8 B 66,9 r 15,9 B 64,3 r 12,6

Fig. 4 – Rabbia, grafici di relazione tra saturazione (S) e tonalità (H), a sinistra e brillantezza (B) e tonalità (H), a destra. Gruppo 1 (64,1%) Gruppo 2 (17,2%)

H 354,2 r 18,2 H 258,7 r 20,1 S 85,2 r 12,0 S 54,6 r 13,5 B 60,1 r 32,6 B 47,8 r 11,7

è costituita da punti in cui il parametro H giace nella zona 180°-360°, mentre S e B si trovano, spesso abbondantemente, all’interno del cerchio di raggio 50.

L’accordo tra le varie classi relative ai due parametri S e B è ancora molto buono e la classe 1 (pallini blu) è certamente la più significativa.

Il gruppo 2b (pallini rossi), apparentemente simile al gruppo 2, è tuttavia meno numeroso e occupa una zona che dal punto di vista cromatico risulta significativamente assai diverso.

L’82,8% delle risposte è rappresentato dai gruppi 1, 2 e 3.

La grande variabilità del parametro H nel primo gruppo è, in realtà, solo apparente. I bassi valori sia di saturazione che di brillantezza rendono poco distinguibili le tonalità le une dalle altre. È anche interessante osservare che, quando S e B assumono valori superiori a 50 (classi 2 e 3) la tonalità si situa quasi interamente nella zona 215-295. Molto bassi (soprattutto B) e con una maggiore variabilità sia la saturazione che la brillantezza:

S 46,2 r 33,8 B 35,3 r 28,5

1.4. Rabbia

Nel caso della rabbia si presenta per la prima volta una sensibile differenza tra i valori dei due parametri S e B. Tale differenza si manifesta soprattutto nel gruppo più numeroso (gruppo 1) che, per quanto riguarda la saturazione, risulta molto compatto su valori decisamente elevati, mentre per quanto riguarda la brillantezza si spezza in due (1 e 1b) nettamente distinti. Per un confronto omogeneo sarà opportuno riunire questi ultimi due gruppi in una unica classe, caratterizzata da una varianza elevata, ma da un ristretto settore angolare (=tonalità).

Il gruppo 2, significativo anche se assai meno numeroso, presenta una notevole omogeneità di valori.

Le due classi prese in considerazione coprono l’81,3% di tutte le risposte.Si mette solo in evidenza la attesa grande variabilità della brillantezza nella prima classe e la compattezza dei valori dei tre parametri nel secondo gruppo.

Fig. 5 – Disgusto, grafici di relazione tra saturazione (S) e tonalità (H), a sinistra e brillantezza (B) e tonalità (H), a destra. Gruppo 1 (25,0%) Gruppo 5 (25,0%) Gruppo 4 (16,4%)

H 71,6 ± 54,3 H 74,1 ± 13,0 H 136,0 ± 18,1 S 32,8 ± 7,2 S 65,3 ± 14,7 S 55,3 ± 17,2 B 13,8 ± 11,5 B 69,8 ± 18,8 B 47,8 ± 20,8

Come ci si attende dalla precedente analisi, nel complesso la saturazione dei colori per quanto riguarda questa emozione risulta più elevata della brillantezza, ma per entrambe la variabilità è piuttosto alta.

S 70,3 r 27,6 B 54,6 r 29,7

1.5. Disgusto

Per questa emozione accade un fenomeno analogo a quanto osservato per la Rabbia con l’unica differenza che un gruppo che presenta una buona omogeneità per il parametro B (gruppo 1) si spezza in due per il parametro S (gruppo1, valori bassi; gruppo 5 valori alti). Si osserva anche che la distribuzione in classi delle risposte fornite presenta delle differenze non del tutto trascurabili per i due parametri. Secondo un’analisi puramente statistica, i tre gruppi di maggiore significatività sia dal punto di vista numerico che cromatico (gruppi 1+5 S e gruppo 1 B, gruppo 4, gruppo 3 - quest’ultimo presente soprattutto in S) rappresentano solo il 75,8% di tutte le risposte, ma risultano dotati di una buona omogeneità essendo prevalentemente compresi nella regione angolare che va da 25° a 150°.

La notevole variabilità del parametro H nel primo gruppo (H: 72,8 ± 38,9) è imputabile ai punti con basso valore di saturazione S e inoltre la variabilità di quest’ultimo parametro (S: 47,1 ± 32,6) è dovuta al già evidenziato problema della suddivisione in due distinte classi per S, che si riuniscono in un’unica per B.

In realtà il metodo del k-nearest neighbor con k=1, presenta una certa instabilità, che si manifesta in modo rilevante solo in questa emozione Disgusto. Un’analisi diretta dei dati presenti nel gruppo principale, dimostra l’esistenza di un gap attorno al valore B=45: operando la suddivisione seguendo questo criterio si ottengono due distinti gruppi, con la stessa numerosità, con una distanza dei punti medi (leggermente) superiore a 45 (come richiesto). La sensatezza di tale procedura è confermata dalla successive analisi dal punto di vista della percezione. Di conseguenza, per il Disgusto, la suddivisione che appare più ragionevole considera i seguenti 3 gruppi.

Fig. 6 – Tristezza, grafici di relazione tra saturazione (S) e tonalità (H), a sinistra e brillantezza (B) e tonalità (H), a destra. Gruppo 1 (49,6%) Gruppo 2 (33,6%) Gruppo 3 ( 8,0%)

H 220,5 r 31,5 H 56,8 r 96,6 H 355,7 r 14,6 S 55,5 r 17,5 S 5,5 r 6,4 S 69,3 r 23,0 B 54,5 r 23,1 B 18,8 r 16,2 B 59,0 r 5,0

L’enorme variabilità del parametro H nel primo gruppo è pienamente giustificata dai bassi valori sia di saturazione sia di brillantezza, che rendono, di fatto, del tutto ininfluente la tonalità (anche a questo proposito si veda l’analisi relativa agli aspetti percettivi).

Il Gruppo 4 presenta invece una buona concentrazione di valori.

Abbastanza bassi, ma senza grossa variabilità sia la saturazione che la brillantezza:

S 50,9 r 24,1 B 56,6 r 27,0

1.6. Tristezza

Si tratta dell’unico caso in cui la metodologia dell’analisi separata delle coppie (H, S) e (H, B) fornisce risultati non del tutto soddisfacenti. Le classi ottenute risultano infatti sensibilmente disomogenee. Per la saturazione si ottiene un primo gruppo piuttosto numeroso che comprende sia punti dislocati disordinatamente attorno all’origine con valori di S molto piccoli (<20) sia punti con valori leggermente superiori (ma sempre inferiori a 40), contenuti nel terzo quadrante (180°-270°) e un secondo gruppo, quasi altrettanto numeroso, costituito da punti, contenuti sempre nel terzo quadrante, ma con valori di S decisamente più alti. Per la brillantezza il primo gruppo si scinde in due parti: quella prossima all’origine tende a spostarsi nel primo quadrante, l’altra si congiunge al secondo gruppo, costituendo un’ampia classe che occupa per intero il terzo quadrante.

Si è dovuto allora procedere ad un’analisi contemporanea di tutti e tre i parametri (ove H, che rappresenta geometricamente una direzione, è stato rappresentato da punti sulla circonferenza di raggio 100), che ha messo in evidenza come la suddivisione ottenuta per la coppia (H, B) debba essere ritenuta la più valida.

Si sono così formate essenzialmente due grosse classi, caratterizzate, la prima, dall’appartenenza al terzo quadrante e la seconda da valori piccoli sia di S che di B. Queste due classi rappresentano, da sole, l’83,2% di tutti i dati disponibili. Ad esse si può aggiungere una terza classe, numericamente molto meno importante, che costituisce una specie di prolungamento “verso l’alto” della seconda.

La sensibile variabilità di H nel secondo gruppo è pienamente motivata dai bassissimi valori sia di S che di B che rendono sostanzialmente indistinguibili i colori tra loro.

In questo caso i valori di saturazione e brillantezza risultano molto bassi.

S 39,5 r 32,5 B 46,9 r 27,1