CAPITOLO SECONDO:LA CORNICE TEORICA
2.3 A COSA SERVONO LE RAPPRESENTAZIONI SOCIALI
3.4.1 L’ELABORAZIONE DEI DATI TESTUALI
Le associazioni libere alle otto espressioni stimolo sono state processate mediante il programma SPAD-T che provvede direttamente alla lettura delle forme grafiche digitate così come sono in uno specifico file di testo (.TXT).
Questo programma riconosce solo le frequenze di caratteri e non distingue ad esempio forme grafiche identiche (ad esempio “stato” inteso come participio passato e “stato” -o meglio “Stato”- inteso come nazione) o, al contrario, se nel testo fosse presente la stessa parola sia graficamente che nel significato, ma in alcuni casi in maiuscolo e in altri in minuscolo, SPADT considererebbe le due forme grafiche come parole distinte (es.“morte” e “Morte”). Per questo motivo il file di testo è stato scritto completamente in minuscolo e successivamente si è operato quello che si definisce il “pre-trattamento” del testo.
Con il termine pre-trattamento del testo si intendono tutte quelle operazioni preliminari che non modificano il senso del testo esaminato, permettendo comunque una maggiore comprensione delle forme d’uso. Il criterio fondamentale è di conservare distinte nel testo le variazioni significative in
termini semantici e fondere le forme che costituiscono degli invarianti semantici (Bolasco, 1999).
Successivamente attraverso la procedura CORTE si sono create delle equivalenze (EQUIV) tra le forme grafiche sinonime e tra segmenti formati da più forme grafiche unite dal segno “–“ e con il comando DELET si sono eliminate tutte quelle forme ritenute “non significative” per il tipo di testo trattato. Si puntualizza che sia le EQUIV tra le forme grafiche o tra i segmenti composti dalle stesse, sia i DELET , cambiano a seconda di diverse variabili come ad esempio la teoria adottata alla quale si fa riferimento e lo scopo della ricerca.
In altre parole si possono creare equivalenze in base al significato (es. EQUIV tra allegro, solare, felice, preso-bene, contento) o in base all’etimologia e alla radice (es. EQUIV tra allegro, allegri, allegria, allegramente, EQUIV tra felice, felicità, ecc…) e ancora se per il ricercatore è importante la variabile genere le EQUIV devono rispettare il genere (es. EQUIV allegra, allegre ed EQUIV tra allegro e allegri) così come se si vuole differenziare singolare e plurale ( EQUIV tra allegri e allegra ed EQUIV tra allegra allegro).
Nel nostro caso le EQUIV sono state proposte sulla base dei significati in modo da raggruppare diversi termini in categorie più ampie. Per fare un esempio si è creata un EQUIV nominata “Alimentare” che raccoglieva i termini cena, pasto, carne, a-tavola, ai-pasti, cucina, formaggio, mangiare, pane, pranzo, cibo, pasti.
50
Il passaggio successivo al pre-trattamento del testo è stato il taglio di soglia (procedura SETEX), con la quale si “sceglie” la frequenza minima che una forma grafica deve avere per essere mantenuta nell’analisi. In questo caso si è deciso di non considerare tutti quei termini che dopo la procedura CORTE hanno mantenuto frequenza pari a 1.
Successivamente si è passati all’analisi delle corrispondenze dei dati testuali.
L’analisi delle corrispondenze è un programma di trattamento lessicometrico il cui obbiettivo principale è di ottenere una prima sintesi dell’informazione contenuta nei testi senza dover effettuare interventi di codifica o di selezione a priori del corpus di analisi (Cemin & Collini, 2000).
Come nell’analisi fattoriale, con questo trattamento vengono estratti degli assi fattoriali, ortogonali tra loro, che spiegano, ciascuno in ordine decrescente, il massimo della variabilità della matrice dei dati.
L’intento dell’analisi delle corrispondenze è quello di produrre dei modelli di senso con i quali poter leggere il materiale testuale, individuare il “senso latente”
dell’insieme dei significati coinvolti nei testi, grazie all’interpretazione delle sole forme lessicali che si concentrano attorno agli assi fattoriali. I sintagmi creati in questo modo forniscono un paradigma, cioè un modello di senso presente nel corpus, sempre limitatamente al punto di vista espresso da quell’asse (Bolasco, 1999).
Per compiere l’analisi delle corrispondenze in SPAD-T, il testo viene fatto
“girare” secondo la procedura prescelta per l’elaborazione testuale (la scelta della procedura dipende dal tipo di testo, dalla presenza o meno di variabili associate) che nel nostro caso è l’analisi APLUM.
L’esecuzione del programma presenta numerose tabelle (numero dei testi, numero dei soggetti per testo, numero delle risposte per soggetto, numero delle forme grafiche in relazione alla frequenza con la quale ogni gruppo le utilizza, per citarne alcune).
Per la scelta delle forme grafiche per la realizzazione delle tabelle si sono considerati i fattori con allegata la percentuale dell’ inerzia totale, ossia quanta percentuale di testo “copre” quello specifico fattore.
La scelta dei fattori per il presente lavoro è stata effettuata con l’obiettivo che la somma del numero degli stessi avesse un’ inerzia uguale o superiore al 50% ( che
“spiegasse” metà o più della metà del testo).
Di tutte le forme grafiche mantenute dopo le procedure CORTE e SETEX sono state inserite in tabella solo quelle che avevano un contributo medio (C.m) superiore al contributo assoluto (C.a) dato dalla formula 100/ n° parole distinte; il C.a. delle singole forme grafiche rappresenta il “peso” che tale espressione ricopre all’interno del testo. Va da sé che maggiore sarà il C.a e maggiore sarà la significatività di tale parola in relazione al testo e rispetto al gruppo collocato vicino (nel grafico a dispersione) a tale forma grafica.
52
Le forme grafiche sono state disposte sulla tabella in relazione ai fattori (es. F1 e F2) e nel fattore sul semiasse + o – in base alla positività o negatività delle coordinate che identificano la parola sul grafico e successivamente proiettate appunto sul grafico a dispersione e commentate.
Per una maggiore facilità nella lettura del grafico a dispersione si definiscono qui di seguito alcuni punti chiave per la comprensione della terminologia utilizzata e dei risultati ottenuti :
- si definiscono “forme grafiche” le parole o termini (cioè insiemi di lettere dotate di senso);
- si definiscono “segmenti” le forme grafiche formate da più parole unite dal segno “-“;
Ad esempio “incidenti-stradali” e che vengono unite per “necessità” in quanto in questo modo il programma SPADT riconosce il segmento come un’unica forma grafica.
- si definiscono “arcipelaghi” o “aree semantiche” insiemi di parole che proiettate sul grafico appaiono come una nuvola più o meno densa visivamente distinguibile da altre forme grafiche;
- infine si ricorda come maggiore è il C.a della forma grafica o del segmento o del repertorio discorsivo, e maggiore sarà la significatività di tale contributo nel testo.