3.4 Analisi quantitativa
3.4.1 Il corpus design
Il momento iniziale del corpus design prevede la scelta dei testi che in questo caso sono solo tre, ma che tuttavia sono stati selezionati in base a dei chiari principi. Il primo di questi riguarda l’utilizzo della lingua creola e il secondo il contesto britannico, ovvero tutti i testi sono scritti e pubblicati in Inghilterra e assieme all’inglese utilizzano anche una varietà creola. Inoltre, poiché si vuole anche studiare il fenomeno più specifico del British Creole, si è voluto scegliere testi in cui sia probabile l’utilizzo di questa varietà e problematica la sua individuazione. Trattandosi di una versione semplificata e non-native del creolo giamaicano il British Creole è facilmente intercambiabile con la varietà insulare, e si distingue soprattutto per alcuni fattori extra-linguistici. Tutte le autrici sono nate in Inghilterra, ma sono di origine giamaicana e appartengono alla comunità afro-caraibica inglese, dunque sono familiari con le due lingue e culture che compongono il British Creole. Inoltre, i testi includono personaggi giamaicani emigrati a Londra e trattano di tematiche che in un modo o in un altro riguardano l’identità black e le comunità afro-caraibiche londinesi. Considerando quindi lo sfondo culturale delle autrici e dei testi, si può affermare che il creolo usato nei lavori potrebbe essere un esempio di British Creole. Infine, un terzo principio di scelta è il successo sia di pubblico sia di critica delle tre opere, le quali hanno tutte vinto
267 Svenja Adolphs, Introducing Electronic Text Analysis: A Practical Guide for Language and Literary Studies (Abington: Routledge, 2006).
72
premi importanti.268 Ciò inserisce l’uso del creolo in una dimensione molto visibile e può solo rafforzare l’ipotesi del ruolo della letteratura nel determinare prestigio linguistico.
La prossima fase, centrale per l’analisi quantitativa, consiste nell’identificazione delle parti in creolo, poiché White Teeth, Small Island e Random impiegano la lingua creola solo in alcune porzioni del testo. La circoscrizione dei dati utili ai fini dell’analisi determina poi la grandezza del corpus e influisce sui risultai, perciò la delimitazione diventa cruciale. Tale procedura è complicata dal fatto che la varietà creola è spesso rappresentata da una morfo- sintassi non-standard e non sempre a livello dello spelling. Si è deciso pertanto di includere nel corpus ogni frase che rispetti almeno uno dei seguenti criteri:
1. La frase contiene spelling in lingua creola (respellings) o elementi lessicali in lingua creola.
2. La frase è pronunciata da personaggi parlanti del creolo giamaicano e la frase contiene sintassi non-standard.
In White Teeth la lingua creola è usata solo nel discorso diretto dei personaggi ed è sempre rappresentata attraverso uno spelling non-standard. Allo stesso modo anche nel testo teatrale
Random il creolo è presente nel dialogo dei personaggi e quindi in questi due testi la sua
identificazione avviene con facilità. In Small Island, invece, l’individuazione dei passaggi in creolo è problematica perché spesso la varietà dei personaggi giamaicani è rappresentato solo a livello della morfo-sintassi, raramente anche nello spelling. Tuttavia, se il personaggio usa il creolo in qualche episodio, dimostrandone la conoscenza, tutte le altre istanze del suo dialogo, purché comprendendo sintassi non standard, sono incluse nel corpus.
Una volta identificate le parti che includono la lingua creola, queste vengono trascritte manualmente in un file di testo formato .txt, separatamente per ciascuno dei testi così da poter essere analizzate in modo elettronico. La struttura del corpus è formata quindi da tre testi e nella Tabella 1 si possono osservare il numero delle parole o di tokens per ognuno di essi.
Tabella 1. Numero di parole per ogni singolo testo del corpus.
Testo White Teeth Small Island Random Totale
Nr tokens 4.225 6.021 5.091 15.337
268 Tra tanti premi White Teeth e Small Island hanno entrambi vinto il Commonwealth Writers Prize, rispettivamente nel 2001 il Best First Book e nel 2005 il Best Book, e entrambe hanno vinto anche il Whitbread
Book Award. La scrittrice debbie tucker green è stata premiata con il Olivier Award for Most Promising Newcomer nel 2004.
73
Le dimensioni dei testi sono alquanto equilibrate, e nonostante tra White Teeth e Small Island ci sia una differenza di quasi duemila parole, si può comunque considerarli di grandezza simile per poterli confrontare. È anche vero che in totale si tratta di un corpus molto piccolo, ma ciò non deve sminuire il valore della ricerca. La questione della rappresentatività diventa centrale nella Corpus Linguistics e spesso si presume che tanto più la dimensione di un corpus sia elevata, tanto più sia rappresentativo. Questa però dipende da molti fattori tra cui la tipologia di corpus, ovvero un corpus generale o di riferimento oppure uno specialistico, e dagli usi per cui esso viene creato.269 Nel caso del CWBC Sebba afferma che si tratta di valutare quanto il campione (sample of texts) rifletta la lingua usata in un particolare ‘universo’ di testi: “the question of ‘representativeness’ of a corpus […] in other words, how well the sample of texts in the corpus reflects the language found in a particular ‘universe’ of texts (i.e. the totality of texts in that language)”270 e ammette la difficoltà di identificare cosa si intenda per ‘universo’ di testi nel caso specifico del creolo scritto. Per l’analisi lessicale per esempio un corpus viene considerato piccolo, ma sufficiente, se il numero delle parole è compreso tra 15 000 e 100 000 tokens, quindi anche nella presente ricerca la grandezza potrebbe essere soddisfacente.271 Del resto, la problematica della rappresentatività è importante per poter fare delle considerazioni più ampie sulla lingua creola scritta, ma dato che l’obiettivo è un’attenta analisi del creolo letterario, si ritiene che la dimensione del corpus sia adeguata.