• Non ci sono risultati.

Analisi delle co-occorrenze: i due ruoli

Capitolo 3. Analisi dei dati distribuzionali

3.2 Applicazioni dell'ipotesi distribuzionale

3.3.3 Analisi delle co-occorrenze: la finestra simmetrica

3.3.3.4 Analisi delle co-occorrenze: i due ruoli

Nelle sezioni precedenti sono state presentate e analizzate le frequenze con cui verbi e proprietà delle norme focali, delle norme focali espanse e delle norme generate casualmente co-occorrono nel BNC.

In questa sezione, invece, vengono presentati i risultati delle analisi condotte considerando, prima, le proprietà dell'AGENTE, poi quelle del PAZIENTE; sono state

infatti calcolate le frequenze con cui le proprietà di ciascuno dei due ruoli si osservano nel corpus di riferimento entro una certa distanza dal verbo per cui sono state prodotte. Come nei casi precedenti (vedi par. 3.3.3.1, 3.3.3.2, 3.3.3.3), le frequenze di co- occorrenza verbo-proprietà vengono definite in relazione alle tre finestre di riferimento

w0, w1, w2 e vengono valutate utilizzando le soglie t1, t5, t10 e t20; lo scopo

dell’indagine consiste nell’osservare come le proprietà si distribuiscano rispetto al verbo per cui sono state prodotte e nel verificare se, nel corpus, siano le proprietà dell’AGENTE

o quelle del PAZIENTE a ricorrere più spesso con i verbi.

In primo luogo, perciò, a partire dalle norme focali, sono selezionate solo le proprietà che descrivono istanze verbo-specifiche dell'AGENTE; variando l'ampiezza della finestra

di riferimento, vengono calcolate le percentuali di proprietà dell'AGENTE che co-

occorrono insieme ai verbi di cui sono descrizione in ciascuna finestra. I risultati ottenuti per le soglie di frequenza t1, t5, t10 e t20 vengono presentati in Figura 3.4.

Osservando la Figura 3.4, emerge che circa il 60% delle proprietà che descrivono istanze verbo-specifiche dell'AGENTE co-occorre con il verbo corrispondente almeno

una volta in w0, la finestra minima: questo valore aumenta, come nei casi precedenti, all'aumentare dell'ampiezza della finestra di riferimento e raggiunge il valore massimo, pari a 74.236%, in w2, la finestra corrispondente a cinque frasi.

Sempre in w2, circa il 55% delle proprietà dell'AGENTE ricorre insieme al verbo di cui è

descrizione almeno cinque volte (t5), mentre in w1, la finestra corrispondente a tre frasi, questo valore equivale al 48.5%.

Il valore minimo in assoluto (16.36%) si ottiene quando la finestra corrisponde a una frase (w0) e la soglia di frequenza è massima (t20): questi risultati sono in linea con le aspettative e confermano che, la percentuale di coppie verbo-proprietà con frequenza maggiore o uguale a ciascuna soglia definita a priori, aumenta all'aumentare dell'ampiezza della finestra di riferimento e diminuisce nel momento in cui i vincoli sulla frequenza diventano più restrittivi (t10, t20).

Analizzando le proprietà che descrivono istanze verbo-specifiche del PAZIENTE, si

ottiene una distribuzione complessivamente analoga (vedi Figura 3.5).

La Figura 3.5 mostra che, in corrispondenza di w2, la finestra massima, circa il 73% delle proprietà del PAZIENTE co-occorre insieme ai verbi di cui è descrizione e questo

valore diminuisce al diminuire dell'ampiezza della finestra (corrisponde a 58% in w0). Per quanto riguarda w1, la finestra corrispondente a tre frasi, il 46% delle proprietà del paziente co-occorre con i verbi di cui è descrizione almeno cinque volte e questo valore diminuisce all'aumentare della soglia di frequenza e corrisponde a 25.56% per t20. Ancora una volta il valore minimo, 15.33%, si registra in w0 per t20 e ciò mostra che, anche nel caso del PAZIENTE, si osservano gli effetti congiunti dell'ampliamento della

finestra e dei vincoli imposti sulla frequenza.

Anche se complessivamente le due distribuzioni sono analoghe, ci sono differenze, in quanto le istanze verbo-specifiche dell'AGENTE sono quelle le cui proprietà co-

occorrono maggiormente con i verbi di cui sono descrizione: in w2 per t1, la differenza fra AGENTE e PAZIENTE è minore (74.236% per l'AGENTE, 73.81% per il PAZIENTE)

rispetto a quella che si osserva, per esempio, in w1 per t5, in cui sono estratte il 48.5% delle proprietà dell'AGENTE e il 46% delle proprietà del PAZIENTE e in w1 per t1, in cui

vengono recuperate il circa il 59.5% delle proprietà dell'AGENTE, contro il 57.5% delle

proprietà del PAZIENTE.

Per verificare se queste differenze siano significative, sono utilizzare venti soglie di frequenza (da una soglia di frequenza minima uguale a uno, a una soglia di frequenza minima uguale a venti), per estrarre le coppie verbo-proprietà dell'AGENTE e del PAZIENTE che ricorrono entro e oltre i valori stabiliti dalle soglie: il test di Wilcoxon

paired mostra che le differenze sono significative, e l’AGENTE è il ruolo per cui sono

estratte dal corpus un maggiore numero di proprietà delle norme (V = 210, valore-p = 9.569e-05).

Considerando i verbi e le proprietà prodotte dai soggetti per descrivere le istanze verbo- specifiche dell'AGENTE che co-occorrono nel BNC almeno una volta, emerge che non vi

è correlazione fra le frequenze di produzione di tali proprietà nelle norme e le frequenze di co-occorrenza verbo-proprietà dell'AGENTE estratte automaticamente dal corpus (rho

= 0.04978232, valore-p = 0.009077); non vi è correlazione neppure nel caso delle coppie verbo-proprietà del PAZIENTE (rho = 0.04525241, valore-p = 0.02823).

In definitiva, le analisi mostrano, come le precedenti, che il numero di coppie estratte aumenta all'aumentare dell'ampiezza della finestra di riferimento e diminuisce all'aumentare dei vincoli sulla frequenza, cioè all'aumentare della soglia; inoltre, nel corpus di riferimento, sono molte le proprietà a co-occorrere insieme ai verbi di cui sono descrizione e questo vale sia per quelle che descrivono istanze verbo-specifiche dell'AGENTE (valore massimo pari a 74.236% in w2 per t1), sia per quelle che

descrivono istanze verbo-specifiche del PAZIENTE (valore massimo pari a 73.814% in

w2 per t1). Tuttavia, sussistono differenze significative fra PAZIENTE e AGENTE, in

quanto è possibile estrarre dal corpus di riferimento un maggiore numero di proprietà di quest'ultimo, per tutte le finestre e soglie di frequenza considerate.

Infine, non sussiste correlazione fra la frequenza con cui i soggetti producono le proprietà dell’AGENTE nelle norme e le frequenze con cui esse co-occorrono nel corpus

insieme ai verbi di cui sono descrizione; un risultato analogo si ottiene anche nel caso delle proprietà PAZIENTE.