• Non ci sono risultati.

Codifica frasi

N/A
N/A
Protected

Academic year: 2021

Condividi "Codifica frasi"

Copied!
13
0
0

Testo completo

(1)

API

Documento di specifiche

per la codifica del CORPUS DI FRASI

Unità di ricerca dell'Università di Pisa Responsabile: Prof. Giovanna Marotta

(2)

Introduzione.

Nell’ambito del progetto CO-FIN API (1999-2001), l’unità di ricerca facente capo all’Università di Pisa ha in primo luogo analizzato acusticamente 542 frasi rappresentative di vari fenomeni fonologici del parlato toscano. E' stata quindi operata una comparazione tra i dati relativi a questo materiale, indotto, con i dati provenienti dalle Mappe AVIP-Pisa-SNS A03 e BO3.

Quanto segue fa riferimento all'analisi relativa alle frasi, il cui elenco viene fornito in Appendice.

Soggetti.

Poiché fulcro del programma di ricerca era l'italiano parlato nella città di Pisa, i materiali sono stati prodotti da locutori pisani.

Le frasi sono state lette da cinque parlanti nati e vissuti a Pisa, aventi entrambi i genitori di origine pisana. Si tratta, per la precisione, di quattro soggetti già registrati per il precedente progetto CO-FIN AVIP (1997-1999) (tre maschi: SA, BF, VF, ed una femmina, BA), nonché locutori delle due mappe selezionate per la comparazione, cui è stata aggiunta un'ulteriore locutrice di sesso femminile (MA).

Tutti i soggetti sono studenti universitari. Corpus.

Il corpus elaborato e quindi analizzato acusticamente è composto da 122 enunciati aventi diversa lunghezza e struttura sintattica. Nel corpus ricorrono essenzialmente due modalità enunciative, le frasi sono infatti assertive oppure interrogative (sia domande polari che wh-). Ciascun enunciato è stato costruito per favorire la realizzazione di almeno un fenomeno fonologico tipico del parlato pisano.

La Tabella seguente illustra il numero di frasi analizzate in rapporto al locutore:

(3)

Numero di frasi per parlante

Parlante Numero di Frasi

BA - F 151 BF - M 101 MA - F 84 SA - M 77 VF - M 129 TOTALE 542

Per questioni di ordine metodologico, tutte le frasi sono state suddivise in cinque classi diverse a seconda del principale fenomeno che s’intendeva prendere in esame nella frase medesima. Ogni raggruppamento è stato etichettato da una sigla identificatrice, come riportato qui di seguito:

1) Gorgia: sono raccolti in questo gruppo gli enunciati in cui è presente, a livello segmentale, una significativa ricorrenza di occlusive sorde in diverso contesto sillabico e prosodico;

2) RF: in questa classe confluiscono le frasi in cui compare almeno un contesto che induce il fenomeno del Rafforzamento Fonosintattico;

3) Sin: tale sigla identifica la presenza del fenomeno della sinalefe; la classe raccoglie infatti le frasi costruite appositamente in vista della produzione di un incontro vocalico a confine di parola, tra due timbri vocalici identici o diversi;

4) Cons: in questa classe sono compresi gli enunciati in cui si rileva la presenza di consonati finali di parola, suscettibili di produrre epitesi;

5) Varie: questa classe raccoglie le frasi in cui compaiono simultaneamente più fenomeni e che pertanto risultano difficilmente classificabili sotto un’unica etichetta.

(4)

Modalità di registrazione.

Ad ogni informatore è stato concesso, in via preliminare, un tempo sufficientemente lungo per familiarizzare con l’ambiente di laboratorio e con i materiai linguistici da produrre.

Le frasi trascritte sono state presentate ai locutori in ordine casuale su più fogli dattiloscritti. Ai soggetti, che erano all’oscuro delle finalità della ricerca, è stato chiesto di leggere ad alta voce le frasi nel modo più naturale possibile, con un’intonazione neutra, cercando di mantenere una velocità elocutiva costante. Ogni frase è stata letta almeno tre volte in una o più seduta di registrazione. Tra una ripetizione e l’altra sono state effettuate delle pause; è stata inoltre concessa la facoltà di interrompere la registrazione ogni volta che il locutore lo ritenesse opportuno.

Le registrazioni si sono svolte nella cabina silente della Scuola Normale Superiore di Pisa, utilizzando strumenti professionali (registratore Sony Dat e microfono Sennheiser).

Campionamento.

Si è quindi proceduto con l’ascolto iterato del materiale linguistico registrato da parte dell’intera équipe di ricerca. Ai fini dell’analisi acustica, sono stati selezionati gli enunciati giudicati sufficientemente naturali e privi di errori, complessivamente 542.

L’acquisizione digitale dei materiali è avvenuta mediante scheda audio Sound Blaster 16PCI, con frequenza di campionamento a 22050 Hz, per un range di frequenza pari a 0/8000 Hz e conversione a 32 bit. L’analisi acustica è stata svolta con il software Segwin messo a punto nell’ambito del progetto AVIP.

(5)

Criteri di trascrizione.

Per i livelli di analisi WRD, PHM, PHB e PHN, previsti dal software Segwin, sono state seguite le norme di etichettatura già elencate e formalizzate nel documento di specifiche AVIP.

Rispetto all'unità di lavoro API- Pisa-SNS (per la quale si veda il Documento di specifiche per la rappresentazione, analisi e codifica dei dati.Trascrizione ed etichettatura dei livelli segmentali, §5, - codifica segmentale.pdf,), sono state tuttavia introdotte alcune innovazioni a livello PHN, in cui è prevista la trascrizione fonetica stretta, con identificazione e classificazione degli allofoni tipici della varietà in esame. Le etichette utilizzate sono sostanzialmente conformi alla codifica generale adottata dalle altre unità coinvolte nel progetto.

Le variazioni di trascrizione che sono state apportate (cfr. Tabella di corrispondenza IPA-PHN) sono state giustificate dalla volontà di ottenere una trascrizione fonetica fine, che meglio rispecchiasse i fenomeni fonetico-fonologici in esame.

Nel corso dell'analisi acustica, sono state identificate tre diverse varianti per i fonemi occlusivi sordi, vale a dire segmenti occlusivi puri, segmenti occlusivi aspirati e segmenti fricativi.

La nostra trascrizione a livello PHN prevede pertanto: • p, t, k per la serie delle occlusive sorde;

• p_h, t_h, k_h per la serie delle occlusive sorde aspirate; • p_f, t_f, H\ per la serie delle fricative.

Si veda a tale proposito la tabella di corrispondenza tra la trascrizione IPA e la nostra trascrizione a livello PHN posta in coda al documento.

Tale codifica corrisponde perfettamente a quella stabilita ed utilizzata per l’etichettatura degli altri materiali in AVIP.

La classificazione dei segmenti in occlusivi, occlusivi aspirati e fricativi si è basata sull'esame spettrografico e sulla misura del parametro temporale. Abbiamo infatti misurato la durata totale del segmento occlusivo, nonché la durata delle singole fasi che lo caratterizzano, tipicamente, occlusione e Voice Onset Time (VOT). Il VOT, considerato dalla letteratura internazionale come il principale parametro responsabile della distinzione tra la classe delle occlusive sorde dalla classe delle occlusive sorde aspirate, corrisponde acusticamente ad un rumore di

(6)

frizione. Le occlusive aspirate sono caratterizzate da un VOT più lungo rispetto alla loro controparte non aspirata. Anche per la nostra analisi, abbiamo pertanto ritenuto opportuno considerare la durata del VOT quale criterio primario per la classificazione delle consonanti occlusive. In particolare, sono state classificate aspirate le occlusive sorde in cui la durata del VOT risultava superiore:

- ad un terzo della durata totale dell’intero segmento per /t/ e /k/; - ad un quarto della durata totale per /p/.

Il duplice criterio di classificazione risulta motivato dalla diversa lunghezza del VOT, che, come è noto, varia in rapporto al luogo di articolazione della consonante, essendo inversamente proporzionale al grado di anteriorità del segmento.

Meno complessa si è rivelata l’identificazione delle varianti spiranti dei fonemi occlusivi: assenza di una fase di occlusione e presenza di una struttura spettrografica riconducibile a rumore di frizione sono stati i parametri basilari per la classificazione del segmento come fricativo. Questi segmenti sono stati trascritti a livello PHN con B D G se approssimanti sonori, in linea con i criteri della trascrizione AVIP-API, e con p_f, t_f e H\, se sordi.

In corrispondenza con quanto stabilito già in AVIP-API, l'etichettatura delle liquide identifica i seguenti allofoni:

- laterali fricative [¬L] trascritte a livello PHN come l_f; - vibrante fricativa [®] trascritta r_f.

Per la trascrizione della liquida polivibrante, monovibrante e approssimante sono stati seguiti gli stessi criteri codificati in AVIP, come pure per l’etichettatura fonetica delle vocali, con l'unica aggiunta di ae per [Q], vocale tipica della varietà pisana.

(7)

7

Corrispondenze simboli fonetici IPA e livello PHN (SegWin)

• Consonantismo

Ostruenti

IPA

PHN

1.

Occlusive (sorde e sonore)

Bilabiali p p b b Alveolari t t d d Velari k k g g

2.

Aspirate (sorde e sonore)

Bilabiali pH p_h bH b_h Alveolari tH t_h dH d_h Velari kH k_h gH g_h

(8)

8

IPA

PHN

3.

Fricative (sorde e sonore)

Bilabiali p_f B B Labiodentali f f v v Alveolari T t_f D D Alveolari s s Sibilanti z z Palatali S S Z Z Velare sonora ƒ G Glottidale sorda h H\

4.

Affricate (sorde e sonore)

Palatali tS tS dZ dZ Alveolari ts ts dz dz

5.

Nasali

Bilabiale m m Labiodentale M M Alveolare n n Palatale ¯ J Velare N N

(9)

9

Sonoranti

IPA

PHN

6.

Liquide

Laterale alveolare l l Laterale palatale ¥ L Laterali fricative ¬ l_f L l_f Polivibrante alveolare r r Monovibrante R 4 Vibrante fricativa r_f

7.

Approssimanti

Laterale l l\ Vibrante ® r\ Labiodentale V v\ Palatale j j Labiovelare w w

(10)

10

Vocalismo

IPA

PHN

Anteriore alta i i Anteriore medio-alta e e Anteriore medio-bassa E E Anteriore bassa Q ae

Vocale centrale (schwa) ´ @

Vocale centrale medio-bassa å 6

Centrale bassa a a

Posteriore medio-bassa ç O

Posteriore medio-alta o o

Posteriore alta u u

Fenomeni fonologici

I seguenti simboli seguono il fonema interessato dal fenomeno indicato:

Sonorizzazione _v

Desonorizzazione _0

Palatalizzazione _j

Laringalizzazione _k

Nasalizzazione ~

Resa sillabica di un segmento =

Incertezza (es. confine tra glide e vocale in un dittongo) %

Traccia di segmento *

Inserzione di fonema +

(11)

-11

APPENDICE

Elenco delle frasi API - Unità di Ricerca dell'Università di Pisa. 1. Bisogna passarci un panno bagnato

2. Bisogna prendere quella ragazza che viene col treno 3. C'è stata un'esplosione di gas metano

4. Carla porterà tre gattini 5. Carla porterà tre piccoli gatti 6. Che entravi?

7. Che entri? 8. Che fai?

9. Ci passa sempre dei cortei lunghi 10. Come esce la ragazza?

11. Come va?

12. Con la mano bagnata mi scivola questa borsa piena di roba 13. Dimmi che hai

14. Dimmi come si fa a uscire 15. Dimmi quando vieni via 16. Dimmi quando vieni via! 17. Dove entra Maria?

18. Dove entrava la ragazza? 19. Dove vai?

20. Faccio come Piero

21. Gigi ha detto che entra per primo 22. Gigi ha detto che usciva per me 23. Ha nevicato anche in pianura 24. Hanno aperto un pub carino 25. Hanno aperto un pub grandissimo 26. Hanno aperto un pub inglese 27. Hanno aperto un pub intimo 28. Hanno aperto un pub nuovo 29. Ho bevuto un caffè al bar Scudieri

30. Ho bevuto un caffè che sapeva di bruciato 31. Ho comprato due slip alti

32. Ho comprato due slip bianchi 33. Ho comprato due slip costosi 34. Ho comprato due slip eleganti 35. Ho comprato due slip neri 36. Ho comprato due slip rossi

37. Ho deciso di non scrivere a nessuno 38. Ho deciso di non scrivere a nessuno. 39. I panni molli pesano tanto

(12)

12

40. Ieri siamo andati in un bar elegante 41. ieri siamo andati in un bar intimo 42. Ieri siamo andati in un bar strano

43. Ieri siamo andati in un bar strano molto rumoroso 44. Il cane trovò anche un osso

45. Il prosciutto è da avviare 46. Io mangio un pollo

47. Io preferisco il caffè integrale 48. Io sto con Andrea

49. Io sto con Anna 50. Io vado dove Andrea 51. Io vado dove Andrea. 52. Io vado dove Anna 53. Io vado dove Enrico 54. Io vado dove Enzo 55. L'articolo è già in stampa 56. La ragazza viene da Napoli 57. La strada passava per Antraccoli 58. La strada passava per Arni 59. La tavola dove alza?

60. Le macchine costano troppo 61. Lo fo' per Andrea

62. Lo fo' per Enzo

63. Loro non sanno cantare 64. Loro sanno tutto di noi

65. Luca ci ascoltava con stanchezza 66. Luca ha studiato poco

67. Lucca è una città cara 68. Lucca è una città carina 69. Lucca è una città molto carina 70. Lui è quello che arriva con te 71. Lui è quello che entra con Paola 72. Lui viene di sera

73. Luigi ha ventitré cani 74. Luigi scrive a Maria

75. Luigi ti porterà dove devi andare

76. Luigi ti porterà dove hai sempre voluto andare 77. Luisa non sbadiglia mai la sera

78. Mangerò tre grossi panini per cena 79. Mangerò tre grossi panini per cena. 80. Marco tornerà sabato sera

81. Maria è come Anna 82. Maria è partita 83. Maria entra 84. Maria ha paura 85. Marilù bacerà Lino

(13)

13 86. Marilù bacerà Lorenzino 87. Marilù bacerà Lorenzo

88. Mario beve solo il caffè che vende Salza 89. Mario come arriva in treno?

90. Mario è come Andrea 91. Mario è come Enrico 92. Mario è come Enrico. 93. Mario è come Enzo 94. Mario ha detto che viene

95. Mario non è mai andato in Spagna 96. Non so se tornare o no

97. Non sopporto questi piagnistei uggiosi 98. Oggi si mangia un pollo

99. Paola non lo so se viene oggi 100. Paola non so se viene oggi 101. Paolo dice che arriva per Piero 102. Paolo non so se alza questo peso 103. Paolo non so se arriva

104. Paolo non so se entra 105. Pensa sempre per sé 106. Quando uscii, sentii freddo 107. Quando vestii Enzo era mattina 108. Quel cane abbaia tutte le notti 109. Questa cosa come si fa?

110. Questi sono soltanto bei discorsi 111. Questo fiume dove arriva? 112. Te mangi un pollo 113. Ti senti meglio? 114. Vado da Andrea 115. Vado da Angelina 116. Vado da Anna 117. Vado da Enrico 118. Vado da Enzo

119. Vado dove c'è più luce 120. Vado dove Piero 121. Vieni via!

Riferimenti

Documenti correlati

CAPSULA POLILAMINATO C/ALU 90 Raccolta differenziata dedicata o raccolta differenziata per rifiuti organici.. TAPPI SUGHERO

La decisione sull'eventuale introduzione del sistema di identificazione su base obbligatoria per uno o più materiali può essere adottata in conformità con la procedura di

Valori giornalieri di riferimento ossia Guideline Daily Amounts (GDA) suggeriscono la quantità totale di energia e nutrienti che un adulto, in buono stato di salute, deve

LiqBreasTrack: tracking mutational trajectories in T-DM1- treated HER2 breast carcinoma patients by Liquid

Food and Drug Administration approved Cobas EGFR Mutation Test v2 (Roche Molecular Systems, Inc.) using plasma specimens as a companion diagnostic test for the

Presso degli quali erano Monsignor el Marescial di Sant’Andrea, e quel di Sedan, vestiti di broccato d’oro, montati su due bellissimi cavalli, e doppo loro

Per mezzo del processo di sintesi condotto in ambiente Xilinx ISE 6 sono state fornite stime sulla complessità circuitale ottenuta a livello hardware dalle quali si può

Durante il seminario verranno messe in luce le buone pratiche e gli obblighi che hanno le piccole/medie aziende agricole che coltivano zafferano (Crocus sativus L.) per