• Non ci sono risultati.

AUTOMATINĖS ORGANINIŲ GERKLŲ LIGŲ KATEGORIZAVIMO SISTEMOS SUKŪRIMAS IR ĮVERTINIMAS

N/A
N/A
Protected

Academic year: 2021

Condividi "AUTOMATINĖS ORGANINIŲ GERKLŲ LIGŲ KATEGORIZAVIMO SISTEMOS SUKŪRIMAS IR ĮVERTINIMAS"

Copied!
124
0
0

Testo completo

(1)

KAUNO MEDICINOS UNIVERSITETAS

Marius Kašėta

AUTOMATINĖS ORGANINIŲ

GERKLŲ LIGŲ

KATEGORIZAVIMO SISTEMOS

SUKŪRIMAS IR ĮVERTINIMAS

Daktaro disertacija

(2)

Disertacija rengta 2005–2009 metais Kauno medicinos universitete, Ausų, nosies ir gerklės ligų klinikoje.

Mokslinis vadovas

prof. habil. dr. Vilgilijus Ulozas (Kauno medicinos universitetas, biomedicinos mokslai, medicina – 07 B)

Konsultantas

prof. habil.dr. Antanas Verikas (Kauno technologijos universitetas, technologijos mokslai, informatikos inžinerija – 07 T)

(3)

TURINYS

SANTRUMPOS ... 4 1. ĮVADAS... 5 Tikslas ... 6 Darbo uždaviniai ... 6 2. LITERATŪROS APŽVALGA... 8 3. TIRIAMŲJŲ KONTINGENTAS ... 20 4. TYRIMO METODAI... 25

4.1. Organinių gerklų ligų kategorizacija... 25

4.2. Anketiniai pacientų duomenų rinkimas ir apdorojimas... 32

4.3. Akustinių balso parametrų registravimas. ... 34

4.4. Nuo laiko nepriklausomų balso parametrų skaičiavimas ... 37

4.5. Automatinis balso įrašų klasifikatorius ... 43

4.6. Ekspertinis balso įrašų kategorizavimas... 44

4.7. Mikrolaringoskopinių vaizdų registravimas... 44

4.8. Mikrolaringoskopinių vaizdų parametrų matavimo metodai ... 45

4.9. Mikrolaringoskopinių vaizdų parametrų skaičiavimas... 51

4.10. Automatinis mikrolaringoskopinių vaizdų klasifikatorius ... 56

4.11. Ekspertinis mikrolaringoskopinių vaizdų vertinimas ... 57

5. AUTOMATINĖS KATEGORIZAVIMO SISTEMOS SĄRANGA ... 58

6. STATISTINIS DUOMENŲ APDOROJIMAS ... 62

7. REZULTATAI IR JŲ APIBENDRINIMAS... 64

7.1. Demografinių duomenų ir subjektyvių balso parametrų kategorizavimas ... 64

7.2. Akustinių balso parametrų kategorizavimas ... 79

7.3. Mikrolaringoskopinių vaizdų kategorizacija... 98

7.4. Automatinė organinių gerklų ligų kategorizavimo sistema, naudojanti trijų rūšių informaciją... 108

IŠVADOS ... 115

DISERTACIJOS TEMA SPAUSDINTI DARBAI ... 116

Kitos publikacijos... 116

(4)

SANTRUMPOS

AOGLKS – automatinė organinių gerklų ligų kategorizavimo sis- tema.

AVM – atraminių vektorių mašinos. BNI – balso neįgalumo indeksas. B-VAS – balso vaizdinio atitikmens skalė.

F0 – pagrindinis tonas.

F-max – aukščiausiai išdainuotas tonas. F-min – žemiausiai išdainuotas tonas. HTS – harmonikų-triukšmo santykis.

ID – intensyvumo diapazonas.

IFT – ilgiausia fonacijos trukmė. I-max – didžiausias balso intensyvumas. I-min – mažiausias balso intensyvumas. NŪE – normalizuota ūžesio energija.

ROC kreivė – angl. Receiver operating characteristic – grafikas, rodantis klasifikatoriaus jautrumo ir specifiškumo (tiksliau, specifiškumo ir vieneto skirtumo) sąryšį.

S – fonetogramos plotas.

SD – standartinis nuokrytpis. TD – tonų diapazonas.

(5)

1. ĮVADAS

Gerklų ligų diagnostika paremta visa eile instrumentinių tyrimo metodų (videolaringoskopija ir kimografija, tiesiogine ir netiesiogine laringoskopija) ir balso funkcijos įvertinimu. Objektyvus ir subjektyvus balso vertinimas yra pagrindas vertinant balso pakenkimo laipsnį, renkantis gydymo metodą, sekant bei prognozuojant pasirinkto gydymo rezultatus. Akustiniai balso parametrai dėl jų registravimo neinvazyvumo ir informatyvumo plačiai naudojami tiek klinikinėje praktikoje, tiek ir moksliniuose tyrimuose. Nepaisant visų pasiekimų, išlieka nemažai sunkumų analizuojant ir vertinant akustinius balso parametrus (silpnas koreliacinis ryšys tarp akustinių balso parametrų ir subjektyvaus balso vertinimo, sunkumai išskiriant nuo pagris-dinio tono priklausomus parametrus esant grubiam balso pakenkimui, akustinių balso parametrų registravimo ir skaičiavimo algoritmų gausa ir nepatikimumas). Automatinių akustinių balso signalų analizės sistemų kūri-mas ir naudojikūri-mas klinikinėje praktikoje gali turėti nemažą reikšmę tikslesniam balso vertinimui. Akustinių balso parametrų (nuo laiko nepri-klausomi dažnio ir periodo, spektro ir kepstro koeficientai), iki šiol nenau-dotų akustinėje balso analizėje, panaudojimas klinikinėje praktikoje leistų tiksliau aprašyti patologinius balso pokyčius, o naujų algoritmų sukūtimas leistų sumažinti dabar naudojamų skirtingų metodikų įvairovę.

Dėl akustinių balso siganalų registravimo ir vertinimo netobulumo, orga-ninių gerklų ligų diagnostika daugiausia remiasi vaizdinėmis gerklų apžiū-ros priemonėmis. Klinikinėje praktikoje klasikinę netiesioginę piją vis dažniau keičia vaizdolaringostroboskopija ir tiesioginė laringosko-pija, kurios metu galima ne tik įvertinti struktūrinius gerklų pokyčius, bet ir atlikti įvairias manipuliacijas. Tobulinant vaizdines diagnostikos priemones, lieka vis mažiau sunkiai pasiekiamų ir apžiūrimų žmogaus kūno vietų. Pastaruoju metu ypač paplito neinvaziniai radiologiniai tyrimo metodai – kompiuterinė tomografija ir branduolių rezonanso tomografija. Taip pat daugėja tyrimo metodų (pozitronų emisijos tomografija), leidžiančių įvertin-ti ne įvertin-tik struktūrinius, bet ir fiziologinius įvairių organų pokyčius.

Technologinio progreso šviesoje, gydytojai ne visada spėja prisitaikyti prie naujų technologijų teikiamų galimybių ir kvalifikuotai vertinti bei interpretuoti naujai gautus duomenis. Šios problemos sprendimui, įvairiose gyvenimo srityse, kuriamos sprendimo priėmimo pagalbos sistemos. Ne išimtis yra ir medicina bei viena jos šaka – laringologija. Pavyzdžiui, kuria-mos analizavimo – klasifikavimo sistekuria-mos, galinčios net iš telefonu perteik-to balso įrašo nustatyti balso klosčių paralyžiaus tikimybę.

(6)

Problemos aktualumas

Sergamumas įvairiomis organinėmis gerklų ligomis, tarp jų ir onkologi-nėmis, didėja dėl senstančios visuomenės bei civilizacijos sąlygoto gyveni-mo būdo pasikeitigyveni-mo ir aplinkos taršos. Dėl slaptos eigos ir ankstyvų klini-kinių simptomų nebuvimo daugiau nei pusė gerklų vėžio atvejų diagno-zuojama vėlyvose stadijose. Nemažai reikšmės turi nesavalaikis ankstyvųjų simptomų interpretavimas, gydymo skyrimas ir rezultato prognozavimas. Šiuos netobulumus lemia daugelis faktorių, tarp kurių ne paskutinę vietą užima gydytojo patirties stoka. Siekiant sumažinti diagnostinių tyrimų vertinimo subjektyvumą, patirties skirtumus tarp skirtingos kvalifikacijos tyrėjų ir gydytojų, užtikrinant nuoseklų mokymo ir mokymosi procesą, tiek moksliniu, tiek praktiniu požiūriu yra aktualu sukurti visuotinai prieinamą sistemą, suteikiančią pagalbą diagnozuojant organines gerklų ligas. Tokia sistema turėtų remtis daugeliu skirtingos informacijos šaltinių parametrais, lanksčiai prisitaikyti prie naujų parametrų įvedimo ir informacijos kaupimo. Pasaulyje nėra sukurtos ir visuotinai naudojamos gerklų ligų kategorizavimo sistemos, apjungiančios keletą informacijos šaltinių bei padedančios gydytojui priimti sprendimą neaiškiose situacijose.

Tikslas

Sukurti automatinę organinių gerklų ligų kategorizavimo sistemą, parem-tą mikrolaringoskopinių vaizdų, akustinių ir subjektyvių balso parametrų bei pacientų demografinių duomenų analize, ir įvertinti jos efektyvumą.

Darbo uždaviniai

1. Nustatyti statistinių metodų ir automatinės kategorizavimo siste-mos teisingo kategorizavimo rezultatus, naudojant organinėmis gerklų ligomis sergančių pacientų ir kontrolinės grupės asmenų akustinius ir subjektyvius balso vertinimo parametrus bei demogra-finius duomenis.

2. Sukurti balso klsočių patologinių darinių matavimo metodus bei įvertinti gautų rezultatų ryšį su akustiniais balso parametrais.

3. Atlikti ekspertinį organinių gerklų ligų kategorizavimą panaudojant mikrolaringoskopinius vaizdus ir gautus rezultatus palyginti su automatinės kategorizavimo sistemos rezultatais.

4. Atlikti ekspertinį organinių gerklų ligų kategorizavimą panaudojant pacientų balso įrašus ir gautus rezultatus palyginti su automatinės kategorizavimo sistemos rezultatais.

(7)

5. Įvertinti automatinės gerklų ligų kategorizavimo sistemos efekty-vumą, apjungiant mikrolaringoskopinių vaizdų, akustinių balso parametrų bei demografinių duomenų informaciją.

Darbo naujumas ir praktikinė reikšmė

Disertaciniame darbe šiuolaikiniais laringologiniais tyrimo metodais (tiesiogine mikrolaringoskopija, akustine balso analize ir kompiuterine fone-tografija) kompleksiškai ištirti ir palyginti organinėmis gerklų ligomis sergančių pacientų ir sveikų asmenų klinikiniai simptomai, mikrolaringo-skopiniai ir balso pokyčiai.

Bendradarbiaujant su UAB „Elinta“ sukurtos unikalios gerklų struktūrų ir patologinių darinių matavimo sistemos „Glotometrija“ ir „Laringometrija“, kuriose naudojami mikrolaringoskopiniai gerklų vaizdai, o matuojami dydžiai išreiškiami santykiniais ir absoliučiais matavimo vienetais.

Bendradarbiaujant su Kauno technologijos universiteto Elektros ir valdymo įtaisų katedra atraminių vektorių mašinų (AVM) pagrindu sukurta automatinė organinių gerklų ligų kategorizavimo sistema naudojanti para-metrus, gaunamus iš tiriamųjų anketinių duomenų, akustinių balso signalų ir mikrolaringoskopinių vaizdų.

Naudojant įvairius paieškos metodus nustatyti anketinių duomenų, akustinių balso signalų ir mikrolaringoskopinių vaizdų parametrų rinkiniai, kurie tiksliausiai charakterizuoja kategorizuojamąsias klases: sveikąją, mazginio ir difuzinio balso klosčių pažeidimo.

(8)

2. LITERATŪROS APŽVALGA

Balsas yra pagrindinis žmonių bendravimo instrumentas. Juo mes ne tik perduodame norimą informaciją, bet kartu suteikiame informaciją apie kalbantįjį. Iš balso mes galime spręsti apie žmogaus lytį, amžių, nuotaiką, net ir apie išsilavinimą bei socialinę- ekonominę padėtį [89]. Tai daugialypis fenomenas, kuriame dalyvauja kvėpavimo, balsą produkuojantys (gerklos) ir balsą moduliuojantįs padargai (liežuvis, lūpos). Nors ir nėra visiškai aiškus mechanizmas, tačiau yra patikimai įrodyta psichoemocinės būklės įtaka balsui [17]. Pavyzdžiui, žmogus, savo kalboje naudojantis platų tono diapa-zoną, greičiausiai yra ekstravertas, aukštas įgimtas pagrindinis tonas leidžia manyti apie nervingumą [103]. Lėta kalba, žemas tonas ir siauras tonų spektras leistų manyti apie depresiją, o pučiantis, nereguliarus ir greitas balsas- apie nerimą [38]. Emocinės būklės įtaką balsui puikiai iliustruoja Sigmund‘o [99] atlikti eksperimentai. Autorius pateikia to paties kalbėtojo trimis skirtingais būdais ištartos tos pačios frazės grafinį vaizdą (2.1 pav.):

2.1 pav. Ilgalaikio spektro pasiskirstymas esnat normaliam ir emociškai pakitusiam balsui.

Pateiktame grafike punktyrinė linija žymi balsą streso metu, ištisinė linija žymi to paties kalbėtojo, tą patį pasakytą tekstą esnat normaliai (įprastinei) būklei. Taškinė linija žymi balsą, kuris buvo užregistruotas kai kalbėtojas buvo pavargęs. Autorius daro išvada, kad emocinė būklė balso pakitimams turi žymiai didesnę įtaką nei fizinis išsekimas.

Pastarojo meto studijos įrodo, kad balso sutrikimai turi neabejotinai neigiamą poveikį gyvenimo kokybei, ženkliai riboja bendravimą darbe bei blogina socialinę gyvenimo pusę. Moderniame pasaulyje 25 proc. dirbančiųjų savo darbe kaip pagrindinį instrumentą naudoja savo balsą, o 3,29 proc. dirbančiųjų turi darbus, kuriuose nuo jų balso priklauso aplinkinių žmonių

(9)

saugumas – tai oro eismo reguliuotojai, pilotai, policininkai [83]. Balso sutri-kimai ne vienodai paveikia skirtingų socialinių sluoksnių žmones. Aukštos kvalifikacijos darbuotojai, kurių pagrindinis darbo instrumentas yra balsas, pavyzdžiui mokytojai, teisininkai, žymiai anksčiau kreipiasi į specialistus pagalbos dėl balso sutrikimų nei asmenys, kurie dirba nekvalifikuota ar rankų darbą ir jų profesijoje nėra būtinas balso vartojimas [58]. Epidemiologiniu požiūriu, žmonės dirbantys nekvalifikuotą, mažai apmokamą ar rankinį darbą, turi ženkliai didesnę riziką susirgti gerklų vėžiu nei kiti žmonės [67].

Šių dienų pasaulyje vis labiau didėja poreikis greitam, nesunkiai atlieka-mam ir neskausmingam bei neinvaziviam tyrimui, kuris skirtas organinių gerklų ligų diagnostikai. Tokie tyrimo metodai tapo galimi, atsiradus tech-nologijoms, kurios leidžia registruoti, sukaupti bei apdoroti įvairių signalų informaciją. Ilgą laiką, įprastinė ir dažniausiai taikoma procedūra gerklų ligų diagnostikoje buvo tiesioginė arba netiesioginė gerklų apžiūra [112]. Paskutiniais dešimtmečiais, pagrindiniu instrumentu, gerklų pokyčiams vertinti, tapo videolaringostroboskopija [72]. Mokslininkai dirbantys šioje srityje siekia sukurti naują diagnostikos instrumtą, kuris palengvintų gerklų ligų diagnostiką kasdieninėje praktikoje. To siekiama, panaudojant naujus akustinius balso parametrus ir jų kombinacijas, gaunamas iš pacientų balso įrašų [21]. Nors jokie akustiniai balso parametrai negali pakeisti „gyvo balso“ išgirdimo, tačiau jie gali suteikti neabejotiną pagrindą apsisprenk-džiant ir renkantis intervencinę procedūrą [101].

Automatinio balso atpažinimo problema nagrinėjama apie penkiasdešimt metų. Nors yra pasiekta pakankamai laimėjimų, galutinis rezultatas nėra labai džiuginantis. Tai sietina su balso daugialypiškumu bei patologijos, galinčios paveikti balsą skirtingose jo susidarymo vietose, įvairove. Alcantud su bendraautoriais [3] savo straipsnyje nurodo keletą pagrindinių ne su balsiniu aparatu susijusių priežasčių, kurios neleidžia pasiekti didelio tikslumo automatiniame balso klasifikavime bei atpažinime:

• Fonacijos skirtumai. Pasaulyje nėra dviejų vienodai kalbančių žmo-nių. Kitaip sakant, vieno konkretaus žmogaus ištartą frazę, taip pat pakartoti negali niekas. Pakartojimas gali būti panašus, bet niekada nebus identiškas.

• Akustinės dviprasmybės. Ne visada įmanoma akustinius garsus (žodžius ar sakinius) susieti su jų raidine jų išraiška. Tai priklauso ne tik nuo kalbančiojo kalbos ypatybių, bet ir nuo klausytojo žinių, leidžiančių dekoduoti kalbinę informaciją.

• Tarties variacijos:

(10)

jung-atvejais kalbėjimo greitis yra per didelis arba per lėtas, todėl negalima aiškiai atskirti žodžių ribų.

o Fonetinės variacijos. Žodžio tarimas gali kisti priklausomai nuo tarties greičio bei nuo konteksto, tai sukelia didelį išsi-barstymą ir rezultatų prastėjimą automatiniame atpažinime. o Koartikuliacijos. Akustinės žodių savybės priklauso nuo

sa-kinio konteksto, o tai reiškia, kad tą patį žodį galima ištarti keletu skirtingų būdų. Norint išvengti šio fenomeno, reikia naudoti keletą pasirinto žodžio pavyzdžių, skirtinguose saki-niuose.

o Laiko variacijos. Priklausomai nuo kalbėtojo, atskirų žodžių ar net garsų tarties laikas gali ženkliai skirtis. Siekiant to išvengti, reiktų nustatyti dinaminius laiko rėmus.

o Triukšmas. Dėl savo klausos ir suvokimo charakteristikų, žmogus sugeba išgirsti ir suvokti kalbą triukšme arba ją inter-pretuoti net esant dideliems iškraipymams. Šių gebėjimų negalima pritaikyti automatinėje garso atpažinimo sistemoje. Šiuos teiginius puikiai iliustruoja Sigmund‘o atlikti bandymai [99]. Bandymuose dalyvavo skirtingų lyčių asmenys, kurie turėjo kelis kartus perskaityti tą patį tekstą sau įprastu balsu. Balsų palyginimui buvo naudojami ilgalaikio spektro parametrai. Autorius nustatė, kad net ir to paties žmogaus ištartos tos pačios frazės ilgalaikio spektro parametrai tiniškai skyrėsi 12,6 proc. Tuo tarpu lyginant vyrų ir moterų balsus, vidu-tinis parametrų skirtumas buvo 23,4 proc.

Dar viena aplinkybė, trukdanti balsų palyginimui- tarpkalbiniai skirtu-mai. Reikia paminėti, kad šie skirtumai atsiranda tik analizuojant ir lyginant ištartas frazes, o ne atskirus garsus. Ebberton [29] pateikia kalbų skirtumus remdamasi anglų ir prancūzų kalbomis. Sprogstamųjų priebalsių tarties pradžia anglų kalboje turėtų būti klasifikuojama kaip kalbos laikas (voice time), tuo tarpu prancūzų kalboje tų pačių priebalsių tarties pradžia klasifikuojama kaip nebylus laikas (voiceless time).

Iki šių dienų, diagnozuojant disfonijas ir sekant jų gydymo rezultatus, buvo remiamasi tik išgirstu balsu. Awan [5] pateikia keletą situacijų kuriose neuž-tenka akustinio balso vertinimo diagnostikai ar ligos eigos sekimui dinamikoje ir iškyla poreikis objektyviam kiekybiniam balso vertinimui. Tokie atvejai yra:

1. kai pacientą vargina santykinai silpna (nesunki) disfonija; 2. kai disfonija yra mišri ar nepastovi;

3. kai tyrėjui trūksta patirties vertinti pakitusį balsą;

4. kai bandoma objektyvizuoti ir vertinti pakankamai subtilius balso pokyčius dinamikoje.

(11)

Balso vertinimo ir klasifikavimo dinamikoje sunkumus vaizdžiai iliust-ruoja de Bodt [16] ir bendraautorių atlikta studija, kurioje 23 vertintojai du kartus vertino devynis balso įrašus su dviejų savaičių pertrauka. Balsai klasifikuoti pagal LGPAĮ (GRBAS) vertinimo sistemą, kur L – užkimimo laipsnis, G – grubus komponentas, P – pučiantis komponentas, A – asteninis komponentas, Į – įtampos komponentas, LGPAĮ – bendra visų dedamųjų suma. Rezultatai pateikti 2.1 lentelėje, o abiejų vertinimų palyginimui naudotas suderinamumo kriterijus κ.

2.1 lentelė. Balso įrašų vertinimo ir pakartotinio vertinimo suderinamumo (κ – Cohen‘o kappa koeficientas) priklausomybė nuo vertintojo patirties (I – nepatyręs, E patyręs) ir pareigų (ENT – otorinolaringologas, S/LP – fonopedas). κ I E ENT S/LP Visi L 0,50 0,70 0,62 0,58 0,60 G 0,29 0,40 0,27 0,43 0,35 P 0,29 0,45 0,30 0,46 0,38 A 0,51 0,28 0,42 0,36 0,39 Į 0,51 0,28 0,42 0,36 0,39 LGPAĮ 0,40 0,45 0,41 0,44 0,43

Vertintojai buvo suskirstyti į keturias grupes: turintys patirties balso patologijos srityje ir jos neturintys bei otorinolaringologus ir fonopedus. Iš pateiktos 2.1 lentelės matome, kad abiejų testų rezultatai turi gerą suderina-mumą (κ yra tarp 0,61 ir 0,80) vertinant tik L komponentą ir tik ekspertų bei otorinolaringologų grupėse. Likusių parametrų vertinimai tose pačiose grupėse turėjo tik patenkinamą ar vidutinį suderinamumą. Tuo tarpu ne balso specialistų ir fonopedų grupėse visų parametrų vertinimo rezultatų suderinamumas buvo tik patenkinamas ar vidutiniškas. Autoriai daro išvadą, kad patirtis ar profesiniai įgūdžiai neturi statistiškai reikšmingos įtakos klasifikuojant ir pakartotinai po dviejų savaičių vertinant pakitusį balsą. Panašius rezultatus pristato ir Dejonckere [18]. Jo duomenimis, L, G, P ir Į komponentai yra kur kas geriau suderinami nei A komponentas atliekant pakartotinius pakitusio balso vertinimus po tam tikrai laiko. Autoriai taip pat nenustatė, kas, profesija ar patirtis, turi statistiškai reikšmingą įtaką ver-tinimo ir pakartotinio verver-tinimo rezultatų suderinamumui.

(12)

balso pakitimus ir optimalaus algoritmo parinkimas, kurio pagrindu klasini-katorius darytų mažiausiai klaidų. Balso akustikoje naudojami du pagrindi-niai parametrai, kurie nusako balso kokybę – tai pagrindinio tono neperio-diškumas, vadinamas Jitter‘iu ir amplitudės neperioneperio-diškumas, vadinamas Shimmer‘iu. Kitas svarbus parametras, naudojamas apibūdinti patologiniam balsui yra balso plyšio triukšmas, kurį nusako normalizuota ūžesio energija. Šių parametrų pakitimai neabejotinai yra susiję su balso patologija ir yra naudoti visoje eilėje studijų objektyviam balso ištyrimui prieš gydymą ir po gydymo, rezultatų įvertinimui [112].

Kitas, ne mažiau reikšmingas, parametras balso analizėje yra pagrindinis tonas F0 arba balso aukštis. Juo remiantis yra apskaičiuojama Jitter’is ir

Shimmer’is. Pagrindinis tonas nėra homogeniška svyravimų seka ir dėl to gali būti sunku apskaičiuoti tiek Jitter’į ir Shimmer’į, tiek išaugti klaidingo klasifikavimo tikimybė. Siekiant minimalizuoti klaidos tikimybę Titze suklasifikavo ir išskyrė trijų rūšių pagrindinio tono signalus [106]. Pirmos rūšies signalas apibrėžiamas kaip beveik periodiškas signalas, kuris kieky-biškai nepakeičia analizės rezultatų, net jei analizuojamame segmente atsiranda ne pagrindinis tonas (sub-harmonics). Nepagrindinio tono energija yra žymiai mažesnė už pagrindinio tono energiją, todėl įtakos skaičia-vimams neturi. Antros rūšies signalas apibūdinamas, kaip signalas, kurio analizei didelę įtaka turi nepagrindiniai tonai. Šiuo atveju, nepagrindinio tono energija artėja prie pagrindinio tono energijos lygio ir kai kuriais atve-jais negalima aiškiai išskirti vieno pagrindinio tono. Trečios rūšies signalas apibūdinamas kaip signalas neturintis jokio periodiškuno. Tačiau nemažai komercinių balso analizės programų turi pagrindinio tono aptikimo ir anali-zės algoritmus bei pateikia skirtingus analianali-zės rezultatus naudojant tą patį balsą [55]. O tai verčia daugumą balso specialistų abejoti šių programų pateikiamais skaičiavimais. Kol kas nėra pagrindinio tono aptikimo ir analizės algoritmo, kuris patikimai veiktų analizuojant tiek sveiką, tiek pato-loginį balsą. Taip yra todėl, jog patologinis balsas yra sudėtingų svyravimų derinys, lyginant su sveiku balsu [52]. Todėl kai kurie autoriai siūlo balso signalą padalinti į pagrindinį toną (harmoninius svyravimus) bei triukšmą ir analizuoti kaip du atskirus signalus [62, 130].

Nors yra pakankamai studijų įrodančių patikimą ryšį tarp nuo laiko priklausančių akustinių balso pareametrų (F0, Jitter‘is, Shimmer‘is bei

harmonikų ir triukšmų santykis (HTS)) ir balso pažeidimo lygio [127, 131], tačiau keletas autorių tam prieštarauja. Pastarųjų teigimu, ciklinių kitimų matavimų reikšmė klinikinėje praktikoje yra abejotina, ypač analizuojant vidutiniškai ar labai pakenktą balsą. Skaičiuojant tokius ciklinius pokyčius kaip F0, Jitter‘į, Shimmer‘į labai svarbu tinkamai nustatyti balsinio signalo

(13)

kada baigiasi. Esant ženkliau pakenktam balsui bei padidėjus triukšmo energijos lygiui akustiniame balso signale, tampa labai sudėringa tiksliai nustatyti periodo pradžią bei pabaigą, o tai beabejotinai įtakoja skaičiuojamų parametrų reikšmes [10].

Siekiant padidinti Jitter‘io ir Shimmer‘io informatyvumą bei norint, kad jie atspindėtų ne signalo kitimų vidurkį, o visus kitimus akustinio signalo metu, buvo pasiūlyta skaičiuoti dažnio bei periodo koeficientus [20]. Nuo laiko priklausančių parametrų netobulumas ir mažas informatyvumas bei ryšys su balso pažeidimo lygiu paskatino tyrėjus ieškoti naujų parametrų, kurie nepriklausytų nuo pagrindinio tono, būtų nekintami laiko atžvilgiu bei nesiskirtų skirtinguose balso įrašo segmentuose. Tokiu būdu pradėta ieškoti balso pažeidimo dydžio priklausomybės nuo akustinio signalo spektro, kepstro bei jų išvestinių dydžių. Spektras yra gaunamas atlikus balso signalo Fourier transformaciją, o akustinis balso signalas perskaičiuojamas iš laiko matmens į dažnio matavimą. Tokiu būdu atvaizduojamas kiekvieno dažnio intensyvumas visame balso signale. Atliekant spektro Fourier transformaciją gaunamas kepstras. Šiuo būdu akustinis balso signalas perskaičiuojamas iš dažnio matmens į quefrency matavimą (kuris yra lygus 1/dažnis). Kepstras leidžia geriau vizualiai perteikti harmoninių signalų sąrangą akustiniame balso signale [47]. Vienas iš išvestinių kepstro parametrų yra kepstro viršū-nių iškilumas (cepstral peak prominence). Šis parametras gaunamas nubrė-žus linijinės regresijos quefrency tiesę kepstro dydžio ayžvilgiu ir parodo skirtumą tarp kepstro piko energijos ir energijos žemiau linijinės regresijos tiesės po kepstro energijos piku [46]. Tokiu būdu šis matas parodo, kiek daug harmoninių svyravimų energija skiriasi nuo triukšmo energijos. Normalus, sveikas balsas, turintis aiškią harmoninę struktūrą, turės aiškiai išreikštus ir aukštus kepstro pikus, ryškiai iškylančius virš triukšmo lygio. Tuo tarpu, esant pakenktam balsui, didėja triukšmo energijos lygis bei mažėja harmoninių svyravimų energija, todėl kepstro pikai plokštėja ir artėja prie triukšmo lygio.

Heman-Ackah su bendraautoriais išanalizavo dažnio bei amplitudės kiti-mo koefientų, harkiti-monikų ir triukškiti-mo santykio bei kepstro viršūnių iškilukiti-mo koreliaciją su balso užkimimu, grubiuoju ir pučiančiuoju komponentais [44]. Atliktoje studijoje stipriausias koreliacinis ryšys stebėtas tarp kepstro viršūnių iškilumo ir užkimimo laipsnio (koreliacijos koeficientas r = – 0,80). Tuo tarpu likusiems parametrams nustatytas kur kas silpnesnis koreliacinis ryšys su užkimimo laipsniu (Jitter‘io koeficientų koreliacijos koeficientas r = 0,60, Shimmer‘io koeficientų koreliacijos koeficientas r = 0,54, HTS koreliacijos koeficientas r = 0,53). Akustinių balso parametrų ryšys su

(14)

koreliacijos koeficientas r = – 0,50; P komponento koreliacijos koeficientas r = – 0,71).

Eadie ir Doyle pateikia priešingus duomenis. Jų atliktoje studijoje balsas klasifikuotas į sveiką ir nesveiką. Atlikus logistinę regrseninę analizę nustatyti trys informatyviausi parametrai, kurie klasifikatoriui leidžia pasiekti 100 procentų klasifikavimo tikslumą. Autorių duomenimis informa-tyviausi parametrai buvo HTS, Tono aukščio amplitudė (pitch amplitude) ir spektro plokštumo lygis (spectral flatness ratio) [28]. Šie duomenys akivaizdžiai parodo, kad balso klasifikavime yra informatyvūs akustiniai balso parametrai apskaičiuoti iš pagrindinio tono.

Eadie ir Doyle rezultatus patvirtina ir Linder su bendraautoriais atlikta studija, kurios metu naudota 120 balsų duomenų bazė, o balsas klasifikuotas į sveiką ir nesveiką. Klasifikatorius sukurtas dirbtinių neuroninių tinklų pa-grindu, kuriame naudoti keturi akustiniai balso parametrai: Jitter‘is,

Shimmer‘is, F0 standartinis nuokrypis ir glottal-to-noise excitation santykis.

Klasifikavimo tikslumas buvo 80 proc. (jautrumas: 63,0 proc.; specifišku-mas: 93,9 proc.) [66].

Dalis autorių savo studijomis įrodo, kad didžiausią reikšmę klasifikuojant patologinį ir sveiką balsą turi ne su pagrindiniu tonu susiję parametrai. Hillenbrand su bendraautoriais nustatė stipriausią koreliacinį ryšį tarp pučiančiojo komponento ir akustinio siganalo periodiškumo, apskaičiuoto iš balso kepstro [46, 47]. Tokius teiginius patvirtina ir Dejonckere atlikta studija, kurios metu rasta, kad sveikų žmonių dominuojantis kepstro pikas buvo kur kas didesnis, nei esant patologiniam balsui [19].

Wolfe ir Martin apjungė nuo pagrindinio tono priklausančius ir nepri-klausančius akustinius balso parametrus ir gavo 92 proc. klasifikavimo tikslumą, klasifikuojant balsą į tris klases: užkimimo lygį, pučiantį bei įtemptąjį komponentus. Tyrime naudota 45 žmonių duomenų bazė ir keturi akustiniai balso parametrai: Jitter‘io standartinis nuokrypis, pagrindinis tonas, garso/triukšmo santykio (SNR) standartinis nuokrypis ir kepstro viršūnių pikai [126].

Klasifikavimo rezultato priklausomybę nuo parametrų skaičiaus savo darbe vaizdžiai pateikia Peng ir bendraautoriai [77]. Šio eksperimento duomenų bazę sudarė 216 balso įrašų: 177 patologinio balso ir 39 sveikų žmonių. Savo darbe Peng ir bendraautoriai naudojo 30 akustinių balso signalo parametrų, balsai buvo klasifikuojami į sveiką ir nesveiką. Autoriai pateikia grafiką , kuriame pavaizduotas liekamojo nuokrypio priklausomybė (DR) (deviation residual) nuo parametrų skaičiaus (2.2 pav.). Grafiko Y ašis attinka DR reikšmes, o X ašis atitinka parametrų skičių (n).

(15)

2.2 pav. Liekamojo nuokrypio (DR) priklausomybė nuo akustinių balso signalo parametrų skaičiaus.

DR parodo klasifikavimo tikslumą ir savyje apjungia klasifikavimo tikslumo nuokrypį (ACR), jautrumo nuokrypį (SER) ir specifiškumo nuokrypį (SPR). DR apskaičiuojamas pagal formules:

ACR = (1 − Tikslumas)3 SER = (1 − Jautrumas)3 SPR = (1 − Specifiškumas)3 DR(n) = D(n×ACR, n×SER, n×SPR)

Klasifikavimo tikslumas yra didesnis, kai grafiko kreivė artėja prie X ašies. Klasifikavimui naudojant vieną parametrą, klasifikavimo tikslumas buvo 79,2 proc. Didinant parametrų skaičių iki penkių, stebimas žymus klasifikavimo rezultato kitimas nuo 79,2 iki 96,3 proc. Šiame taške, panaudojus penkis akustinio signalo parametrus jautrumas buvo 0,85, o specifiškumas 0,99. Toliau didinant parametrų skaičių iki septyniolikos klasifikavimo tikslumas nepadidėjo ir šiame taške stebimos tokios pačios rezultatų reikšmės kaip ir klasifikavimui naudojant penkis akustinius para-metrus. Didinant parametrų skaičių nuo penkių iki septyniolikos stebimas ne

(16)

kavimui naudojant šešioliką parametrų klasifikavimo tikslumas sumažėja iki 93 proc., o naudojant šešis arba dešimt – iki 93,5 proc. Toliau didinant parametrų skaičių nuo septyniolikos iki trisdešimt, klasifikavimo tikslumas žymiau nesikeičia (kreivė nepakyla nuo X ašies) ir svyruoja tarp 97–98 proc. Šiuo tyrimu įrodoma, kad klasifikavimo tikslumui įtaką turi ne kuo didesnis parametrų skaičius, o optimalus jų skaičiaus parinkimas. Eksperimento metu, didinant akustinių parametrų skaičių nuo vieno iki trisdešimt klasini-kavimo tikslumas keitėsi nuo 79,2 iki 98,2 proc., o šiam klasifikatoriui optimalus parametrų skaičius yra septyniolika. Naudojant aštuoniolika ir daugiau parametrų klasifikavimo tikslumas ženkliai nedidėja, o klaidos tiki-mybė išlieka vienodai maža.

Fonseka su bendraautoriais [32] apibendrino klasifikavimo tikslumą, naudojant įvairius klasifikatoriaus sukūrimo metodus. Gauti rezultatai patei-kti lentelėje 2.2.

2.2 lentelė. Klasifikavimo tikslumas naudojant skirtingus klasifikatorių kūrimo metodus.

Metodas Tikslumas proc.

Best-basis wavelet-packets 85

Neuroniniai tinklai apie 100

Fraktalas 90

Iš lentelės 2.2 matome, kad geriausi rezultatai gaunami klasifikatoriui naudojant neuroninius tinklus, o klasifikavimo tikslumas siekia arti 100 proc. Kadangi naudojant neuroninius tinklus gaunamas toks didelis klasifikavimo tikslumas, jų pagrindu sudaryti klasifikatoriai naudojami dažniausiai – daugiau nei 95 proc. visų klasifikatorių, skirtų balso atpažini-mo ir klasifikaviatpažini-mo probleatpažini-moms spręsti yra sukurti neuroninių tinklų pa-grindu. Taip pat čia labai svarbu tinkamas ir optimalus požymių parinkimas ir klasifikatoriaus apmokymas, siekiant išvengti per didelio specifiškumo ir prisitaikymo prie konkrečios duomenų imties.

Fraktalų klasifikatoriai siekia 90 proc. klasifikavimo tiksluma, tačiau jie atskiria tik keletą nežymių patologijų, pavyzdžiui Friedreich'o ataksiją [76].

Best-basis wavelet klasifikatorių tikslumas siekia 85 proc., tačiau jų sudė-tingumas riboja platų panaudojimą kasdieniniame darbe [2].

Atraminių mašinų vektorių klasifikatoriai turi nemažai privalumų prieš kitus metodus, leidžiančių pasiekti beveik 100 proc. klasifikavimo tikslumą [37, 93, 107]:

1. Pagrindinis yra mokymasis. Gerai apmokytas klasifikatorius gali pa-siekti gerus rezultatus, net ir esant klaidingoms ar nepilnoms įėjimo

(17)

reikšmėms (pradiniams parametrams). Pavyzdžiui, klasifikatorius iš-mokytas atpažinti veidus, sugeba tai atlikti iš fotografijų padarytų skirtingose sąlygose: esant blogam apšvietimui, skirtingais rakursais ir t.t.

2. Klaidos tolerancija. Tradicinės kompiuterinės sistemos labai jautrios klaidoms. Bet kuri sistemos klaida sukelia sistemos sustojimą arba gaunami klaidingi galutiniai rezultatai. AVM nėra tokie jautrūs klai-doms kaip kitos kompiuterinės sistemos ir veikia, net esant keleto neuronų pakenkimui.

3. Adaptacija. AVM gali mokytis ir prisitaikyti prie kintančių aplinkos sąlygų be pakartotinio mokymo.

4. Hipotezių nebuvimas. AVM duomenims nekelia jokių hipotezių, todėl bet kokios rūšies duomenis ir signalus galima naudoti kaip įėjimo reikšmes.

Be šių privalumų, AVM turi keletą trūkumų [59, 128]:

1. Negalėjimas gauti tikslių rezultatų. Kartais AVM duoda nepaaiški-namus ir netikslius rezultatus. Yra situacijų, kada AVM negalima apmokyti.

2. Aiškumo trūkumas. Statistinės programos apskaičiuoja suprantamus ir interpretuojamus parametrus tam tikram uždaviniui spręsti. Tuo tarpu AVM svoriai nėra interpretuotini. Daugeliu atveju AVM modelis išlieka „juodąja dėže“.

Gerklų ligų klasifikavimas paplito pastaruoju metu dėl savo neinvazy-vumo ir automatizmo. Minėti privalumai leidžia registruoti ir analizuoti telefono pagalba perteiktą balsą. Dibazar [26] klasifikavimui naudodamas paslėptus Markovo modelius ir 700 tiriamųjų imtį, gavo 99,44 proc. tikslu-mą klasifikuojant į sveiką ir nesveiką balsą iš tęstinės balsės „A“ įrašo. Šiame eksperimente buvo naudotas laiko – dažnio transformacijos algorit-mas, kuris akustinį signalą išskaido į didžiausią tonų aukštį, vidutinį tono aukštį, jų energijos santykį. Klasifikavimo užduočiai spręsti galima naudoti statistinius metodus [113]. Klasifikavimui naudojant 51 sveiko balso ir 161 patologinio balso įrašus, gautas 93,4 proc. klasifikavimo tikslumas skriant į dvi klases. Liliana ir bendraautoriai [65] pasinaudojo paslėptais Markovo modeliais, siekdami atskirti sveiką balsą nuo sergančiojo balso klosčių vėžiu balso. Naudojant tęstinės balsės „A“ įrašus, klasifikavimo tikslumas patologinei klasei buvo 88,7 proc., sveikąjai klasei – 92,8 proc. Sprendžiant tą pačią užduotį [116], klasifikavimui naudojant Dr.Speech programą registruotus nuo laiko priklausomus akustinio balso siganlo parametrus, klasifikavimo tikslumas buvo 79,13 proc. Nuo laiko priklausomų parametrų

(18)

klasifikavimo tikslumą padidino atitinkamai iki 80,32 ir 80,47 proc. Moran su bendraautoriais [71] panaudojo tiesinį klasifikatorių siekdami atskirti sveiką ir patologinį balsą, naudodami telefonu perteiktus balso įrašus. Klasifikavimo tikslumas, naudojant tylioje aplinkoje atliktus balso įrašus siekė 89,1 proc., to tarpu naudojant „telefoninį“ balsą, klasifikacijos tikslumas sumažėjo iki 74,2 proc.

Devynioliktame amžiuje Garcia ir Turck pirmą kartą aprašė metodą, kai panaudoję saulės šviesą ir rankoje laikomą veidrodėlį, apžiūrėjo gerklas. Nuo to laiko prasidėjo laringoskopijos era. Didelis žingsnis gerklų ligų diag-nostikoje žengtas 1950, kai Hopkins pirmą kartą klinikinėje praktikoje panau-dojo lankstų endoskopą. Po dvidešimties metų von Stucard pristatė 90° didinantį laringoskopą, skirtą gerklų vaizdų registravimui [49]. Nuo tada tapo galima ne tik kaupti ir saugoti gerklų vaizdus, bet ir juos analizuoti. Nepaisant ilgo laikotarpio, nuo laringoskopo pritaikymo klinikinėje praktikoje registruo-jant gerklų vaizdus, didelių pasiekimų automatinėje gerklų diagnostikos sri-tyje iki šiol nėra pasiekta. Pirmieji bandymai analizuoti mikrolaringo-skopinius vaizdus, tapo galimi, kad septintąjame praeito amžiaus dešimtme-tyje Haralick pristatė co-occurence matricas pilkos spalvos tekstūros analizei [40]. Vėlesniame laikotarpyje co-occurence matricos pritaikytos ir spalvotų vaizdų analizei [43, 75] bei yra vienos iš dažniausiai naudojamų instrumentų vaizdų analizėje. Nepaisant spartaus diagnostinių priemonių ir vaizdų analizės sistemų vystymosi, darbų, kuriuose būtų sprendžiama mikrolaringoskopinių vaizdų klasifikavimo problema yra labai mažai.

Ilgner su bendraautoriais [49] pristė automatinę gerklų ligų klasifikavimo sistemą, kuri laringoskopinius vaizdus skirstė į sveikąja ir patologines klases. Klasifikavimo sistema paremta tekstūros požymiais, gaunamais iš rankiniu būdu pažymėtų mikrolaringoskopinių vaizdų plotų. Naudojant labai mažą – 35 vaizdų imtį ir co-occurence matricas, vaizdų analizei, gautas 81,4 proc. tikslumas. Ankstesniuose KMU ir KTU mokslininkų atliktouse ekspermentuose [119, 121], kai buvo naudojamas ženkliai dides-nis mikrolaringoskopinių vaizdų skaičius – 785, klasifikavimo tikslumas viršijo 94 proc., klasifikuojant mikrolaringoskopinius vaizdus į sveikąją ir dvi patologines klases – mazginio ir difuzinio pažeidimo. Tuos pačius mikrolaringoskopinius vaizdus klasifikuojant į septynias klases – sveikąją ir šešias patologines, gautas didesnis nei 80 proc. tikslumas [118]. Mikrolarin-goskopinių vaizdų klasifikavimui į tris klases – sveikąją, mazginio ir difuzinio pažeidimo – naudojant daugiasluoksnių perceptronų komitetus [117, 119] teisingo klasifikavimo dažnis siekia virš 90 proc.

Vienas iš pagrindinių šiuolaikinės laringoskopijos trūkumų, užkertančių kelią platesnei vaizdų analizei, yra patikimų instrumentų, galinčių suvienodinti gautus laringoskopinius vaizdus ir taip užtikrinti jų analizės

(19)

vienodumą, nebuvimas. Tokiu būdu ilgam gali išlikti atotrūkis tarp besi-vystančių vaizdinių priemonių ir klinikinio jų interpretavimo, kuris iki šių dienų remiasi labai subjektyviais kriterijais.

Medicinos sritis, kurioje automatinė vaizdų analizė rado ženkliai didesnį pritaikymą nei laringologijoje yra radiologija. Atlikta nemažai studijų kurių tikslas aptikti patologinius pokyčius tyrimams naudojant radiologinius metodus. Rangayyan ir Ayres [84] pateikia studiją, kurios metu buvo bando-ma atskirti norbando-malios struktūros liaukinį audinį nuo patologinio audinio naudojant mamografijos metu atliktas nuotraukas. Eksperimente panaudotos 19 mamogramų bei apskaičiuotas metodo jautrumas (76,5 proc.) ir specifiš-kumas (76,4 proc.) skiriant patologinius audinius nuo sveikų. Minėtiems pakitimams atskirti naudotas Gabor‘o filtrai. Šie filtrai plačiai nadojami sprendžiant įvairius vaizdo atpažinimo ir apdorojimo uždavinius: vaizdo tekstūros klasifikavimas, segmentavimas ir sintezė, greitas ir tikslus objektų atpažinimas ir sekimas [51, 69], o pastaruoju metu ypač plačiai pritaikyti rainelės [15] ir veido [125, 133, 135] atpažinimo protokoluose.

Apibendrinant mokslinės literatūros apžvalgą, galima teigti, kad eilėje darbų yra pateikiami gana geri automatinės balso kategorizacijos į dvi klases (sveikas – nesveikas balsas) rezultatai, tačiau iki šiol nebuvo darbų, skirtų automatinei balso kategorizacijai daugiau nei į dvi klases. Lietuvos moksli-ninkų pasiekti geri mikrolaringoskopinių vaizdų automatinio kategoriza-vimo rezultatai sudaro prielaidas sukurtų metodų tobulinimui. Mokslinėje literatūroje iki šiol nebuvo duomenų apie skirtingų rūšių (vaizdinės, balso signalo, klinikinių duomenų) informacijos apjungimą, kuriant automatinę gerklų ligų kategorizavimo sistemą. Minėtų mokslinių problemų sprendimų paieška ir sudaro šio mokslinio darbo tikslą.

(20)

3. TIRIAMŲJŲ KONTINGENTAS

Viso šiame darbe analizuota 148 kontrolinės grupės asmenų ir 515 pacientų, sergančių organinėmis gerklų ligomis, anketiniai duomenys ir akustiniai balso bei mikrolaringoskopinių vaizdų parametrai. Priklausomai nuo tyrimo uždavinių, tiriamieji sudarė keletą imčių. Imties tūris parinktas toks, kad tikrinant statistines hipotezes apie skirtumus tarp parametrų reikšmių, esant I rūšies klaidai α=0,05, kriterijaus galingumas viršytų 0,8 (II rūšies klaida β≤0,2).

Atliekant automatinės organinių gerklų ligų kategorizacijos sistemos kūrimo darbus panaudoti 30 kontrolinės grupės asmenų ir 289 pacientų duomenys.

Kontrolinę grupę sudarė 30 tiriamųjų: 19 vyrų (63,3 proc.) ir 11 moterų (36,7 proc.) nuo 18 iki 39 metų amžiaus (vidurkis 24,5±6,3 metų). Į kontrolinę grupę įtraukti atsitiktinai parinkti asmenys, nesirgę lėtinėmis gerklų ligomis, neturėję balso sutrikimų, dėl balso nesikreipę į gydytoją ir nesigydę bei savo balsą vertinantys sveiku. Įvertinus šių asmenų balsą klausą, apžiūrėjus gerklas veidrodėliu ir po to atlikus tiesioginę laringosko-piją – patologinių pokyčių nenustatyta. Kontrolinės asmenų grupės pasi-skirstymas pagal išsilavinimą pavaizduotas 3.1 paveiksle.

54 proc. 3 proc. 13 proc. 10 proc. 20 proc. Aukštasis Aukštesnysis Profesinis Vidurinis Nebaigtas vidurinis

3.1 pav. Kontrolinės grupės asmenų pasiskirstymas pagal išsilavinimą. Iš paveikslo matome, kad didžiosios dalies kontrolinės grupės asmenų išsilavinimas yra vidurinis. Tą galima paaiškinti jaunu šios grupės asmenų amžiumi, kurio vidurkis yra 24,5±6,3 metų.

Į tyrimą įtraukti pacientai, kurie dėl balso užkimino ir nustatyto organinio gerklų pažeidimo buvo gydyti KMU Ausų, nosies ir gerklės ligų klinikoje nuo 2005 iki 2008 metų. Įtraukimo kriterijai:

• amžius – 18–70 metų,

(21)

ope-racinės medžiagos, nustatyta viena iš šių ligų: balso klosčių mazgeliai, polipai, cista, papilomatozė, Reinke–Hajek‘o liga, keratozė ir gerklų karcinoma,

• nebuvę ryklės ar gerklų gleivinės mechaninio (operacijų su endotrachėjine nejautra, gerklų trauma) ar cheminio pažeidimo,

• nesirgę viršutinių kvėpavimo takų peršalimo ligomis, sinusitu ar tonzilitu vieno mėnesio laikotarpiu,

• nesergantys gretutinėmis ligomis (širdies ir kraujagyslių sistemos, plaučių, depresija), galinčiomis įtakoti balsą,

• nevartojantys medikamentų, sukeliančių centrinės nervų sistemos slopinimą.

Pagal balso klosčių pažeidimo pobūdį pacientų klasė suskirstyta į dvi klases: riboto ir dufuzinio pažeidimo. Mazginio pažeidimo klasei klasei priskirti 191 pacientas, o difuzinio pažeidimo klasei – 98 pacientai. Pacientų pasiskirstymas kiekvienoje klasėje pavaizduotas 3.2 ir 3.3 paveiksluose.

70 proc. 7 proc. 23 proc. BK mazgeliai BK polipas BK cista

3.2 pav. Pacientų pasiskirstymas pagal ligas mazginio pažeidimo klasėje

19proc.

33 proc.

16 proc. 32 proc.

Karcinoma Reinke- Hajek liga Keratozė

Papilomatozė

3.3 pav. Pacientų pasiskirstymas pagal ligas difuzinio pažeidimo klasėje

(22)

Riboto pažeidimo klasėje amžiaus vidurkis buvo 50 (SD ± 11,3) metų, o difuzinio pažeidimo – 59,5 (SD ± 6,4) metų. Pacientų pasiskirstymas pagal amžių ir lytį abiejose klasėse pateiktas lentelėje 3.1.

3.1 lentelė. Pacientų, priklausančių mazginio ir difuzinio pažeidimo klasėms pasiskirstymas pagal amžių ir lytį.

Vyrai Moterys Klasė

N Vidutinis amžius SD N Vidutinis amžius SD

Mazginė 73 32,5 20,5 118 46,5 16,3 Difuzinė 63 58,5 7,8 35 53 1,4

Abiejų patologinių klasių pacientų pasiskirstymas pagal išsilavinimą pateiktas 3.4 ir 3.5 paveiksluose. 13 proc. 17 proc. 29 proc. 6 proc. 35 proc. Aukštasis Aukštesnysis Profesinis Vidurinis Nebaigtas vidurinis

3.4 pav. Pacientų pasiskirstymas pagal išsilavinimą riboto pažeidimo klasėje.

14 proc. 15 proc. 12 proc. 40 proc. 19 proc. Aukštasis Aukštesnysis Profesinis Vidurinis Nebaigtas vidurinis

3.5 pav. Pacientų pasiskirstymas pagal išsilavinimą difuzinio pažeidimo klasėje.

(23)

Apibendrinant galima pasakyti, kad mazginio pažeidimo klasėje vyravo jaunesni bei aukštąjį ir aukštesnįjį išsilavinimą turintys pacientai, tuo tarpu difuzinio pažeidimo klasėje vyravo vyresnio amžiaus bei profesinį ir vidurinį išsilavinimą turintys pacientai.

Atlikus statistinę analizę, nustatyta, kad tiriamųjų pasiskirstymas grupėse pagal amžių ir lytį nėra homogeniškas. Tai galima paaiškinti, kad į kontro-linę grupę įtraukti sveiki asmenys, kuriems buvo atlikta tiesioginė laringo-skopija, kuri dėl etinių ir techninių priežasčių neleido surinkti didesnio tiriamųjų skaičiaus. Šis darbas buvo atliekamas kartu su Eureka E!3681 „INFOLARYNX“ ir COST Veikla 2103 „Pažangaus balso funkcijos vertini-mas“ programomis, kurių metu analizuoti mikrolaringoskopinių vaizdų ir akustinių balso signalų pokyčiai. Siekiant suvienodinti tiriamųjų grupes pagal amžių ir lytį, pasitelkti archyviniai duomenys mikrolaringoskopinių vaizdų ir akustinių balso parametrų kategorizavimui.

Kategorizuojant akustinius balso parametrus, panaudota 148 asmenų imtis, kurią sudarė 69 kontrolinės klasės atstovai ir 79 pacientai priskirti patologinei klasei. Tiriamųjų pasiskirstymas pagal amžių ir lytį klasėse pateiktas 3.2 lentelėje.

3.2 lentelė. Pacientų, priklausančių kontrolinei, mazginio ir difuzinio pažei-dimo klasėms pasiskirstymas pagal amžių ir lytį, kategorizuojant akustinius balso parametrus..

Vyrai/moterys Amžius Grupės

N Proc. Vidurkis Ribos SD

Kontrolinė gr. N=69 28/41 40,6/59,4 36,9 18–65 11,5 Difuzinio pažeidimo gr. N=49 22/27 44,9/55,1 42,6 18–70 20,3 Mazginio pažeidimo gr N=30 13/17 43,3/56,7 33,9 22–65 19,5

p >0,05

Iš pateiktos lentelės matome, kad grupės yra homogeniškos, nesiskiria pagal amžių ir lyti bei gali būti vertinamos tarpusavyje.

Kategorizuojant mikrolaringoskopinius vaizdus, panaudota 196 asmenų imtis, kurią sudarė 49 kontrolinės klasės atstovai ir 147 pacientai priskirti patologinei klasei. Tiriamųjų pasiskirstymas pagal amžių ir lytį klasėse pateiktas 3.3 lentelėje.

(24)

3.3 lentelė. Pacientų, priklausančių kontrolinei, mazginio ir difuzinio pažei-dimo klasėms pasiskirstymas pagal amžių ir lytį, kategorizuojant mikrola-ringoskopinius vaizdus.

Vyrai/moterys Amžius Grupės

N Proc. Vidurkis Ribos SD

Kontrolinė gr. N=49 21/28 42,8/51,2 36,9 18-65 11,5 Difuzinio pažeidimo gr. N=66 36/30 54,5/45,5 42,6 18-70 20,3 Mazginio pažeidimo gr N=81 43/38 53,1/46,9 33,9 22-65 19,5

p >0.05

Iš pateiktos lentelės matome, kad grupės yra homogeniškos, nesiskiria pagal amžių ir lyti bei gali būti vertinamos tarpusavyje.

(25)

4. TYRIMO METODAI

4.1 Organinių gerklų ligų kategorizacija

Į šio darbo pacientų grupę įtraukti asmenys sergantys organinėmis gerklų ligomis: balso klosčių mazgeliais, polipais, cistomis, papilomatoze, Reinkės– Hajek‘o liga, keratoze ir gerklų karcinoma.

Pirmame etape skirstėme į sveiką (kontrolinė grupė)ir patologinę klases. Tolesniame etape patologinę grupę įvertinus anatominius, apžiūros ir histologinius visų ligų skirtumus ir panašumus bei siekiant sumažinti klaidos tikimybę kategorizuojant organines gerklų ligas, nuspręsta suskirs-tyti į dvi klases: riboto ir difuzinio pažeidimo. Riboto pažeidimo klasei pri-skirta balso klosčių mazgeliai, polipai ir cistos – aiškiomis ribomis, lygiu paviršiumi, dažniausiai vinepusiai, nesukeliantys histologinės struktūros pakitimų, neplintantys į aplinkinius audinius, riboti – neapimantys daugiau nei vieno balso klostės ilgio pakitimai. Histologiškai patologiniai pokyčiai visais atvejais matomi gleivinėje ar pogleiviniame sluoksnyje. Difuzinio pažeidimo klasei priskirta: papilomatozė, Reinkės–Hajek‘o liga, keratozė ir gerklų karcinoma. Tai be aiškių matomų ribų, sukeliantys aplinkinių audinių uždegiminė reakciją [27, 80], nelygiu, grublėtu paviršiumi, galintys plisti už balso klosčių ribų, o navikinio proceso atveju ir į gilesnius gerklų sluoks-nius, neretai sukeliantys histologinius pokyčius balso klosčių pažeidimai. Pirminė organinių gerklų ligų kategorizacija atlikta tiesioginės mikro-laringoskopijos metu, naudojant operacinį mikroskopą [120], o galutinė kategorizacija atlikta gavus histologinius, pašalintų patologinių audinių tyrimus. Visi histologiniai tyrimai ir čia pateikti vaizdai atlikti KMU Patologinės anatomijos klinikoje.

Mazgeliai – abipusiai, simetriški, du, vienas prieš kitą esantys nedideli (kelių mm) dariniai. Atsiranda dėl per stiprios ar per ilgos balso klosčių trinties, netaisyklingai naudojant balsą. Vystosi viršutiniame balso klosčių trečdalyje, nes čia stipriausia balso klosčių susiglaudimo jėga. Ilgalaikės balso klosčių trinties metu pogleiviniame tarpe pradeda kauptis skystis, ku-ris sukelia pogleivinio (Reinkės) tarpo uždegimą, be kraujosrūvų (anksty-vieji mazgeliai). Tolesnis netaisyklingas balso vartojimas skatina Reinkės tarpo hialinizaciją ir uždegimo vietą dengenčios balso klostės gleivinės sustorėjimą. Dėl minėtų pakitimų mazgelių spalva yra pilkšva, panaši į bal-so klostės spalvą, forma plokščia, paviršius lygus. Ribos tarp mazgelių ir sveikos balso klotės aiškios. Balso klosčių mazgeliai pakeičia gleivinės masę, sumažina galimybę suplonėti laisvajam balso klostės kraštui bei

(26)

nelei-pakitimus [9]. Paveiksluose (4.1.1–4.1.2 pav.) pateikti balso klosčių maz-gelių mikrolaringoskopiniai ir histologiniai vaizdai.

4.1.1 pav. Balso klosčių mazgelių mikrolaringoskopinis vaizdas.

4.1.2 pav. Balso klosčių mazgelio histologinio preparato mikroskopinis vaizdas: daugiasluoksniu epiteliu padengtas purusis jungiamasis audinys,

bazinė linija sustorėjusi. Dažymas H+E, padidinimas 4×.

Polipas – dažniausiai ant vienos balso klotės susiformavęs darinys. Netai-syklingai: per stipriai ir per ilgai naudojant balsą, trinties jėgos veikia glei-vinės kapiliarus bei sukelia jų plyšimą. Plyšus kapiliarams susiformuoja plonas, plačiu pagrindu paviršutinis nubrozdinimas be ryškesnės kontūro deformacijos, kuris gali savaime rezorbuotis per dvi savaites. Tolesnis krau-javimas iš pažeistų kapiliarų, skatina hematomos susiformavimą, kuri kie-tina virš juosiančią gleivinę bei deformuoja balso klostės kontūrą. Organi-zuojantis krešuliui, į jį įauga gerai vaskuliarizuota stroma su išreikšta aplin-kine hialinizacija [14]. To pasekoje polipai dažniausia būna rausvos-raudo-nos spalvos, ovalios formos, lygiu paviršiumi. Pagrindas dažniausiai lygus. Dydis nuo kelių milimetrų iki per visą balso klostės ilgį. Gali uždengti gerklų spindį. Balso klostės dažniausiai nepakitę – įprastinės balkšvos,

(27)

per-lamutrinės spalvos, lygios. Riba tarp polipo ir sveikos balso klostės aiški. Žemiau esančiuose paveiksluose (4.1.3–4.1.4 pav.) pateikti balso klosčių polipo mikrolaringoskopiniai ir histologiniai vaizdai.

4.1.3 pav. Balso klosčių polipo mikrolaringoskopinis vaizdas.

4.1.4 pav. Balso klosčių polipo histologinio preparato mikroskopinis vaizdas: daugiasluoksniu epiteliu padengtas purusis jungiamasis audinys su gausiais, išsiplėtusiais kraujo indais. Dažymas H+E, padidinimas 4×.

Cista – vienpusis ovalios ar šeivos formos darinys, augantis iš balso klos-tės gilumos. Histologiškai intrakordinės cistos klasifikuojamos į mukozines (cistos vidus užpildytas gleivėmis) ir epidermoidines. Mukozinės retencinės cistos atsiranda užsikimšus liaukos latakėliui ir toliau tęsiantis sekrecijai, tuo tarpu epidermoidinių cistų viduje kaupiasi keratino masės [11, 12, 14, 70]. Dvi terorijos aiškina epidermoidinių cistų susidarymą: pirmoji – dalis epitelinių ląstelių panyra į pogleivinį sluoksnį gerklų vystymosi metu – taip paaiškinama įgimtų cistų susiformavimas. Antroji teorija teigia, kad netai-syklingai naudojant balsą atsiranda epitelinio sluoksnio mikroįtrūkimai, o

(28)

būna lygus, spalva nuo pilkšvai rausvos iki gelsvos (dėl per sienelę pra-sišviečiančio cistos turinio). Ribos tarp cistos ir sveikų audinių gana aiškios. Balso klostės audiniai nepakitę (normalūs). Žemiau esančiuose (4.1.5–4.1.6 pav.) paveiksluose pateikti balso klosčių cistos mikrolaringoskopiniai ir histologiniai vaizdai.

4.1.5 pav. Balso klostės cistos mikrolaringoskopinis vaizdas.

4.1.6 pav. Balso klostės cistos histologinio preparato mikroskopinisvaizdas: pogleivyje rastas cistinis darinys, išklotas daugiasluoksniu plokščiuoju epiteliu, užpildytas amorfinėmis masėmis. Dažymas H+E, padidinimas 4×.

Gerklų papilomos – dažniausiai išplitęs darinys, sudarytas iš daugybinių konglomeratų, išsidėsčiusių be jokių dėsningumų, apimantis abi balso klostes ir kitas gerklų dalis. Gerklų papilomatozę sukelia žmogaus pailomos virusas, kuris priklauso Papovaviridae šeimai. Histologiškai tai daugybinės, į pirštus panašios, gleivinės proliferacijos, kurių viduje yra fibrovaskuliarinė šerdis, padengta dengiamuoju (stratified) plokščiuoju epiteliu [1]. Mažos, mikroskopinės papilomos panašios į paviršiumi plintantį, švelnų (kai kurių autorių nuomone – aksominį) pažeidimą. Makroskopinių papilomų, pasireiš-kus sparčiam egzofitiniam augimui, paviršius nelygus, smulkiai grublėtas ar

(29)

skiltėtas, primenantis kalafiorą ar avietę. Spalva nuo pilkšvai rausvos iki rausvos. Darinio ir sveikų audinių ribos dažnai neaiškios. Žemiau esan-čiuose (4.1.7–4.1.8 pav.) paveiksluose pateikti balso klosčių papilomatozės mikrolaringoskopiniai ir histologiniai vaizdai.

4.1.7 pav. Balso klosčių papilomatozės mikrolaringoskopinis vaizdas.

4.1.8 pav. Balso klosčių papilomatozės histologinio preparato mikro-skopinis vaizdas: hiperplastišku, daugiasluoksniu, plokščiuoju epiteliu, su

pavieniais koilocitais, padengti daugybiniai, ploni, gerai vaskuliarizuoti jungiamojo audinio stiebeliai. Dažymas H+E, padidinimas 10×. Reinkės–Hajek‘o liga – abipusė balso klsočių polipozinė degeneracija. Rūkymas, gastroezofaginio refliukso liga (GERL) ir didelis balso krūvis – pagrindiniai veiksniai šiai ligai vystyti. Taip pat yra nustatytas ir indi-vidualus polinkis šiai ligai vystytis – tik nedidelei daliai žmonių, turinčiai rizikos faktorius, išsivysto balso klosčių degeneracija. Ilgalaikis rūkymas ir netaisyklingas balso vartojimas skatina pogleivio edemą, skysčio kaupimąsi ir veninę stazę [56, 63]. Šie pakitimai sukelia lėtinę, nepraeinančią balso

(30)

skysčio maišelius, kurie prisitvirtinę prie viršutinių ir laisvųjų balso klosčių kraštų. Aiški riba tarp pakitusių ir sveikų audinių matoma ne visada. Žemiau esančiuose (4.1.9 pav.) paveiksluose pateikti balso klosčių polipozinės degeneracijos mikrolaringoskopiniai vaizdai.

4.1.9 pav. Balso klosčių polipozinės degeneracijos mikrolaringoskopiniai vaizdai.

Keratozė – vienpusis (rečiau abipusis) paviršinis darinys – balkšvos spal-vos, netaisyklingos formos, grublėtu paviršiumi, galintis plisti už balso klostės ribų. Histologiškai tai mitoziškai aktyvios, blogai subrendusios, iš-laikiusios branduolinę struktūrą ląstelės su dideliu keratino pertekliumi [25]. Atipinės ląstelės neardo bazinės membranos ir neprasiskverbia į gilesnius pogleivio sluoksnius. Aplinkiniai audiniai (balso klostės) paraudę. Ribos tarp keratozės ir sveikų audinių neaiškios. Gali priminti varškės apnašą ar nešvarų sniegą rausvame balso klostės uždegimo fone. Gali būti bet kurioje balso klostės vietoje [23, 31, 34]. Balso klosčių keratozės mikrolaringosko-piniai ir histologiniai vaizdai pateikti 4.1.10 ir 4.1.11. pav.

(31)

4.1.11 pav. Balso klostės keratozės histologinio preparato mikroskopinis vaizdas: hiperplastišku, hiperkeratotišku, daugiasluoksniu plokščiuoju epiteliu padengti gerklų fragmentai, su vidutiniškai išreikšta limfocitine

infiltracija pogleivyje. Dažymas H+E, padidinimas 4×.

Gerklų vėžys – grublėtas, nelygiu paviršiumi, egzofitiškai ar endofitiškai augantis darinys. Histologiniu požiūriu nežymiai skiriasi nuo pakitusių ląstelių keratozės metu, tačiau navikinės ląstelės suardo bazinę membraną ir invaziškai plinta į aplinkines struktūras [86]. Naviko paviršiaus grublėtumas stambokas, chaotiškas. Paviršiaus spalva nešvariai pilkšva su baltais (ragė-jimas) ir gelsvais (išopė(ragė-jimas) ploteliais. Ribos tarp darinio ir sveikų balso klotės audinių dažniausiai neaiškios. Darinio forma netaisyklinga. Procesas dažniausiai vienpusis, nėra aiškios ribos tarp navikinių masių ir aplinkinių sveikų audinių [81]. Balso klosčių vėžio mikrolaringoskopiniai ir histolo-giniai vaizdai pateikti 4.1.10 ir 4.1.11 pav.

(32)

4.1.13 pav. Balso klosčių vėžio histologinio preparato mikroskopinis vaizdas: infiltratyviai augantis navikas, formuojamas solidiškai besidėstančių atipinių plokščio epitelio ląstelių, gausūs ragėjimo židiniai.

Dažymas H+E, padidinimas 4×.

4.2. Anketiniai pacientų duomenų rinkimas ir apdorojimas Darbe panaudotas originalus klausimynas iš keturiolikos punktų, kurie at-spindi paciento anketinius duomenis ir subjektyvų balso vertinimą:

1. Paciento amžius (metais) 2. Užkimimo laikas (mėnesiais) 3. Išsilavinimas (penki lygiai)

4. Vidutinė intensyvaus balso naudojimo trukmė (valandos per dieną) 5. Intensyvaus kalbėjimo dienų skaičius (dienos per savaitę)

6. Rūkymas (taip/ne)

7. Surūkytų cigarečių kiekis per dieną 8. Rūkymo trukmė (metais)

9. Subjektyvus paciento balso įvertinimas vaizdinio atitikmens skalėje B-VAS (0–100 balų)

10. Ilgiausia fonacijos trukmė – IFT (sekundėmis, norma vyrams nuo 20 iki 34 s, moterims – nuo 14 iki 26 s [82,92])

11. Funkcinė balso neįgalumo indekso skalė (0–40) 12. Emocinė balso neįgalumo indekso skalė (0–40) 13. Fizinė balso neįgalumo indekso skalė (0–40) 14. Balso neįgalumo indeksas – BNI (0–120)

Anketinius duomenis sudarė paciento amžius metais, išsilavinimas, kal-bos vartojimo intensyvumas ir rūkymas. Subjektyvų balso vertinimą sudarė B-VAS, IFT, BNI, funkcinė, emocinė ir fizinė BNI skalės.

(33)

Tiriamųjų išsilavinimas suskirstytas į penkias klases: 1 – Aukštasis išsila-vinimas, 2 – Aukštesnysis išsilaišsila-vinimas, 3 – Profesinis, 4 – Vidurinis, 5 – Nebaigtas vidurinis.

Kalbos vartojimo intensyvumas vertintas dviem aspektais: intensyvus kalbos naudojimas dienos metu ir savaitės bėgyje. Intensyvus kalbos naudo-jimas dienos metu matuotas valandomis ir nusako kiek laiko per dieną tiriamasis intensyviai kalbėdavo. Intensyvumas savaitės bėgyje matuotas dienomis, t.y. kiek dienų per savaitę tiriamasis intensyviai kalbėjo anksčiau nurodytą valandų skaičių. Literatūros duomenimis ilgas ir neteisingas kalbos naudojimas skatina formuotis balso klosčių mazgelius ir polipus [7, 8], ligas kurios priskirtos riboto pažeidimo klasei.

Rūkymas vertintas dviem balais: 0 – nerūko ir 1 – rūko. Rūkantys pacien-tai toliau turėjo nurodyti rūkymo intensyvumą – surūkytų cigarečių kiekį per dieną bei tokio rūkymo intensyvumo trukmę metais. Daugelis autorių neabejotinai įrodo rūkymo įtaką Reinke-Hajek’o ligos patogenezėje bei gerklų vėžio išsivystymui [4, 39, 60, 87, 108], kurios priskirtos difuzinio pa-žeidimo klasei. Gerklų karcinomos sergamumo dažnis tarp nerūkančiųjų yra 0,6 iš 100 tūkstančių gyventojų, tuo tarpu tarp rūkančiųjų dažnis ženkliai iš-auga iki 15/100 tūkstančių gyventojų [100].

Balsas vertintas nustatant ilgiausią fonacijos trukmę [82, 92], tiriamajam pažymint balso sutrikimo lygį vaizdinio atitikmens skalėje [79] ir apskai-čiuojant balso neįgalumo indeksą [50].

Ilgiausias fonacijos trukmė registruota chronometru. Tyrimo metu tiria-mojo buvo prašoma maksimaliai giliai ikvėpti ir sau patogiu/įprastu balso aukščiu ir stiprumu, maksimaliai ilgai tęsti balsę “A”. Tyrimas kartotas tris kartus. Apskaičiuotas užregistruoto laiko vidurkis sekundėmis nusako ilgiausią fonacijos trukmę [78, 94].

Paciento suvokiamam balso pažeidimo dydžiui nustatyti ir vertinti panaudota vaizdinio atitikmens skalė [79]. Tai dešimties centimetrų atkarpa, kurioje nulis reiškė labai blogą balsą, o šimtas – gerą, t.y. nepakitusį balsą. Vienas skalės milimetras atitiko vieną balą. Paaiškinus tyrimo metodiką, tiriamasis atkarpoje pažymėdavo savo balso kokybės lygį. Liniuote išma-tuotas atstumas nuo nulio iki pažymėtos vietos atitiko tiriamojo balso pažaidos kiekybinį įvertinimą (4.2.1 pav.).

(34)

4.2.1 pav. Balso kokybės vertinimas vaizdinio atitikmens skale. Pavaizduota balso pažaida atitinka 70 balų.

Paciento juntama negalia, atsiradusi dėl balso pakenkimo, atspindinti jo sugebėjimą naudotis balsu įprastinėse kasdieninėse ir su darbu susijusiose situacijose, tirta nustatant G. Jacobson pasiūlytą Balso neįgalumo indeksą [50]. Balso neįgalumo indeksas apskaičiuotas tiriamąjam atsakius į atskiros anketos 30 klausimų. Pagal savo pobūdį anketos klausimai suskirstyti į tris skales: funkcinę, emocinę ir fizinę. Funkcinės skalės klausimai skirti nusta-tyti balso kokybės pakitimus, priklausančius nuo funkcinių balso sutrikimų; emocinės skalės – nuo emocinių sutrikimų; fizinės skalės – nuo balsinio aparato fizinių savybių pakitimo. Atsakinėdamas į klausimus, tiriamasis pa-žymėdavo vieną iš penkių jam labiausiai tinkančių atsakymų: nuo 0 – nie-kada iki 4 – visada. Gautos reikšmės sudėtos kiekvienoje skalėje. Anketoje vertinta kiekvienos iš trijų skalių balų suma ir bendra, trijų skalių, balų suma, kuri parodo balso neįgalumo indeksą. Tokiu būdu, didžiausia balso neįgalumo indekso vertė yra 120, o mažiausia – 0. Naudojant balso neįgalu-mo indeksą nustatyti skirtumai tarp kai kuriomis gerklų ligomis sergančių pacientų grupių [111].

4.3. Akustinių balso parametrų registravimas.

Tiriamųjų balso analizei panaudota akustinė balso ir kalbos analizė bei fonetograma.

Akustinė balso analizė atlikta iš balso įrašų, kurie buvo registruoti „tylos kambaryje“ – nuo garso izoliuotoje, 2,5×1,5 metro patalpoje. Kiekvienas ti-riamasis buvo prašomas po tris kartus, ne trumpiau kaip tris sekundes, tęsti balsę „A“, sau įprastu balso aukščiu ir garsumu. Balso įrašų registravimui panaudotas Sony MiniDisc MDS-101 garso įrašytuvas ir D60S Dynamic Vocal (AKG Acoustics) mikrofonas. Balso įrašų metu tiriamasis mikrofoną laikydavo komfortabiliu, maždaug 5,0 centimetrų, nuo burnos atstumu. Akustinė balso analizė atlikta naudojant personalinį kompiuterį su įdiegta Tiger Electronics Dr. Speech (Voice Assesment, Version 3,0) programine įranga [82]. Balso įrašai išsaugoti „wav“ formate, 44100 hercų dažniu, kiekvienam dažniui skiriant 16 bitų atminties. Vidutinė įrašų trukmė yra 2,4 sekundės. Panaudojant programinę įrangą iškirpta kiekvieno balso įrašo

Labai blogas Geras, nepakitęs

7,0 cm

(35)

pradžia ir pabaiga, taip siekiant sumažinti fonacijos pradžios ir pabaigos akustinius fenomenus bei iškraipymus. Tokiu būdu gauti vidutiniškai 2,0 sekundžių trukmės balso įrašai. Visi trys balso įrašai analizuoti atskirai. Programinės įrangos darbalaukiai ir akustinio balso signalo parametrai pavaizduoti žemiau esančiame paveiksle (4.3.1 pav).

4.3.1 pav. Programinės įrangos, skirtos tęstinės balsės „A“ analizei pavyzdys.

Iš šešiolikos balso parametrų, nustatytų akustinės analizės metu, šiame darbe panaudoti keturi mūsų kasdieninėje praktikoje dažniausiai naudojami ir informatyviausi parametrai [109] bei harmonikų ir triukšmų santykis – li-teratūroje nurodomas kaip vienas informatyviausių parametrų [127, 132]:

1. pagrindinio tono neperiodiškumas – jitter (proc.) 2. amplitudės neperiodiškumas – shimmer (proc.) 3. normalizuota ūžesio energija – NŪE (dB) 4. pagrindinis tonas – F0 (Hz)

5. harmonikų ir triukšmų santykis – HTS (dB)

Akustinė kalbos analizė atlikta pagal anksčiau aprašytą metodiką panau-dojant personalinį kompiuterį su įdiegta Tiger Electronics Dr. Speech (Speech Assesment, version 3,0) programine įranga. Kiekvienas pacientas buvo prašomas sau įprastu balso aukščiu ir garsumu perskaityti fonetiškai suba-lansuotą sakinį: „Turėjo senelė žilą oželį“. Balso įrašai išsaugoti „wav“ for-mate. Panaudojus programinę įrangą iškirpta kiekvieno įrašo pradžia ir pa-baiga, taip, kad jos sutaptų su sakomo sakinio pradžia ir pabaiga bei nebūtų intervalų be fonacijos įrašo pradžioje ir pabaigoje. Vidutinė kalbos įrašo truk-mė yra 2,9 sekundės. Programinės įrangos darbalaukis ir akustinio kalbos signalo analizė pavaizduota žemiau esančiuose paveikslėliuose (4.3.2 pav).

(36)

4.3.2 pav. Programinės įrangos, skirtos kalbamąjai kalbai analizuoti pavyzdys.

Šiame darbe panaudoti penki kalbos parametrai: 1. pagrindinis tonas – F0 (Hz)

2. kalbos laikas – speech time (proc.) 3. tylos laikas – silence time (proc.) 4. balso laikas – voice time (proc.) 5. bebalsis laikas – voiceless time (proc.)

Fonetograma registruota ir jos parametrai apskaičiuoti kompiuteriniu bū-du [45, 57], kuris Lietuvoje į diegtas 2000 metais KMU ANG ligų klinikoje. Tyrimui naudotas personalinis kompiuteris su Dr. Speech for Windows (Tiger DRS) „Phonetogram 4“ įdiegta programine įranga ir D60S Dynamic Vocal (AKG Acoustics) mikrafonas. Fonetogramos atliktos pagal Europos Foniatrų Sąjungos nustatytus reikalavimus [98]. Tirta įprastinėje akustinėje aplinkoje, kur foninis triukšmas neviršydavo 40 dB.

Atliekant tyrimą, tiriamasis stovėdavo 30 centimetrų atstumu priešais stacionariai stove įtaisytą mikrofoną. Kompiuterio pele, ekrane paspau-džiamas virtualios pianino klaviatūros klavišas ir išgaunamas tam tikro dažnio garsas. Tiriamojo buvo prašoma išklausyti sukeltą garsą ir kiek galima tiksliau jį atkartoti tęsiant raidę „A“. Išdainuotas garsas per mikro-foną perduodamas kompiuterinei programai, kuri automatiškai apskaičiuoja išdainuoto tono aukštį (Hz) ir garso intensyvumą (dB) bei grafiškai atvai-zuoja šiuos dydžius kompiuterio ekrane. Vyrams tyrimas buvo pradedamas nuo „e“ natos (165 Hz), moterims – nuo e1 natos (330Hz). Toliau tyrimas tę-siamas kas pustonį mažėjančia tvarka, kol pasiekiamas žemiausiai išdainuo-jamas tonas. Po to, nuo pradinio išeities tono tyrimas tęsiamas didėjančia tvarka, kol pasiekiamas didžiausias išdainuotas tonas [136]. Tokiu principu tiriamasis išgirstus garsus turėjo atkartoti du kartus: pirmą kartą – maksimaliai tyliai, antrą – maksimaliai garsiai. Tokiu būdu, pirmiausia

(37)

nustatomas apatinis fonetogramos kontūras, o po to viršutinis bei užpidomas visas fonetogramos plotas [82]. Užregistravus pirminę fonetogramą, tyrimas buvo kartojamas tam tikruose dažniuose, kol viršutinis ir apatinis kontūrai tapdavo nekintantys, o tyrimas laikytas baigtu. Fonetogramoje registruoti septyni parametrai (4.3.3 pav.):

1. tonų diapazonas (TD) – atstumas pustoniais tarp žemiausio ir aukš-čiausio išdainuoto tono.

2. aukščiausiai išdainuotas tonas (F-max) hercais 3. žemiausiai išdainuotas tonas (F-min) hercais

4. intensyvumo diapazonas (ID) – skirtumas decibelais tarp garsiausiai ir tyliausiai išdainuotų tonų

5. didžiausias balso intensyvumas (I-max) decibelais 6. mažiausias balso intensyvumas (I-min) decibelais 7. fonetogramos plotas (S)

4.3.3 pav. Fonetogramos Dr. Speech for Windows (Tiger DRS) „Phonetogram 4“ pavyzdys

4.4. Nuo laiko nepriklausomų balso parametrų skaičiavimas Automatiniam kategorizavimui buvo panaudota dešimties požymių rin-kinys [35]. Kiekvienas iš žemiau išvardintų požymių savyje turi skirtingą parametrų kiekį, o jų skaičius yra nurodytas skliausteliuose.

(38)

4. Kepstro energijos požymiai (100);

5. Mel-dažnio kepstro energijos koeficientai (35); 6. Autokoreliacijos požymiai (80);

7. Harmonikų-triukšmo santykio spekras (11); 8. Harmonikų-triukšmo santykio kepstras (11); 9. Tiesinio prognozuojančio filtro koeficientai (16);

10. Tiesinio prognozuojančio filtro kosinusų transformacijos koefi-cientai (16);

Dažnio ir amplitudės svyravimo reikšmės

Dažnio ir amplitudės svyravimo reikšmės [35] nustatytos „sukarpius“ balso įrašą į persidengiančius segmentus ir apskaičiavus jų reikšmes kiekvienam segmentui. Kiekvienas balso segmentas, dengia greta esantį 75 procentais. Norint tiksliai įvertinti dažnio svyravimus, reikalingi ne trum-pesni kaip 20 ms segmentai. Kiekvienam segmentui i=1,...,n nustatytas pa-grindinis tonas – dažnis F – ir jį atitinkanti amplitudė i A . i

Dažnio svyravimo reikšmės

1. Dažnio vidurkis: av =

in= Fi n

F 1 1

2. Didžiausias dažnis: Fmax =maxi=1,...,n(Fi) 3. Mažiausias dažnis: Fmin =mini=1,...,n(Fi)

4. Dažnio standartinis nuokrypis:

=

(

)

− = n i i av std F F n F 1 2 1 1

5. Fonacinio dažnio diapazonas (FDD): ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = min max log 2 log 12 F F FDD

6. Absoliutus Jitter‘io vidurkis AJV:

=+ − − = 11 1 1 1 n i Fi Fi n AJV 7. Jitter‘is (JITT): JITT = AJV /Fav

8. Dažnio svyravimo koeficientai apskaičiuoti iš 3 segmentų (DSK3):

100 3 1 2 1 1 2 1 1 3 × − − =

− = + − = av n i i i k k i F F F n DSK

Riferimenti

Documenti correlati

Nėra tiesioginės priklausomybės tarp viršūninio periodontito pažeistų dantų skaičiaus ir rizikos sirgti onkologinėmis ligomis.. Onkologinėmis ligomis

Visais atvejais, kepinių, pagamintų naudojant PRB raugus, formos išlaikymo koeficientas nustatytas didesnis, lyginant su kontrolinių kepinių ir kepinių, kurių gamybai

Pakartotinai buvo įrodyta, kad būtent periodontitas turi įtakos daugeliui sisteminių ligų: širdies vainikinių kraujagyslių ligoms, širdies infarktui, cukriniam

Darbas atliktas „X“ putpelių ūkyje ir LSMU VA Veterinarinės patobiologijos katedros Patologijos centre bei Gyvūnų auginimo technologijų instituto Gyvūnų

Šio tyrimo metu nustatytas antioksidantinis saldžialapės kulkšnės žaliavų aktyvumas gali būti pritaikomas širdies - kraujagyslių ligų pagalbinei terapijai dėl sudėtyje

Pastebėjome, kad krūvio metu registruoto QRS komplekso trukmė nežymiai ilgesnė didesnį stažą turinčių studenčių grupėje, o atsigavimo metu nusta- tytas statistiškai

1N, 2N, 3N - fizinį krūvį nugaros raumenims atliekančios trys tiriamųjų grupės, suskirstytos pagal veloergometrinio tyrimo atlikto kojomis metu, fizinį pajėgumą

 Mišrų pašarą (sausą, nuo stalo arba konservus) gaunantiems šunims (n=76) pasireiškė dantų akmenys 30 vnt., periodontitas 17 vnt., gingivitas 9 vnt., lėtinis danties