Logotipo Hedatuz

Modelado prosódico del euskera batua para conversión de texto a habla

Navas Cordón, Eva (2003) Modelado prosódico del euskera batua para conversión de texto a habla. Other thesis, Universidad del País Vasco-Euskal Herriko Unibertsitatea.

Texto completo no está disponible desde este repositorio.

Abstract

"Testu ahots bihurketarako euskara batuaren modelatze prosodikoa" izenburua daukan tesi honetan testutik ahotserako sistemetan aplikatzeko burutu den euskara batuaren modelatze prosodiko lana aurkezten da. Intonazio, iraupen eta etenak sartzeko eredu berriak garatu dira. Garatutako eredu guztiek ebaluatze subjektiboko prozesu bat jasan dute, euren kalitatea hautematearen ikuspegitik zehaztea helburu delarik.

Ereduok metodologia zehatz bati jarraituz burutu dira, corpusetan oinarritutako metodologia hain zuzen ere. Metodologia honetan aztertu nahi den fenomenoaren erakusgarri den corpus bat oinarri harturik, berau behar den maila guztietan segmentatu eta markatzen da, garatzen ari den ereduaren parametro bereziak eskuratuz. Parametro hauek testutik bertatik lortutako informazioarekin erlazionatzearren, estatistikoki aztertzen dira, horrela, sarrera-testua jakinda, euren balioa aurresan ahal izan dadin. Eredu estatistikoaren kalitatea objektiboki neurri batzuen bidez ebaluatzen da, bataz besteko errore koadratikoaren erro karratua edo errore erlatiboa kasu, eta baita subjektiboki ere, beren-beregi sortutako proba batzuk erabiliz.

Soinuen iraupen segmentala modelatzean erregresio zuhaitz bitarrak erabili dira; zuhaitzoi soinua dagoen testuinguru fonetikoaren informazioa eta soinuak silaban, berban eta esaldian duen kokapenari buruzko datuak eman zaizkie. Iraupenaren eredua sortzeko erabilgarri zegoen ahots datubase handia erabili da. Aurresan esperimentu batzuk egin izan dira hainbat faktore-konbinazio eta iraupenerako kodifikazio ezberdinak saiatuz, bai eta soinuei aurretiko sailkapena aplikatuz ala ez. Horrela 12.9 ms.-ko RMSE-a lortzen da (korrelazio koefizientea 0.804 delarik). Emaitza hau beste hizkuntza gehienetan soinuen iraupena kalkulatzeko argitaratu diren emaitzak baino hobea da.

Etenak sartzeko ereduak, erabakitze puntutik hurbil dauden kateen iraupenari buruzko datuak ez ezik, sailkapen zuhaitz bitarrak ere badarabiltza, informazio sintaktiko eta morfologikoan oinarrituta. Eredu hau garatzeko corpus berriak diseinatu eta lortu dira. Esperimentu ezberdinak egin dira, ereduak egiten dituen errore mota guztiek garrantzi bera daukatela suposatuz eta eten bat ez zegoen leku batean sartzerakoan egiten den erroreei garrantzi handiagoa emanez. Garatutako ereduak etenen 91.7% leku zuzenetan ezartzen du (estatistikoaren balioa 0.68 delarik). Emaitza hauek beste hizkuntzetan argitaratu diren emaitzekin konpara daitezke. Etenak sartzeko ereduak egiten dituen erroreen analisia ere egin da eta errore gehienak informazio sintaktikoan edo morfologikoan dauden akatsengatik egiten dira. Hortik ondorioztatzen da analisi sintaktiko eta morfologiko automatiko eta zuzena lortzeak daukan garrantzia.

Intonazioaren eredua garatzeko bi corpus erabili dira: erabilgarri zegoen bizkaierazko ahots corpus txikia eta intonazioa aztertzeko diseinatu eta garatu den batuazko ahots corpus handi eta berria. Intonazioa modelatzeko Fujisakiren eredua euskara batura moldatu da eta hizkuntza honetan aplikagarri diren hizkuntza mugapenak aurkitu izan dira. Intonazio kurbaren parametroak automatikoki ateratzeko metodoa ere garatu da, testutik automatikoki atera den informazio linguistikoa eta intonazioa kurbaren balioak bakarrik erabiltzen dituena. Ereduaren parametroak aurresatea erregresio zuhaitz bitarrak erabiliz egiten da, eta testutik automatikoki atera daitezkeen ezaugarriak erabiltzen dira bakarrik.

Garatutako eredu prosodikoen esker testu ahots bihurgailaren kalitatea hobetu den jakiteko, proba subjektiboak egin behar dira, erabiltzaileen iritzia ezagutzeko.

Horretarako, ebaluatzeko metodologia osoa eta berria sortu da, froga ezberdinak sortuz ereduen aspektu guztiak ebaluatzeko. Garatutako eredu prosodiko guztiek emaitza ona lortu dute ebaluatze subjektiboko probetan, euskararako testu-ahotserako bihurgailuaren kalitateak eta naturaltasunak lan honi esker hobera egin duela adieraziz.

Eredu berri hauek erabiltzen duen testu ahots bihurgailua erabilgarri dago http://bips.bi.ehu.es/tts/tts_eu.html WEB orrialdean

Item Type: Thesis (Other)
Subjects: Technological Sciences > Telecommunications technology > Otras (especificar)
Divisions: UPV/EHU > E.T.S. de Ingenierios Industriales y de Telecomunicación > Automática, Electrónica y Telecomunicaciones
Contributors:
ContributionNameEmail
DirectorInmaculada Hernaez Rioja,
Date Deposited: 24 May 2010 17:00
Last Modified: 24 Aug 2010 13:16
URI: http://edtb.euskomedia.org/id/eprint/5900

Personal del repositorio solamente: página de control del documento

¹ Data hau katalogazio datuei dagokie, ez dokumentuari berari.