Euskarazko hizketa jarraituaren ezagutza automatikoa eredu estokastikoen bidez

López de Ipiña Peña, Miren Karmele (2003) Euskarazko hizketa jarraituaren ezagutza automatikoa eredu estokastikoen bidez. Other thesis, Euskal Herriko Unibertsitatea.

Texto completo no está disponible desde este repositorio.

Abstract

Erabiltzaile-makina komunikazio natural bat garatzeko sistemarako erabiltzaileari ezaguna egingo zaion hizkuntza bat definitu behar da lehendabizi. hizketa-ezagutza automatikorako sistemek (Automatic Speech Recognition, ASR) normalean konfigurazio-tresnak dituzte erabiltzaileak nahi duen hizkuntza aukeratzeko. Teknologia berrietan, beste arlo batzuetan bezala, gehien erabiltzen diren hizkuntzak batzuk besterik ez direla ezin uka daiteke, batetik, hiztun kopuru handia dutelako (ingelesak, frantsesak, gaztelaniak, e.a.), eta, bestetik, gizarte eleaniztun batean komunikazioa errazten duten hizkuntzak erabiltzeko beharragatik.

Hizketaren tratamenduaren eremuan, non helburu nagusia erabiltzailearentzako interfaze lagunkoien garapena den, erabiltzaileak erosoen erabiliko duen hizkuntza aukeratu ahal izatea beharrezkoa da. Hauxe da sistema eleanitzen garapena sasoi betean egotearen arrazoia. Hizketaren tratamendua gero eta garatuago dago hiztun gehiengoa duten hizkuntzen kasuan (ingelesa, gaztelania, frantsesa, e.a.) eta horietarako sistema oso aurreratuak eta prestazio handikoak dituzte. Hizkuntza minorizatuen kasuan, berriz, aurrerapenak askoz erritmo mantsoagoan gauzatzen dira, dudarik gabe, interes komertzial faltagatik. Dena dela, azken urteotan ahalegin handiak egin dira. Hedapen handikoak ez diren hizkuntzen aurrerapenaren adibide bat azken belaunaldiko sistema eleanitzak dira. Sistema horietan, aldez aurretiko konfiguraziorik gabeko sistema naturalagoa sortu nahi dute, aldi berean erabilitako hizkuntzetarako sistemaren baliabideak optimizatu nahirik. Sistema mota hauen ugaritzeak eta baliabideen optimizazio handiagoaren bilaketak, turkiera bezala hainbeste ikertu ez diren hizkuntzetan oinarritutako ikerketak bultzatu dituzte. Hauek ASR sistemetara aplika daitezkeen hizkuntza ezberdinen egitura eta hotsei buruzko ezagutza berriak dakartzate.

Tesi honek, baliabideen garapena eta euskararako hizketa jarraituaren ezagutzarako sistemei (Continuous Speech Recognition, CSR) eskainitako hamar urtetako prozesuari amaiera jartzen dio. Zentzu honetan euskaraz egindako lehenengo lana da hau. Ikerkuntza-lan honetan beste hizkuntza batzuetan ezagutzen genituen esfortzu, lan eta emaitzak berresan behar izan ditugu eta hizketaren ezagutze automatikorako sistemen (Automatic Speech Recognition, ASR) garapenaren alderdi askotan, gaiari buruzko azken ekarpenen berri jaso dugu ere bai.

Euskara, tesi-lan honek oinarri izan duen hizkuntza, Europan dagoen hizkuntza bizi zaharrenetakoa da eta azken urteotan hizkuntza honetarako sistema automatizatuen garapenean aurrerapen nabarmenak ikusi ditugu. ASRren eremuan egiten ari diren ikerketetan lagundu nahi du lan honek, baita hizketaren tratamenduari dagokionez euskararako dagoen hutsunea bete ere, lortutako emaitzetako batzuk ASR eremuan generikoki aplikatu ahal izateko asmoz. Beste alde batetik, lan honen garapena eta bertatik atera daitezkeen ikerketak, martxan dauden proiektu eleanitzetarako edo euskara erabiliko duten etorkizuneko proiektuetarako ekarpen eta erreferentzia garbia izango dira. Zehaztearren, lanak euskararako CSR sistema baten garapena du oinarri

Item Type:

Thesis (Other)

Subjects:

Technological Sciences > Computer technology

Divisions:

UPV/EHU > Informática > Ciencias de la computación e inteligencia artificial

Contributors:

Contribution	Name	Email
Director	Manuel Graña Romav,

Date Deposited:

24 May 2010 17:00

Last Modified:

24 Aug 2010 13:16

URI:

http://edtb.euskomedia.org/id/eprint/5895

Personal del repositorio solamente: página de control del documento

¹ Data hau katalogazio datuei dagokie, ez dokumentuari berari.