Tallinna Tehnikaülikool

Doktorant Kairit Sirtsi doktoritöö põhieesmärgiks on inimkeelte töötlemise uurimine, see on tulevikus üks peamisi arvutiga suhtlemise viise. Doktoritöö „Mitteparameetrilised Bayesi mudelid arvutusliku morfoloogia jaoks“  kaitsmine on 18. juunil kell 13:00 (Akadeemia tee 15A, ruum ICT-638).

Doktoritöö juhendajad on dr Sharon Goldwater Edinburghi Ülikoolist ning emeriitprofessor Leo Võhandu Tallinna Tehnikaülikoolist. Oponendid on Dr. Mikko Kurimo Aalto Ülikoolist ning Microsofti teadur Dr. Kristina Toutanova.

Kuna tulevikus peaks inimkeeles suhtlemine olema üks peamisi arvutitega suhtlemise viise, siis on antud teadusvaldkond väga kiiresti arenev ja väga aktiivne. Kairit Sirtsi töö keskendub sellele, kuidas oleks võimalik inimkeele töötlemist automatiseerida. Et võimaldada seda ka nendes keeltes, kus puuduvad tänasel päeval vastavad lahendused.

Praktiliselt kõik raallingvistilised süsteemid loomulike keelte struktuuri töötlemiseks on loodud suuremahuliste inim-masin süsteemidena. Heatasemeliste tulemuste saavutamiseks on tavaliselt vaja väga kvalifitseeritud keeleteadlaste üpris tõsist ja kallist eelnevat käsitsitööd.

Maailmas on ligi 7000 kõneldavat keelt, neist enamuse jaoks ei ole ei vastava tasemega keeleteadlasi ega sobilikku süsteemset arvutikäsitlust.

Kairit Sirtsu väitekirja tulemused annavad rea mudeleid ja vahendeid sõnastruktuuride automaatuurimiseks üsna vähese tekstihulga või hoopis töötlemata näitelausete põhjal. Dissertandi töö tulemused aitavad paljudel väiksematel keeltel oluliselt napimate kulutustega alustada keele vormiõpetuse uurimist (sõnamoodustuse reeglid, sõnade sisemine struktuur ja sõnade omavahelised seosed).

Doktoritöö kättesaadav: http://digi.lib.ttu.ee/i/?2447

Laeb infot...