Tarkvarateaduse instituudi doktorant Joonas Kalda kaitseb 10. märtsil 2026 algusega kell 11:00 oma doktoritööd "Improved Training Methods for Multi-Talker Speech Processing" ("Treeningmeetodid mitme rääkijaga kõne töötluseks"). Kaitsmine toimub Tallinna Tehnikaülikooli infotehnoloogia maja ruumis ICT-218 (Akadeemia tee 15a) ning on jälgitav veebirakenduse Zoom vahendusel.
Mitme rääkijaga helimaterjali tekib aina juurde, alates koosolekusalvestistest kuni vestluslike tehisintellektisüsteemideni. See on omakorda suurendanud vajadust keerukate akustiliste stseenide usaldusväärseks automaattöötluseks. Kui üksikkõneleja kõne töötlus on saavutanud märkimisväärseid tulemusi, siis üleminek mitme rääkijaga keskkondadesse toob kaasa põhimõttelisi väljakutseid, millega senised meetodid ei suuda tõhusalt toime tulla.
Käesolev väitekiri uurib mitme rääkijaga kõne töötluse (MRKT) keskseid probleeme, keskendudes eriti domeenierinevusele treeningutingimuste ja reaalse kasutuskeskkonna vahel. Pakutakse välja uusi meetodeid, mis aitavad ületada lõhet kontrollitud üksikkõneleja korpuste ja loomulike vestluste vahel, kus kõnelejad räägivad üksteisega samaaegselt, katkestavad üksteist ning kus esineb suur akustiline varieeruvus.
Antud väitekiri panustab kolme omavahel seotud uurimissuunda: (1) kraetundlikud treeningumeetodid, mis viivad mudeli treenimise vastavusse hindamisprotokollidega;(2) ühistreeningraamistikud, mis kasutavad mitme rääkijaga salvestisi nii diariseerimise kui ka eraldamise ülesanneteks; (3) töökindlad kõnelejaesituste meetodid, mis säilitavad eristusvõime ja suurendavad töötlemiskiirust kattuva kõne korral.
Need panused aitavad ületada MRKT-süsteemide seniseid kitsaskohti ning tõstavad täpsust realistlikes hindamistingimustes.
Doktoritöö on avaldatud Tehnikaülikooli raamatukogu digikogus
Juhendaja kaasprofessor tenuuris Tanel Alumäe (TalTech)
Oponendid:
- professor Anthony Larcher (Le Mansi Ülikool, Prantsusmaa)
- teadur Oldřich Plchot (Brno Tehnikaülikool, Tšehhi)
Jälgi avalikku kaitsmist Zoomis
Meeting ID 884 983 3907
Passcode: 56248