Sõltumata asjaolust, et Tallinna Tehnikaülikool ei ole maailmas kõige tuntumate ülikoolide seas, saab siin teha maailmatasemel teadust ja arendada tehnoloogiat, mille mõju ulatub üle kogu maailma. TalTechist on võimalik jõuda globaalse mõju ja mõjuka koodini, kui selleks on olemas huvi, tahe ja sihikindlus. Selle tõestuseks pole vaja otsida kaugelt – piisab, kui heita pilk Ian Erik Varatalu tööle.

Sõltumata asjaolust, et Tallinna Tehnikaülikool ei ole maailmas kõige tuntumate ülikoolide seas, saab siin teha maailmatasemel teadust ja arendada tehnoloogiat, mille mõju ulatub üle kogu maailma. TalTechist on võimalik jõuda globaalse mõju ja mõjuka koodini, kui selleks on olemas huvi, tahe ja sihikindlus. Selle tõestuseks pole vaja otsida kaugelt – piisab, kui heita pilk Ian Erik Varatalu tööle.
Varatalu alustas TalTechis informaatika magistriõpinguid, olles varem lõpetanud siin samas äriinfotehnoloogia bakalaureuse. Kuid huvi tehnilise süvitsi minemise vastu suunas ta informaatika magistrisse ja peagi juba ka doktorantuuri. Kahe ja poole aastase doktorantuuris õppimise jooksul õnnestus tal koostöös oma juhendajatega, kelleks on Margus Veanes Microsoft Researchist Redmondist, USAst ja Juhan Ernits TalTechist, luua maailma kiireim regulaaravaldiste teek, ehk tekstist mustri järgi otsimise mootor, mida tuntakse ka regex’i teegi nime all.
Informaatika magistrikava programmijuhi Juhan Ernitsa sõnul pole tegu pelgalt akadeemilise saavutusega. Varatalu tutvustas oma tööd mainekal programmeerimskeelte teemalisel konverentsil Principles of Programming Languages 2025 Denveris ja see on avaldatud teadusajakirja “Proceedings of the ACM on Programming Languages” 2025. aasta jaanuari väljaandes. Tööriista nimi on – “RE#”. Artikkel dokumenteerib, kuidas tema loodud lahendus edestab kiiruselt kõiki seni olemasolevaid regex-mootoreid, mis on laialdaselt kasutusel tekstipõhises andmetöötluses.
Maailma kiireima tekstiotsingumootori põhiautor selgitab: “Regulaaravaldisega saab otsida mustreid tekstist – näiteks leida kõik e-posti aadressid või telefoninumbrid. Tavaline otsing on nagu luubiga raamatu läbi vaatamine, aga regex võimaldab otsida mustreid kogu raamatukogust korraga.”
See lahendus pole mitte ainult kiirem, vaid ka arhitektuuriliselt läbimõeldum – seda on testitud ja rakendatud suurtel andmekogudel, mille puhul isegi millisekundite sääst omab suurt mõju, kui neid operatsioone korratakse miljoneid kordi.
Varatalu regex-mootor võimaldab otsida keerulisi mustreid oluliselt tõhusamalt ja väiksema ressursikasutusega. Selle töö mõju ulatub sügavale arendajate igapäevatöösse: see teeb keeruliste andmeanalüüside ja tekstikaeveoperatsioonide tegemise kiiremaks, täpsemaks ja energiatõhusamaks.
Töö, mis jõuab Microsofti
Veelgi olulisem kui teaduspublikatsioon, on selle töö praktiline mõju. Varatalu kasutas RE# regex-mootorit alusena, et pakkuda välja optimisatsioone .NET 9 raamistikku sisseehitatud regulaaravaldiste mootorile.
.NET on üks populaarsemaid tarkvaraplatvorme maailmas, mida kasutatakse laialdaselt äritarkvaras, panganduses ja tervishoius. Sellele on ehitatud ka näiteks tänapäevane Microsoft Office, Stack Overflow ja Unity, mille peale on omakorda ehitatud pea pooled arvutimängud maailmas.
Nagu Microsofti ametlikus .NET 9 blogis paljude teise optimeerimiste hulgas välja on toodud, aitas Varatalu, kelle Githubi kasutajanimi on ieviev, töö tuua olulisi kiirusparandusi regulaaravaldiste töötlusesse. Seal tunnustatakse konkreetselt tema panust, viidates vastavale GitHubi muudatusettepanekule (pull-requestile), kus tema optimeeringud on sulandatud .NET-i baaskoodi. See ei ole tavaline – saada oma töö maailma ühe enimkasutatava platvormi sisemusse on märk tehnilisest tipptasemest.
Selles kontekstis kerkis esile ka küsimus: kas mõni tuntud programm, näiteks Microsoft Excel, võiks kasutada just neid komponente? Varatalu täpsustab, et kuigi Excel ja teised Microsofti rakendused ei pruugi otseselt tema kirjutatud komponenti kasutada, on väga tõenäoline, et nad kasutavad mõnda teist .NET-i moodulit, millele tema töö on kiiruse ja tõhususe osas mõju avaldanud.
Ernits lisab siinkohal illustratiivse võrdluse: “.NET on nagu koodi LEGO – tohutu hulk klotse, millest ehitatakse erinevaid süsteeme. See, et sinu panust sisaldav klots läheb üldisesse komplekti, mida miljonid arendajad üle maailma kasutavad, on juba iseenesest saavutus.”
Tokeniseerimine, AI ja Microsofti teekide mõju
Lisaks regex-mootorile on Varatalu töö avaldanud mõju ka Microsofti AICI (Artificial Intelligence Controller Interface) arendusse. Tema artiklis kirjeldatud tehnoloogia baasil lõid Microsofti arendajad efektiivse tokenizeri – tööriista, mis jagab tekstid analüüsitavateks ühikuteks – on nüüd osa AICI teegist, mida kasutatakse suurte keelemudelite, nagu ChatGPT eelprotsessides.
“Kui sa kirjutad ChatGPT-le küsimuse, siis enne kui see masin suudab aru saada, mida sa üldse küsid, peab see tekst olema korrektselt tükeldatud. Just see protsess on seotud meie tööga,” kirjeldab Varatalu.
See tähendab, et Tallinna Tehnikaülikooli informaatika magistriõppes saadud baasteadmised on võimaldanud anda oma panuse täna miljardite päringute ja tekstide tegemisele – täiesti nähtamatult, kuid ülioluliselt.

Milleks mulle informaatika magister?
TalTechi informaatika magistriõpe ei jäta tudengeid kitsasse karpi. Peaaegu kõik ained on valikained ning üliõpilane saab ise kujundada oma tee: andmeteadus, teoreetiline arvutiteadus, masinõpe, programmeerimiskeeled, infoturve, robootika ja palju muud.
Varatalu tõstab esile magistriõppe unikaalset vabadust: “Sa saad valida just need teemad, mis sind huvitavad ja minna nendega nii sügavale kui soovid. Bakalaureusetasemel on palju üldist, aga magistris saad lõpuks ise suuna määrata.”
Ernits lisab: “Meie eesmärk pole toota lihtsalt koodi kirjutajaid. Me tahame arendada inimesi, kes saavad aru, kuidas süsteemid töötavad ja suudavad neid paremaks teha.”
Sügav spetsialiseerumine võrdub tugeva konkurentsivõimega
Küsimusele, kas informaatikat tasub üldse veel õppida, kui AI juba nii palju ise ära teeb, vastab Ernits kindlalt: “Jah! Just süvitsi minevaid spetsialiste on täna rohkem vaja kui kunagi varem. Lihtsama arendustöö teeb AI ära, aga keerukad probleemid vajavad inimesi, kes mõistavad süsteemide sisemust ja seda, kuidas juturobotile selliselt küsimusi esitada, et vastused aitaksid viia optimaalse lahenduseni.”
Ka Varatalu kinnitab: “AI võib kirjutada koodi, aga sa pead teadma, milline kood on õige. See eeldab tehnilist sügavust ja arusaamist. Just see ongi magistriõppe suur väärtus.”
Magistritööde mitmekesisus ja sidusus päriseluga
Informaatika magistriõppes ei dikteerita suunda – iga üliõpilane saab ise kokku panna oma õpiraja. Näiteks teevad üliõpilased magistritöid masinõppe, tarkvaratehnika, infoturbe, loomuliku keele töötluse, robootika, aruvutinägemisesüsteemide, teoreetilise arvutiteaduse ja isegi interdistsiplinaarsete projektide vallas (nt keemias või astrofüüsikas).
“Meil on olnud töid kvantkeemiast kuni keeleandmete töötlemiseni. See ei ole valdkond, kus tehakse ainult koodi, vaid koht, kus infotehnoloogia seotakse maailmaga,” ütleb Ernits.
Ülikool ei tähenda ainult loenguid. Varatalu toob välja, et üks suuremaid väärtusi on inimesed: “Magistrisse tulles tekivad kontaktid. Need võivad viia sind järgmistesse huvitavatesse projektidesse ja uute võimalusteni. Lisaks on see sotsiaalselt väga oluline – sa ei tee asju üksi.”
Sul on võimalus, kas sa ka kasutad seda?
“TalTechi võimalused on olemas. Kui sul on huvi ja tahe, siis siit saab väga palju,” rõhutab Varatalu.
Ernits toob aga näite, miks tasub just Tallinnas õppida: “Mõnes maailma tippülikoolis võib sul olla juhendaja, kes käib iga päev sabas. TalTechis pead sa rohkem ise initsiatiivi näitama – aga kui seda teed, on maailm su ees lahti. Meie asi on pakkuda kõik vajalik selleks, et sa saaksid seda teed minna.”
Tule sinagi TalTechi, sest siin saada reaalsed teadmised, et luua reaalseid lahendusi. Vastuvõtt juba käib: taltech.ee/reaalne.
Tule ja küsi täpsemalt magistrikavade kohta TalTechi IT-teaduskonna magistriõppe infoõhtul 8. aprillil kell 17 Mektorys.