Tallinna Tehnikaülikool

Tallinna Tehnikaülikoolis doktoritööd kaitsnud Ago Luberg* töötas välja algoritmi, mis soovitab netis surfavale reisihuvilisele just neid vaatamisväärsusi ja külastamist väärt kohti, mida inimene tõepoolest näha tahab. Kuidas?

Riia majad

Inimesed võivad kas isikliku kogemuse või kuuldu põhjal teile tihti väita, et nad ei järgi mingil juhul automaatsüsteemide soovitusi. Samamoodi võib igaüks meist väita, et enamik soovitussüsteeme ei ole lihtsalt küllalt intelligentsed ja ei paku meile piisavalt infot.

Doktoritöös „Kasutajatelt kogutud andmete integreerimine parametriseeritud reisisoovituste loomiseks” ongi vaatluse all „automaatse turismisoovitaja” loomise erinevad aspektid, kusjuures fookus on just visuaalselt atraktiivsetel ja huvitavatel kohtadel.

Seega on töö idee vastuolus seni laialt levinud turismi- või reisisüsteemide automaatsoovitustega, mis keskenduvad peamiselt kaubanduslikele eesmärkidele, pakkudes näiteks kõige soodsamaid hotelle, restorane ja reisipileteid jms.

Peamine rõhk töös on aga turismiobjektide andmete kogumisel ja töötlemisel. Töö käigus on tegeldud erinevate soovitussüsteemide – Sightsplanner, Sightsmap ja Visit Estonia veebilehe soovitussüsteemi – disainimise ja arendamisega ning nende jaoks andmete kogumise, töötlemise ja integratsiooniga. Niisiis oligi töö eesmärk uurida viise, kuidas parandada erinevate automaatsüsteemide n-ö nõrkusi ja luua senisest täiuslikumaid süsteeme.

Väärib märkimist, et erinevad süsteemid võtavad arvesse erinevaid aspekte. Näiteks mõnes piirkonnas tehtud fotode rohkus näitab koha visuaalset atraktiivsust, vastavate kohtade Wikipedia külastuste logide arv näitab, kui hästi neid tuntakse, samas kui sisenemised sellistesse süsteemidesse nagu Foursquare/Swarm näitavad tegelikku külastuste arvu.

Seega keskenduti siin erinevatele andmeallikatele nagu nt nimed, asukohad, kirjeldused, fotode pealkirjad, erinevad tüüpi meeldimised jne. Üks eriti huvipakkuv küsimus oli topeltobjektide tuvastamine andmebaasides.

Millised on tulemused?

Ühe olulise tulemusena näitas Ago Lubergi töö, kuidas saab turismiobjektidele sobivushinde arvutamisel rakendada tõenäosuslikku ja hägusloogikat, kasutades selleks ebakindlaid kategooriaid, ontoloogiaid ning tõestajapõhiseid algoritme. Aluseks võeti olemasolev turismiobjektide andmestik ning lihtsasti esitatavad kasutaja-eelistused.

Teiseks töötati masinõppemeetodite põhjal välja süsteem, mille abil saab tuvastada samu reaalseid objekte kirjeldavad kirjeid, mis on aga pärit erinevatest andmeallikatest. Näiteks tuvastati loodud algoritmiga Tallinna söögikohtade andmestiku pealt õppides Riia turismiobjektide, sh muuseumid ja kunstigaleriid jms, kattuvus täpsusega 98%. Võrdluseks – eelnevalt oli see täpsus käsitsi seadistatud parameetritega märksa väiksem ehk 85%.

Kolmandaks loob autor algoritmi, millega tuvastatakse turismiobjektide nimi ja kategooria – aluseks on võetud kasutajate sisestatud kirjeldusi objektide kohta, kusjuures saadud andmete põhjal on võimalik integreerida andmed erinevatest andmeallikatest. Näiteks, kui kasutati Panoramio piltide allkirju, siis suutis algoritm leida üles umbes 56% Suurbritannia ja Prantsusmaa Wikipedias esinenud turismiobjektidest.

*Tallinna Tehnikaülikooli 103. sünnipäeval, 17. septembril saab Ago Luberg kätte doktorikraadi, tema töö teemaks on „Kasutajatelt kogutud andmete integreerimine parametriseeritud reisisoovituste loomiseks”. Kokku promoveeritakse 66 doktorit, doktorite tervituskõne peab materjali- ja keskkonnatehnoloogia instituudis tööstusdoktorantuuri lõpetanud Siret Malmberg. Akadeemilise kõne „Rohepööre, ülikool ja mäng(urlus)?!“ peab inseneriteaduskonna teadusprodekaan ja professor Argo Rosin. Samuti antakse üle teenetemedalid „Mente et Manu“.