Tallinna Tehnikaülikool

Samal ajal kui üha rohkem servereid kulutab üha rohkem energiat, et talletada üha kasvavat andmehulka, näevad mõned inimesed vaeva, et koguda ja talletada vaid sisukat infot, millest tõesti ka kasu on. Eduard Petlenkov kuulub nende hulka ja jagab oma mõtteid ja kogemusi andmete ja numbrite sisulisest väärtusest. Märtsis on „Roheliste teemakuude“ fookuses digipuhtus ja e-jäätmed ning otsime üheskoos võimalusi teha jätkusuutlikke valikuid oma elektroonilises elus. 

Millistest põhimõtetest lähtud andmemahu ja digiruumi haldamisel nii isiklikus töös kui ka süsteemide või lahenduste disainis?  

Eduard Petlenkov, foto: TalTech
Eduard Petlenkov, foto: TalTech

Minu töö on väga tihedalt seotud andmetega. Sageli tekib kummaline olukord, kus “numbreid” on palju, kuid tegelikke, sisulisi andmeid vähe. 

Oluline on salvestada õigeid andmeid ja õiges mahus. Toon lihtsa näite – kui salvestate toa temperatuuri andmeid, saab neist teha teatud järeldusi. Kuid neist on vähe kasu, kui puuduvad seotud andmed: mitu inimest oli ruumis, kuidas töötasid küte, jahutus ja ventilatsioon, milline oli ilm jne. 

Teisalt olen näinud, et selliseid andmeid salvestatakse sekundilise intervalliga, mis ei ole mõistlik, arvestades protsessi tegelikku dünaamikat. Andmete salvestamise sagedus peab olema kooskõlas konkreetse protsessi kiirusega. 

Mida oled võitnud sellest, et eelistad väiksemat andmemahtu ja läbimõeldud salvestamist? 

Probleem ei ole ainult selles, et põhjendamatult suure andmemahu töötlemine võtab palju aega ja ressursse. Liigsed andmed hakkavad ka sisuliselt segama ning langetavad tulemuse kvaliteeti. 

Masinõppel ja tehisintellektil põhinevad süsteemid võivad hakata õppima mürast ning tegema otsuseid ebaoluliste tunnuste alusel. Selle tulemusena kannatab süsteemide töökindlus ja usaldusväärsus. Nii nagu inimeselgi – kõige lihtsam viis olulise informatsiooni peitmiseks on segada see tohutu hulga ebaoluliste uudistega. 

Sageli õigustatakse andmete kuhjumist mõttega „äkki läheb kunagi vaja“. Kuidas sina otsustad, mida tasub talletada ja mida mitte?  

Teatud mõttes on selles mõtteviisis ka tõetera – osa andmeid võibki tulevikus kasutusse minna. Näiteks üleminek 15-minutilisele energiaturule tekitas kohe vajaduse protsesse täpsemalt modelleerida ja kiiremini reageerida. See omakorda tähendab, et vaja on kõrgema ajasagedusega andmeid. 

Samas ei toimu sellised muutused üleöö. Teadus ja arendus peavadki vaatama ettepoole. Andmete kogumisel tuleb teha teadlikke valikuid, arvestades, mida tehnoloogia 2–3 aasta perspektiivis nõuab ja võimaldab. 

Anna on üks põhimõte või praktiline soovitus neile, kes lahendavad kasvavat andmemahtu lihtsalt pilveruumi juurde ostmisega. 

Esmalt tuleks luua tehnoloogilised võimalused vajalike andmete mõõtmiseks ja kogumiseks just õigel ajal ja õiges mahus – näiteks asjade interneti lahendused, kiired sidekanalid ning reaalajas andmetöötlus. 

Andmemahu kasvatamine ei tohiks olla eesmärk omaette; eesmärk peaks olema kvaliteetsete andmete kättesaadavus. 

Ole nagu Eduard! 

Mõõda enda eluviisi kestlikkusteluviisitestigasiin. 

Kuidas anda oma panus keskkonnajalajälje vähendamisse, loeTehnikaülikooli rohejuhisestja Riigikantseleirohekäitumise tööriistakastist.