Avaandmete päev

Neljandal märtsil kogunesid Tartus Ülikooli 17 majja Open Data ehk Avaandmete liikumisega seotud inimesed, et tähistada ettekannete ja töötubadega igaaastast avaandmete päeva. Avalikult kättesaadavate andmete teemat käsitleti mitmest vaatenurgast. Et ettekanded olid suures osas ka diskussiooniallikaks, jäeti ettekannete lõpus ka aega teha ettepanekuid kuidas asju parandada ja mida edasi teha.

Hommiku alustuseks tutvustati projekti Open Data Issue Tracker, saamaks valitsuselt teada võimalikult palju selle kohta, mida meie kohta teatakse ning üldisemalt survestada valitsustandmeid avalikustama.

Samas tutvustati hommikupoole ka Texta projekte, milledest siiani kõige toimivam on Texta Law. Kuna kohtulahendites on sageli isiklikke andmeid, oli Texta üks peamisi eesmärke töötada välja selline süsteem, mis loomulikku keelt töödeldes oskaks sooritada andmepäringu väljutamata isiklikke andmeid. Otsingupank on suur, hõlmates riigiteataja, tarbiakaitse materjalid, kohtuotsuseid ning ka üliõpilaste töid õigusteaduskonnast. Selle ettekande ajal tuli välja, et on olemas eristus avaandmete ja avaldatud andmete vahel. Tekkis tõsine arutelu selle üle, kuidas peaks andmeid kajastama.

Avaandmete rakendamist loodusuuringutes ja looduskeskkonna hindamises tutvustas Kristjan Piirimäe, kes tutvustas avaandmete seisu Eesti keskkonnauuringutes. Üks tõsisemaid tõstatatud probleeme oli taas, et andmete litsentside seisukorrad ei ole selged. Tähendab, pole lihtsalt aru saadav, kuidas ja kas tohib andmeid kasutada, esitada ja töödelda. Samuti on suur hulk andmeid kogutud raportiteks ning pole kindel, et need on masinloetavad. Selle asemel, et metsas käies oleks koht kus lihtsalt sooritada päring, tuleb leida õige .pdf ja sooritada otsing selle sees..

Veel enne lõunat rääkisid Metabrainsi ja Wikimedia Eesti inimesed oma tegemistest. Metabrainsi üks suurimaid projekte siiamaani on Musicbrains, mis kogub andmestikku muusika kohta. Tutvustati erinevust teistest siiamaani tehtud muusikaandmekogudest ning räägiti sellest kuidas see andmestik ühildub wikidataga.

Wikimedia inimesed rääkisid ühest viimase aja suuremast projektist, Wikidatast, mis parimal juhul funktsioneerib kui tasakaalustav andmekogu erinevate wikimedia projektide vahel, kindlustades et üle keelte ja projektide oleksid esitatud andmed ühtsed ja ei satuks vastuollu.

Peale lühikest lõunapausi tuli kirjandusmuuseumist rääkima inimene, kes ettekandest selgus üks tahk sellele, miks ei tohi kõiki andmeid avalikustada. Samuti tutvustati kirjandusmuuseumi laiu andmekogusid ning milliseid töid on Eesti folkloristid ja etnograafid avaandmete maastikul teinud.

Seejärel võeti aga teemaks üldine ühendatud avaandmete standard ehk Linked open data. On tekitatud andmete hindamise süsteem, milles antakse hindeid selle järele kui hästi on andmed avalikustatud ja ühendatud teiste andmekogudega. Kirjeldati veel kord Wikidatat ning selle positsiooni Linked Open Data maastikul. Päeva lõpetuseks räägiti laiemalt Eesti kultuurimaastikul liiklevatest andmetest ja seal valitsevast segadusest.

Kirjutas vabatahtlik Jürgen Dengo

Advertisements

Lisa kommentaar

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Muuda )

Twitter picture

You are commenting using your Twitter account. Log Out / Muuda )

Facebook photo

You are commenting using your Facebook account. Log Out / Muuda )

Google+ photo

You are commenting using your Google+ account. Log Out / Muuda )

Connecting to %s