Kas Vikipeedia on masintõlgitav?

19.-20. aprillil toimus Tallinnas konverents “Eesti keeletehnoloogia 2017”. Konverentsile eelnev päev oli aga tööpajade päralt, kus muuhulgas uuriti, et kas ja kuidas saab Vikipeediat masintõlkida – toimus Vikipeedia häkaton.

Nimelt käivitus emakeelepäeval projekt Miljon+, mille eesmärgiks on saada miljon artiklit eestikeelsesse Vikipeediasse ning tööpajas soovitigi välja uurida, et kas masinad saavad aidata meil sellele eesmärgile kiiremini lähemale jõuda. Häkatonil kasutati kaht erinevat masintõlkevahendit – TÜ arvutiteaduse instituudi masintõlkeprojekt KaMa – Kasutatav Eesti Masintõlge ning proovile pandi ka eraturul masintõlget pakkuv Tilde Eesti OÜ tõlkeprogramm. Lisaks nendele tõlgiti paralleelselt ka käsitsi tekste, et saaks hinnata kumb viis siis on tõesti parem ja kiirem.

Minu roll antud häkatonil oli olla hindaja rollis – see tähendab, et ma pidin üle vaatama kõik artiklid (nii otsetõlgitud kui ka järeltoimetatud masintõlgitud artiklid) ning andma oma hinnangu selle tõlkekvaliteedile. Hindajate segadusse ajamiseks olid korraldajad artiklite hulka pannud ka juba valmis artikleid.

18033061_1449388965104477_7455232323397494909_n.jpg

Pärast mitut tundi tõlkimist oli minu jaoks tulemus väga huvitav – artiklid olid võrdlemisi lühikesed, kuid nii otsetõlgitud kui ka masintõlgitud artiklid olid üldjoontes üsna kehvad. Erandeid muidugi ka oli ja oli ka väga häid artikleid, kuid oli ka näha, et nendesse oli panustatud rohkem aega. Siiski üldiselt oli hinnata pigem keeruline, kuna raskusi oli ka näiteks pakkumiste tegemisega, et mil viisil artikkel on tõlgitud. Kui ma pooled artiklid olin ära hinnanud, siis hetkeks jäin mõtlema, et mille põhjal ma siis pakkumisi teen ja tuli välja, et olen rohkem altim pakkuma, et artikkel on masintõlgitud, kui seal on rohkem käändevigu.

Siiski päeva lõpuks jõudsime järeldusele, et masintõlge võib tihtipeale kaasa aidata artikli tõlkimisel, kuid ilma järeltoimetamiseta ei ole kahjuks selliselt tõlgitud artikli kvaliteet isegi arvestatav. Päeva lõpetuseks tuli ka veel üks huvitav idee Vikipeedia artiklite automaatseks genereerimiseks – märksõna järgi otsib masin internetiavarustest kogu info märksõna kohta ja formuleerib selle artikliks. Kas keegi kunagi sellist süsteemi ka looma hakkab? Elame, näeme!

Advertisements

Lisa kommentaar

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Muuda )

Twitter picture

You are commenting using your Twitter account. Log Out / Muuda )

Facebook photo

You are commenting using your Facebook account. Log Out / Muuda )

Google+ photo

You are commenting using your Google+ account. Log Out / Muuda )

Connecting to %s