Feneyjar eða Venezia?

Feneyjar eða
Venezia?

Hjá Miðeind, og í tengslum við fimm ára máltækniáætlun stjórnvalda, vinnum við að því að þróa betri vélþýðingu milli íslensku og annarra tungumála en hingað til hefur verið fáanleg. Meðal annars stefnum við að því að höndla mannanöfn og sérnöfn betur en nú þekkist, og að bjóða betri lausnir fyrir þýðingar á sérsviðum. Þá er vitaskuld markmið að bæta almenna þýðingarfærni hugbúnaðarins og þjálni textans sem út kemur.

Vélþýðing

Vélþýðing er þýðing á texta eða tali úr einu tungumáli yfir á annað, sem gerð er í tölvu. Í árdaga vélþýðingartækninnar notaðist hún við tölfræðilegar aðferðir, en á síðustu árum hafa djúp tauganet (deep neural networks) tekið yfir sem besta fáanlega tækni á þessu sviði.

Margir þekkja kerfi á borð við Google Translate og Microsoft Translator, sem styðja íslensku þokkalega. Við hjá Miðeind teljum að hægt sé að gera enn betur. Til þess þarf m.a. átak til að safna samhliða textaheildum (parallel corpora), þ.e. texta sem til er samhliða á íslensku og öðrum tungumálum, en jafnframt aðrar aðferðir til að bæta þýðingarhæfni tauganetanna. Í fimm ára máltækniáætlun stjórnvalda eru skilgreindir áfangar og vörður að betri vélþýðingartækni fyrir íslensku, og Miðeind er meðal lykilþátttakenda í því verkefni.

Markmið okkar er að opna á árinu 2020 vefgátt fyrir vélþýðingu milli íslensku og ensku, þar sem notendur geta hjálpað til við að gera þýðingarnar enn betri, með aðferðum lýðvirkjunar (crowdsourcing).