Nýtt! Prófaðu Málstað, vettvang fyrir allar helstu vörur Miðeindar.
14.11.2023
Máltæknifyrirtækið Miðeind kemur við sögu í nýrri bloggfærslu frá OpenAI (sjá https://openai.com/blog/data-partnerships). Tilefnið er að sérvalið íslenskt gagnasafn hefur verið fellt inn í GPT-4 Turbo, nýjasta gervigreindar-líkanið í GPT-fjölskyldunni. Hið endurbætta líkan sýnir mikla framför í að mynda íslenskan texta, bæði hvað varðar málfræði og almenna þjálni.
Sem hluti af vinnunni við verkefnið útbjó Miðeind mælipróf sem metur getu stórra mállíkana til að beygja íslenska nafnliði (sambeygð lýsingarorð og nafnorð) rétt, en fyrri kynslóðir líkana hafa átt í erfiðleikum með það verkefni. Niðurstöðurnar eru mjög hvetjandi: Þegar litið er til algengari orða, beygir GPT-4 Turbo heil beygingardæmi (þ.e.a.s. öll föll í eintölu og fleirtölu) villulaust í 66% tilvika, samanborið við 25% nákvæmni hjá eldra líkaninu sem kom út í mars sl.
Að sögn Lindu Heimisdóttur, framkvæmdastjóra Miðeindar, hefur fyrirtækið átt í farsælu samstarfi við OpenAI sem hófst í kjölfar heimsóknar Forseta Íslands, ráðherra og sendinefndar til höfuðstöðva fyrirtækisins í San Francisco á síðasta ári, en þar var Vilhjálmur Þorsteinsson, stofnandi og stjórnarformaður Miðeindar, með í för.
„OpenAI er brautryðjandi á sviði risamállíkana og gervigreindar. Í þessu samstarfi Miðeindar og OpenAI felst einstakt tækifæri til þess að auka veg íslenskrar máltækni. Það er gaman að sjá hvað þetta stórfyrirtæki hefur mikinn áhuga á málstað lítilla tungumála og við höfum í sameiningu lagt hart að okkur til þess að ná þessum árangri. Samstarfið heldur áfram og við stefnum enn hærra varðandi árangurinn.“
Húrra fyrir íslenskunni og gleðilega viku íslenskrar tungu!