Fréttir

14. mars 2023

Miðeind í samstarfi við OpenAI um GPT-4

Bandaríska fyrirtækið OpenAI hefur verið ofarlega á baugi upp á síðkastið sem útgefandi nýstárlegra gervigreindarlausna á borð við DALL·E og ChatGPT sem slegið hafa í gegn hjá milljónum notenda um allan heim. Glöggir notendur á Íslandi hafa tekið eftir því að spjallmennið ChatGPT kann ýmislegt fyrir sér í íslensku þrátt fyrir að hafa aðeins verið markvisst þjálfað í ensku. Við þróun nýjustu afurðar sinnar, GPT-4, sem kynnt er í dag, hefur OpenAI hins vegar í fyrsta skipti gert tilraunir með sérstaka þjálfun risamállíkans síns á öðru tungumáli en ensku, og þar varð íslenska fyrir valinu.

Hér hefur íslenska máltæknifyrirtækið Miðeind gegnt lykilhlutverki en samstarf Miðeindar og OpenAI hófst í kjölfar heimsóknar forseta Íslands og sendinefndar til höfuðstöðva OpenAI í San Francisco í maí síðastliðnum. Fyrsti áfangi samstarfsverkefnisins sneri að því að kenna fyrri kynslóð GPT mállíkansins íslensku (svokölluð „fínþjálfun“) og að meta hversu mikið af textagögnum þyrfti til að ná því markmiði.

Þegar undirbúningur næstu kynslóðar GPT líkansins, þ.e. GPT-4, fór á skrið sl. haust leitaði OpenAI til Miðeindar um að taka þátt í þjálfun þessa nýjasta líkans sem er mun stærra og öflugra en fyrirrennarinn. Þar var um að ræða svokallaða styrktarþjálfun með mannlegri endurgjöf (e. Reinforcement Learning - Human Feedback) en þessi tegund þjálfunar er nauðsynleg til að kenna mállíkani að skilja spurningar og verkefni og svara þeim rétt og vel.

Miðeind safnaði saman hópi næstum 40 sjálfboðaliða hérlendis sem fengu það verkefni að útbúa spurningar og verkefni á íslensku fyrir GPT-4, og síðan að meta svör líkansins, gefa þeim einkunnir og kenna því hvernig það gæti svarað enn betur. Þessi gögn voru að því loknu notuð í þjálfun GPT-4 og urðu til þess að líkanið tók mælanlegum framförum í íslensku.

Verkefninu er þó hvergi nærri lokið því ljóst er að töluvert meiri þjálfun þarf til að gera líkanið fullfært í tungumáli okkar eyjarskeggja. Líkanið skilur vel spurningar og verkefni og stendur sig nú þegar mjög vel í mörgu, svo sem samantekt texta, viðhorfsgreiningu og þýðingu yfir á önnur tungumál, en gerir enn málfræði- og orðalagsvillur þegar það er beðið að skrifa lengri samfelldan texta á íslensku.

Miðeind hefur frá árinu 2015 unnið að þróun hugbúnaðar á sviði máltækni og gervigreindar fyrir íslensku. Miðeind hefur kynnt til sögu nokkrar vörur á sviði máltækni, svo sem snjall-aðstoðar-appið Emblu, málrýnina Yfirlestur.is og þýðingarvélina Vélþýðingu.is, ásamt því að taka þátt í máltækniáætlun stjórnvalda og vinna að ýmsum verkefnum með íslenskum fyrirtækjum. Miðeind er umhugað um að máltæknibúnaður sé almennt opinn og aðgengilegur sem flestum og var stofnuð fyrst og fremst til þess að vinna að bættum hag íslenskunnar í stafrænum heimi. Hjá fyrirtækinu starfa 12 sérfræðingar með fjölbreyttan bakgrunn.

Fyrirtækin tvö, Miðeind og OpenAI, eiga það sameiginlegt að hafa lagt mikla áherslu á að þróa gervigreind með ábyrgum hætti og þannig að sem flest njóti ávinnings af henni. Vonir standa til að áframhaldandi samstarf fyrirtækjanna tveggja muni leiða til þess að íslenska tungumálið standi jafnfætis stærri tungumálum í gervigreindarlíkönum á borð við GPT-4. Þá er hugmyndin að þetta tilraunaverkefni verði nýtt sem sniðmát fyrir önnur smærri tungumál svo þau fái notið sömu tækifæra.

Gervigreind mun líklega verða einn helsti drifkraftur framleiðniaukningar og nýsköpunar á næstu árum og áratugum. Ein helsta áskorun gervigreindarbyltingarinnar er að tryggja að tæknin sé aðgengileg fyrir alla og að ekki skapist gjá á milli þeirra sem hafa aðgang að henni og þeirra sem hafa hann ekki (e. AI Divide). Þar skiptir stuðningur við tungumál heims lykilmáli. Þá þarf að þróa tæknina þannig að hún sé örugg, þjóni hagsmunum mannkyns og festi ekki bjaga, mismunun eða ójöfnuð í sessi.

Miðeind hlakkar til að halda áfram nánu og góðu samstarfi við OpenAI og að vinna að því að styrkja stöðu íslenskunnar á öld gervigreindar.

14. mars 2023

Umfjöllun í innlendum fjölmiðlum

Útgáfa GPT-4 og samstarf OpenAI og Miðeindar hefur ratað í fjölmiðla víða um heim, þar á meðal á Íslandi.

Fréttablaðið hefur fjallað ítarlega um samstarf OpenAI og Miðeindar á vef sínum í dag. Í fréttinni má finna viðtal við Vilhjálm Þorsteinsson, stofnanda og eiganda Miðeindar og Kötlu Ásgeirsdóttur, viðskiptaþróunarstjóra Miðeindar, um nýjustu vendingar.

Samstarfið kom við sögu í kvöldfréttum RÚV, þar sem meðal annars var rætt við Vilhjálm Þorsteinsson. Í kjölfarið birtist frétt sama efnis á vef RÚV.

Vísir gerir samstarfinu og tækifærum í kjölfar þess góð skil á vef sínum í dag.

23. febrúar 2023

67. kvennanefndarfundur Sameinuðu þjóðanna

Kvennanefndarfundur Sameinuðu þjóðanna (CSW) fer fram í 67. skiptið í höfuðstöðvum Sþ í New York dagana 6.-17. mars. Áherslur fundarins í ár er á nýsköpun og tækni og hvernig hún getur nýst í þágu jafnréttis. UN Women á Íslandi tók viðtal við Kötlu Ásgeirsdóttur, viðskiptaþróunarstjóra Miðeindar um málefnið.

15. febrúar 2023

Fyrirlestur á UTmessunni 2023

Svanhvít-UTmessa

Sérfræðingar Miðeindar í máltækni hafa undanfarið tæpt ár unnið í tauganeti sem leiðréttir texta með því að „þýða“ hann yfir í læsilegra mál. Svanhvít Lilja Ingólfsdóttir fjallaði um tæknina og möguleika hennar á UTmessunni fyrr í þessum mánuði. Endilega kynnið ykkur frumútgáfu þessa hagnýta og spennandi tóls á ai.yfirlestur.is.

18. janúar 2023

Miðeind fær nýjan rekstrarstjóra

Linda Heimisdóttir

Um áramótin urðu þær fregnir að Linda Heimisdóttir gekk til liðs við Miðeind sem rekstrarstjóri (COO). Linda er doktor í málvísindum frá Cornell háskóla og hefur undanfarin ár unnið hjá alþjóðlega máltæknifyrirtækinu Appen sem vörustjóri (Program Manager). Hún byrjar í fjarvinnu frá Oregon-ríki í Bandaríkjunum, en kemur til liðs við skrifstofuna okkar í Reykjavík í júní nk. Það er mikill fengur að því að fá Lindu í hópinn okkar; hún mun tvíefla sókn Miðeindar á sviði máltækni og gervigreindar og styrkja stöðu fyrirtækisins enn frekar sem leiðtoga á þessu spennandi og hraðvaxandi sviði.

16. nóvember 2022

Embla fær nýja rödd

Dagur íslenskrar tungu

Í dag, á degi íslenskrar tungu, skiptir Embla um rödd (eða réttara sagt raddir). Nýju raddirnar eru unnar úr gögnum sem safnað var undir máltækniáætlun ríkisins. Til hamingju með daginn öll!