Nú lýkur senn tíunda afmælisári Miðeindar. Á þessum áratug hefur fyrirtækið umbreyst frá pínulitlum máltæknisprota í eitt stærsta fyrirtæki á Íslandi sem þjálfar gervigreindarlíkön frá grunni. Við sjáum gríðarlega möguleika í gervigreind, höfum verið jákvæðir talsmenn hennar og þátttakendur í að gera hana betri og öflugri. Notagildið kemur skýrt fram í vörunni okkar, Málstað, sem hefur fengið stórgóðar viðtökur. Máltækni fyrir íslensku hefur tekið stórstígum framförum á síðustu árum og það má að verulegu leyti þakka gervigreind.
En gervigreind er umdeild og ekki að ósekju. Stór gervigreindarlíkön eru orkufrek í þjálfun og keyrslu, þau krefjast mikils gagnamagns og gögnin eru ekki alltaf tekin frjálsri hendi. Þyngstu spurningarnar snúa þó að mannlegri tilvist: Hvað gerir okkur mannleg? Er hætta á að við útvötnum það sem gerir mannlega sköpun einstaka ef við útvistum sífellt fleiri verkefnum til vélmenna?
Þessi umræða er fyrirferðarmikil á meðal þeirra sem starfa í skapandi greinum og áhyggjurnar eru ekki úr lausu lofti gripnar. Það olli uppnámi nýlega þegar hið gamalgróna fjölskyldufyrirtæki Kjörís setti á markað nýjan jólaís í öskju sem er myndskreytt fremur lélegri og metnaðarlausri gervigreindarteikningu sem á lítið skylt við íslenskan veruleika. Um svipað leyti varð fjaðrafok vegna samninga menntamálaráðuneytisins við bandaríska gervigreindarrisann Anthropic, enda hefur fyrirtækið orðið uppvíst að viðamiklum stuldi á ritverkum, þar á meðal íslenskra höfunda.
Það er ekki óeðlilegt að listafólk spyrji sig undir þessum kringumstæðum hvort gervigreindarvæðingin miði ekki hreinlega að því að útrýma störfum þess. Rithöfundasamband Íslands velti einmitt þeirri spurningu upp á nýlegum hádegisfundi með yfirskriftinni „Munu tölvur skrifa jólabækurnar?“. Þar tókust á ólík sjónarmið en öll erum við væntanlega sammála um að það er ansi niðurdrepandi tilhugsun að verkin okkar séu notuð til þess að þjálfa vélræna eftirmenn svo þeir geti velt okkur úr sessi.
Þessi umræða er Miðeind nærtæk af því að við þjálfum sjálf gervigreind og höfum einnig hjálpað erlendum aðilum að þjálfa gervigreind, meðal annars með því að afhenda þeim opin gögn á borð við Risamálheild Árnastofnunar og síaða útgáfu af Common Crawl gagnasettinu. Það er því full ástæða til að árétta okkar afstöðu til gagnaöflunar fyrir slíkar þjálfanir.
Tilgangur Miðeindar er, og hefur alltaf verið, að tryggja Íslendingum aðgengi að bestu mögulegu máltækni á okkar eigin tungumáli. Gervigreind getur ekki lært tungumál án gagna og þörfin er meiri eftir því sem mállíkönin eru stærri. Þetta er umtalsverð hindrun fyrir pínulítið mál eins og íslensku, sem hefur ekki yfir ríkulegum opnum gagnauppsprettum að ráða. Ef tæknin á að tala íslensku þá skiptir hver stafur og hvert bæti máli. Það skiptir líka máli að gagnaheildir séu fjölbreyttar og endurspegli jafnt fagurbókmenntir sem fréttatexta, fræðigreinar sem samfélagsmiðlaraus.
Að því sögðu þá hefur það aldrei komið til greina hjá Miðeind að þjálfa mállíkön á illa fengnum gögnum eða að hvetja aðra til þess að gera slíkt hið sama. Við höfum raunar talað fyrir því í samtölum við stjórnvöld og aðra haghafa að fundin verði leið til þess að greiða rithöfundum fyrir not á þeirra verkum við þjálfun gervigreindar, séu þeir samþykkir slíkri notkun á annað borð.
Burtséð frá því hvaðan gögnin koma finnst mörgum það leiðinleg og jafnvel viðsjárverð þróun að sífellt fleiri verkefni, sem krefjast sköpunargáfu og íhugunar, séu falin gervigreind. Textinn sem kemur út úr risamállíkönum er stundum klisjukenndur og getur verið einsleitur og einkennst af ákveðinni flatneskju. En við notum þessi líkön nú samt og ástæðan er einfaldlega sú að þau eru gríðarlega öflug tól og geta sparað okkur heilmikinn tíma og vinnu. Eins og með flest tól þá helst útkoman í hendur við metnaðinn sem lagður er í verkið. Það getur tekið tíma og nokkrar ítranir að smíða gott ílag fyrir risamállíkan. Eftir því sem við notum tæknina meira lærum við að þekkja takmarkanir hennar og að leggja betur mat á hvers konar verkefni henta henni.
Hjá Miðeind notum við spunagreind í ýmislegt og sumar af vörunum okkar innihalda virkni sem er undirbyggð af risamállíkani. Þegar við ákveðum að hagnýta spunagreind í vöruþróun höfum við það alltaf að leiðarljósi að nota hana á ábyrgan hátt og til góðra verka. Ef hægt er að leysa verkefni vel með minna og liprara mállíkani kjósum við að fara þá leið. Það er nefnilega vert að minnast á að þótt mörgum sé orðið tamt að tala um gervigreindina með ákveðnum greini – og eru þá jafnan að vísa í spunagreindarlíkön á borð við GPT-5 eða Gemini – þá er gervigreind alls ekki eitthvað eitt fyrirbæri.
Allar helstu máltæknivörur Miðeindar byggja að einhverju leyti á gervigreind en í flestum tilfellum er um að ræða lítil líkön sem við höfum þjálfað frá grunni eða fínþjálfað. Vinsælasta varan okkar, Málfríður, er dæmi um hið fyrrnefnda en hún er þjálfuð á ýmsum opnum málheildum ásamt gögnum sem við höfum sjálf búið til. Að því sögðu þá er tilgangur og markmið Miðeindar að styðja við tungumálið okkar og tryggja að það sé áfram notað í öllum kimum samfélagsins. Til þess að sporna við því að enska taki yfir á sumum sviðum þá þarf máltækni fyrir íslensku einfaldlega að halda í við notkunarmöguleika á ensku. Og þar er spunagreindin sannarlega himnasending þegar hún er notuð á réttan hátt.
Í lokin er ekki úr vegi að velta fyrir sér svokallaðri þversögn Moravecs: verkefni sem reynast mannfólki erfið er auðvelt að kenna gervigreind, en hún á hins vegar í erfiðleikum með það sem okkur mönnunum finnst sjálfsagt og eðlilegt. Skapandi skrif, eins og jólabækur, krefjast ekki aðeins ritfærni heldur líka mannlegrar reynslu, líkamlegrar tilvistar, tilfinningalegrar dýptar og innsæis sem erfitt er að smíða úr gögnum. Það er sannfæring okkar hjá Miðeind að framtíðin felst ekki í því að velja á milli mannlegrar sköpunar og gervigreindar, heldur í samspili þar sem tæknin styður við sköpunargleðina án þess að troða henni um tær. Við höfum unnið ötullega að þessari framtíðarsýn í tíu ár og hlökkum til að sjá hvað næsti áratugur ber í skauti sér.
Ef þú vilt fylgjast með frekari verkefnum hjá Miðeind getum við látið þig vita þegar eitthvað nýtt er að frétta.