Rannsóknir og tækni

Miðeind hefur frá fyrstu tíð unnið jöfnum höndum að hugbúnaðargerð og rannsóknum á sviði máltækni og gervigreindar. Eftir starfsfólk Miðeindar liggur fjöldi ritrýndra fræðigreina. Finna má yfirlit yfir þær hér neðst á síðunni.

Miðeind hefur einnig gefið út fjölda opinna hugbúnaðarpakka, sem finna má á GitHub.

Miðeind er annt um stöðu íslenskunnar í gervigreindartækni og hefur við góðan orðstír haldið úti stigatöflu yfir íslenskugetu  risamállíkana á Hugging Face. Stigataflan byggir að miklu leyti á okkar eigin mæliprófum en nánar má lesa um hana hér.

Styrkir og viðurkenningar

Miðeind var einn af framkvæmdaraðilum Máltækniáætlunar I (2019-2022) og kom þar að þróun kjarnalausna á sviði vélþýðinga, málrýni og grunnverkfæra.

Miðeind hefur hlotið fjölmarga styrki úr samkeppnissjóðum til rannsókna, þróunar og innleiðingar á máltæknilausnum, svo sem frá Tækniþróunarsjóði, Markáætlun í tungu og tækni, Fléttunni, Skerfi og Horizon Europe – rannsóknaáætlun Evrópusambandsins. 

Miðeind var handhafi UT-verðlauna Ský, heiðursverðlauna fyrir framúrskarandi framlag til upplýsingatækni á Íslandi, árið 2024. 

Samstarf

Ertu nemandi í leit að lokaverkefni eða sumarstarfi? Við erum frjó og full af hugmyndum en náum ekki að sinna öllu sem við gjarnan vildum. Við erum samvinnufús og erum til í samstarf eða ráðgjöf.

Fræðigreinar

Svanhvít Lilja Ingólfsdóttir, Haukur Jónsson, Kári Steinn Aðalsteinsson, Róbert Fjölnir Birkisson, Sveinbjörn Þórðarson og Þorvaldur Páll Helgason. (2025). Miðeind at WMT25 General Machine Translation Task. Proceedings of the Tenth Conference on Machine Translation, bls. 577–582. Suzhou, Kína.


Þórunn Arnardóttir, Elías Bjartur Einarsson, Garðar Ingvarsson Juto, Þorvaldur Páll Helgason, and Hafsteinn Einarsson. (2025). WikiQA-IS: Assisted Benchmark Generation and Automated Evaluation of Icelandic Cultural Knowledge in LLMs. Proceedings of the Third Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL-2025), bls. 64–73. Tallinn, Estonia. University of Tartu Library, Estonia.


Þórunn Arnardóttir, Svanhvít Lilja Ingólfsdóttir, Haukur Barri Símonarson, Hafsteinn Einarsson, Anton Karl Ingason og Vilhjálmur Þorsteinsson. (2024). Beyond Error Categories: A Contextual Approach of Evaluating Emerging Spell and Grammar Checkers. Proceedings of the 3rd Annual Meeting of the Special Interest Group on Under-resourced Languages@LREC-COLING 24, bls. 45-52.


Svanhvít Lilja Ingólfsdóttir, Pétur Orri Ragnarsson, Haukur Páll Jónsson, Haukur Barri Símonarson, Vilhjálmur Þorsteinsson og Vésteinn Snæbjarnarson. (2023). Byte-Level Grammatical Error Correction Using Synthetic and Curated Corpora. Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics Volume 1: Long Papers, bls. 7299–7316.


Hulda Óladóttir, Þórunn Arnardóttir, Anton Karl Ingason og Vilhjálmur Þorsteinsson. (2022). Developing a Spell and Grammar Checker for Icelandic Using an Error Corpus. Proceedings of the Thirteenth Language Resources and Evaluation Conference, bls. 4644-4653.


Vésteinn Snæbjarnarson og Hafsteinn Einarsson. (2022). Cross-Lingual QA as a Stepping Stone for Monolingual Open QA in Icelandic. arXiv forprentun arXiv:2207.01918.


Vésteinn Snæbjarnarson og Hafsteinn Einarsson. (2022). Natural questions in Icelandic. Proceedings of the Thirteenth Language Resources and Evaluation Conference, bls. 4488-4496.


Vésteinn Snæbjarnarson, Haukur Barri Símonarson, Pétur Orri Ragnarsson, Svanhvít Lilja Ingólfsdóttir, Haukur Páll Jónsson, Vilhjálmur Þorsteinsson og Hafsteinn Einarsson. (2022). A Warm Start and a Clean Crawled Corpus - A Recipe for Good Language Models. arXiv forprentun arXiv:2201.05601.


Anna Björk Nikulásdóttir, Þórunn Arnardóttir, Jón Guðnason, Þorsteinn Daði Gunnarsson, Anton Karl Ingason, Haukur Páll Jónsson, Hrafn Loftsson, Hulda Óladóttir, Einar Freyr Sigurðsson, Atli Þór Sigurgeirsson, Vésteinn Snæbjarnarson og Steinþór Steingrímsson. (2021). Help yourself from the Buffet: National Language Technology Infrastructure Initiative on CLARIN-IS. CLARIN Annual Conference 2021 (rafrænn viðburður).


Haukur Barri Símonarson, Vésteinn Snæbjarnarson, Pétur Orri Ragnarsson, Haukur Páll Jónsson, og Vilhjálmur Þorsteinsson. (2021). Miðeind's WMT 2021 submission. arXiv forprentun arXiv:2109.07343.


Haukur Barri Símonarson og Vésteinn Snæbjarnarson. (2021). Icelandic Parallel Abstracts Corpus. arXiv forprentun arXiv:2108.05289.Vilhjálmur Þorsteinsson, Hulda Óladóttir og Hrafn Loftsson. (2019). A Wide-Coverage Context-Free Grammar for Icelandic and an Accompanying Parsing System. Proceedings of Recent Advances in Natural Language Processing (RANLP 2019). Varna, Búlgaría.


Haukur Páll Jónsson, Haukur Barri Símonarson, Vésteinn Snæbjarnarson, Steinþór Steingrímsson og Hrafn Loftsson. (2020). Experimenting with Different Machine Translation Models in Medium-Resource Settings. 23rd International Conference on Text, Speech and Dialogue (TSD 2020). Brno, Tékkland.