Málgögn og gervigreind Steinþór Steingrímsson, Einar Freyr Sigurðsson og Helga Hilmisdóttir skrifa 7. október 2025 11:30 Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum. Viltu birta grein á Vísi? Sendu okkur póst. Senda grein Gervigreind Máltækni Íslensk tunga Mest lesið Gleðibankinn er tómur Jóna Hrönn Bolladóttir,Bjarni Karlsson Skoðun Ísland hafnar mótorhjólum Arnar Þór Hafsteinsson Skoðun Ísland úr Eurovision 2026 Sædís Ósk Arnbjargardóttir Skoðun Fokk jú Austurland Kristján Ingimarsson Skoðun Hver ber ábyrgð á Karlanetinu? Kjartan Ragnarsson,Védís Drótt Cortez Skoðun Þegar hjálpin verður fjarlæg – upplifun mín úr heilbrigðiskerfinu Elín A. Eyfjörð Ármannsdóttir Skoðun Þrjú tonn af sandi Guðmunda G. Guðmundsdóttir Skoðun Ríkisstjórnin svíkur öryrkja sem eru búsettir erlendis Jón Frímann Jónsson Skoðun Getur heilbrigðisþjónustu verið á heimsmælikvarða án nýrra krabbameinslyfja? Halla Þorvaldsdóttir Skoðun Ný þjóðaröryggisstefna Bandaríkjanna Arnór Sigurjónsson Skoðun Skoðun Skoðun Skamm! (-sýni) Kristján Fr. Friðbertsson skrifar Skoðun Fatlað fólk er miklu meira en tölur í excel skjali Ágústa Arna Sigurdórsdóttir skrifar Skoðun Hvað er að marka ríkisstjórn sem segir eitt en gerir annað? Jóhannes Þór Skúlason skrifar Skoðun Þegar fjárlögin vinna gegn markmiðinu Sigurður Ingi Jóhannsson skrifar Skoðun Ríkisstjórnin svíkur öryrkja sem eru búsettir erlendis Jón Frímann Jónsson skrifar Skoðun Getur heilbrigðisþjónustu verið á heimsmælikvarða án nýrra krabbameinslyfja? Halla Þorvaldsdóttir skrifar Skoðun Ísland hafnar mótorhjólum Arnar Þór Hafsteinsson skrifar Skoðun Skýrslufargan: mikið skrifað, lítið lesið og lítið gert Gunnar Salvarsson skrifar Skoðun Opið bréf til heilbrigðisráðherra: Brýn þörf á heildstæðum lausnum fyrir heilbrigðisþjónustu á Norðurlandi Sunna Hlín Jóhannesdóttir skrifar Skoðun Álafosskvos – verndarsvæði í byggð Regína Ásvaldsdóttir skrifar Skoðun Þrjú tonn af sandi Guðmunda G. Guðmundsdóttir skrifar Skoðun Ísland úr Eurovision 2026 Sædís Ósk Arnbjargardóttir skrifar Skoðun Fokk jú Austurland Kristján Ingimarsson skrifar Skoðun Ný þjóðaröryggisstefna Bandaríkjanna Arnór Sigurjónsson skrifar Skoðun Gleðibankinn er tómur Jóna Hrönn Bolladóttir,Bjarni Karlsson skrifar Skoðun Þegar hjálpin verður fjarlæg – upplifun mín úr heilbrigðiskerfinu Elín A. Eyfjörð Ármannsdóttir skrifar Skoðun Hver ber ábyrgð á Karlanetinu? Kjartan Ragnarsson,Védís Drótt Cortez skrifar Skoðun Biðsalur dauðans eða aftökustaður á heiði? Davíð Bergmann skrifar Skoðun ,,Friðardúfan“ Pútín Gunnar Hólmsteinn Ársælsson skrifar Skoðun Nýsköpunarátak fyrir framtíð Íslands Þórarinn Ingi Pétursson skrifar Skoðun Það sem við skuldum hvort öðru Jónas Már Torfason skrifar Skoðun Fjárfestum í mannréttindafræðslu Vala Karen Viðarsdóttir,Pétur Hjörvar Þorkelsson skrifar Skoðun Sakavottorðið og ég Sigurður Árni Reynisson skrifar Skoðun Stór orð – litlar efndir Bryndís Haraldsdóttir skrifar Skoðun Skattlagning mótorhjóla: Órökstudd gjaldtaka sem skapar ranglæti og hvetur til undanskota Gunnlaugur Karlsson skrifar Skoðun Netið er ekki öruggt Sunna Elvira Þorkelsdóttir skrifar Skoðun Meirihluti bæjarstjórnar Hafnarfjarðar á villigötum Stefán Már Gunnlaugsson skrifar Skoðun Valkvæð tilvitnun í Feneyjanefndina Hjörtur J Guðmundsson skrifar Skoðun Mótorhjólin úti – Fjórhjólin inni Njáll Gunnlaugsson skrifar Skoðun Læknar eru lífsbjörg: Tryggjum sérnám þeirra Halla Hrund Logadóttir skrifar Sjá meira
Texti og önnur gögn sem geyma upplýsingar um tungumálið eru lykillinn að þróun gervigreindarforrita á borð við ChatGPT, Claude og Gemini. Forritin byggja á mállíkönum sem eru mótuð með greiningu á textagögnum með það markmið að geta líkt eftir tungumálinu og myndað þannig læsilegan texta á öllum þeim málum sem það hefur „séð“ nógu mikið af. Langstærstur hluti þeirra texta sem líkönunum eru sýndir er á ensku. Flest stærstu mállíkönin eru þó fjöltyngd að því leyti að þau geta myndað texta á mörgum tungumálum. Bestu niðurstöðurnar sem fást úr líkönunum eru á málum sem mjög margir tala en tungumál sem færri tala standa ekki eins vel að vígi. Á alþjóðlegum fundi stjórnmálaleiðtoga, fræðimanna og fulltrúa tæknifyrirtækja um gervigreind í febrúar fyrr á þessu ári kom það fram að bæta þyrfti samkeppnisstöðu Evrópu. Meðal annars var rætt um mikilvægi þess að hlúa að þeim fjölmörgu tungumálum sem töluð eru í álfunni. Lykilatriði er að afla nægilegra gagna og vinna úr þeim svo að þau geti nýst til að búa til gervigreindarlíkön sem geta unnið með öll þessi tungumál. Liður í því er verkefnið European Language Data Space sem framkvæmdastjórn Evrópusambandsins hefur sett á laggirnar. Þar geta eigendur gagna og rétthafar samið um notkun við þá sem vilja nýta þau. Árnastofnun hefur verið leiðandi í því að búa til og safna málgögnum á íslensku með það að markmiði að tryggja stöðu íslensku í tækniheiminum. Fimmtudaginn 9. október stendur Árnastofnun fyrir málþingi í samvinnu við framkvæmdastjórn Evrópusambandsins um European Language Data Space-verkefnið. Á málþinginu, Hagnýting málgagna með Language Data Space, tala íslenskir og erlendir sérfræðingar um markmiðið með verkefninu, markað fyrir málgögn og mikilvægi þeirra. Þá verða pallborðsumræður um málgögn, máltækni og gervigreind fyrir íslensku, og hvort og þá hvernig hægt sé að ná sátt um nýtingu textagagna við þróun gervigreindarlíkana. Málþingið er opið öllum áhugasömum og upplýsingar um skráningu má finna á vef Árnastofnunar, arnastofnun.is. Höfundar eru fræðimenn við Stofnun Árna Magnússonar í íslenskum fræðum.
Þegar hjálpin verður fjarlæg – upplifun mín úr heilbrigðiskerfinu Elín A. Eyfjörð Ármannsdóttir Skoðun
Getur heilbrigðisþjónustu verið á heimsmælikvarða án nýrra krabbameinslyfja? Halla Þorvaldsdóttir Skoðun
Skoðun Getur heilbrigðisþjónustu verið á heimsmælikvarða án nýrra krabbameinslyfja? Halla Þorvaldsdóttir skrifar
Skoðun Opið bréf til heilbrigðisráðherra: Brýn þörf á heildstæðum lausnum fyrir heilbrigðisþjónustu á Norðurlandi Sunna Hlín Jóhannesdóttir skrifar
Skoðun Þegar hjálpin verður fjarlæg – upplifun mín úr heilbrigðiskerfinu Elín A. Eyfjörð Ármannsdóttir skrifar
Skoðun Skattlagning mótorhjóla: Órökstudd gjaldtaka sem skapar ranglæti og hvetur til undanskota Gunnlaugur Karlsson skrifar
Þegar hjálpin verður fjarlæg – upplifun mín úr heilbrigðiskerfinu Elín A. Eyfjörð Ármannsdóttir Skoðun
Getur heilbrigðisþjónustu verið á heimsmælikvarða án nýrra krabbameinslyfja? Halla Þorvaldsdóttir Skoðun