Allt þetta hófst með heimsókn Guðna Th. Jóhannessonar, forseta Íslands, og sendinefndar í höfuðstöðvar OpenAI í San Fransisco í maí síðastliðnum. Fyrsti áfangi samstarfsverkefnisins sneri að því að kenna fyrri kynslóð GPT mállíkansins íslensku (svokölluð „fínþjálfun“) og að meta hversu mikið af textagögnum þyrfti til að ná því markmiði.
Þegar undirbúningur fyrir nýja kynslóð GPT líkansins fór á skrið, GPT-4, leitaði OpenAI til Miðeindar um að taka þátt í þjálfun þess. Nýja líkanið verður mun stærra og öflugra en fyrirrennarinn.
Miðeind safnaði í hóp fjörutíu sjálfboðaliðum sem fengu það verkefni að undirbúa spurningar og fleiri verkefni á íslensku fyrir GPT-4. Síðan meta sjálfboðaliðarnir svör líkansins, gefa því einkunnir og kenna þvi hvernig það gæti svarað enn betur.
„Það hefur verið afskaplega skemmtilegt að vinna með OpenAI í þessu spennandi verkefni. Maður hefur eiginlega þurft að klípa sig í handlegginn nokkrum sinnum til að minna sig á að við séum raunverulega að þjálfa næstu kynslóð gervigreindarlíkansins GPT-4 fyrir íslensku, eitt tungumála utan ensku,“ er haft eftir Vilhjálmi Þorsteinssyni, framkvæmdastjóra Miðeindar, í tilkynningu.
Lilja Alfreðsdóttir, menningar- og viðskiptaráðherra, segir þetta vera frábæran áfanga fyrir íslenska tungu og þetta sé til vitnis um þá mögunuðu vinnu sem unnin hefur verið innan máltækniáætlunarinnar.

„Ör þróun gervigreindartækni er mikilvæg fyrir tungumál eins og íslensku, þar felast mörg sóknarfæri sem flest eru ókönnuð – en við fáum þar ákveðið forskot með þessu samstarfi. Við viljum að framtíðin svari okkur á íslensku, og með gervigreindinni aukast möguleikarnir á því. Samvinnan skilar okkur árangri,“ er haft eftir Lilju.
Eitt vinsælasta gervigreindarlausn heims, ChatGPT, er gert af OpenAI og hefur slegið í gegn hjá milljónum notenda. Hægt er að spreyta sig á því að ræða við gervigreindina á íslensku, með misjöfnum árangri líkt og sjá má í Ísland í dag klippunni hér fyrir neðan.