Sveriges mest populära poddar
Verbos: AI og Softwareudvikling

#43 - Dan Saattrup Nielsen: ScandEval og Evaluering af Sprogmodeller

1 tim 18 min14 februari 2024

Hvilke teknikker findes der til at teste sprogmodellers evne til at forstå sprog? Er de åbne engelske og multilingvale modeller gode på de skandinaviske sprog? Eller bør vi yde en indsats i de nordiske lande for at få sprogmodellerne up to speed med at forstå f.eks. dansk? Dan Saattrup Nielsen har udviklet ScandEval, et framework til evaluering af nordiske sprogmodeller. Han ved virkelig meget om evaluering af sprogmodeller, og i dette afsnit af Verbos fortæller han netop om dette!


ScandEval GitHub: https://github.com/ScandEval/ScandEval

ScandEval NLG Leaderboard: https://scandeval.com/mainland-scandinavian-nlg/

ScandEval NLU Leaderboard: https://scandeval.com/mainland-scandinavian-nlu/

Fler avsnitt av Verbos: AI og Softwareudvikling

Visa alla avsnitt av Verbos: AI og Softwareudvikling

Verbos: AI og Softwareudvikling med Kasper Junge og Jonas Høgh Kyhse-Andersen finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.