Leonora Vesterbacka är team lead för AI-arbetet på KB-labb, en del av Kungliga biblioteket. Med en Ph.D. i fysik och en bakgrund inom forskningsdata från institutioner som CERN, har hennes fokus idag skiftat till språkdata och AI-modeller för svenska. På KB-labb har hennes team under de senaste åren arbetat med att finjustera den populära tal-till-text-modellen Whisper. Den nya versionen, som tränats på en omfattande mängd svenskt tal och lanserades i februari 2025.
- Hur används transkriberingsmodeller, och varför är de så viktiga?
- Vilken roll kan Sverige spela i den globala AI-utvecklingen?
- Hur går finjusteringen av en AI-modell till i praktiken och var hittar man 50 000 timmar taldata för detta?
DETTA AVSNITT ÄR ENDAST TRANSKRIBERAT AV KB-WHISPER PÅ YOUTUBE
(00:00) - Introduktion
(00:53) - Välkommen och KB-lab
(04:10) - Hur började Leonoras AI-resa?
(08:30) - Språkmodells-projekt på KB-lab
(12:25) - Sveriges nya tal-till-text-modell (KB-Whisper)
(18:10) - Vad kommer datan ifrån?
(20:30) - Vad innebär att träna och jämförelse med Wave2Vec
(22:05) - Förberedelse av data
(27:00) - Hur jobbade ni med dialekter?
(30:20) - Vilka varianter finns det?
(32:40) - Största utmaningarna
(36:05) - AI-kommissionens rekommenderingar
(40:35) - Nästa projekt?
(43:30) - AI-Dilemma: Lögndetektorn
(45:45) - AI för en ljusare framtid?
(50:50) - Tack och hejdå!
Savantics Hemsida: https://www.savantic.se/
Apple Podcasts: https://podcasts.apple.com/no/podcast/en-ai-till-kaffet/id1706391795
Spotify:https://open.spotify.com/show/7fgcJR0gDwOOT57ys3xATI
YouTube:https://youtube.com/playlist?list=PLQVG3fdQDT607rDISH_O_xggFyuSCk2Kw&si=D0RJMoKYGG2AMeum
Google Podcasts: https://podcasts.google.com/feed/aHR0cHM6Ly9mZWVkcy5idXp6c3Byb3V0LmNvbS8yMjQ0NDMxLnJzcw==
#podcast #AI #EnAItillKaffet #ArtificiellIntelligens #Savantic #ChatGPT #OpenAI #Whisper #Wave2Wec #OpenSource #Data #CERN #Radio #SVT #Datascience
Fler avsnitt av En AI till Kaffet
Visa alla avsnitt av En AI till KaffetEn AI till Kaffet med Savantic AI Lab finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.
