Sveriges mest populära poddar

153. Kan man lura AI? – Evaluations och LLM-as-a-judge

38 min•5 maj 2026

I avsnitt 153 pratar Erik och Dick om hur man bygger och kvalitetssäkrar AI-agenter. Med exempel på hur chatbotar kan “luras” går de igenom vad evaluations (evals) är, hur LLM-as-a-judge fungerar och hur företag använder detta för att förbättra sina AI-system över tid. De diskuterar också feedbackloopar, skillnaden mellan offline och online-utvärdering samt varför human in the loop fortfarande är avgörande. Ett avsnitt för dig som vill förstå hur AI-produkter fungerar bakom kulisserna

Fler avsnitt av Agilpodden

152. Agil AI-organisationsdesign

20 apr.•32 min

151. Dumhetsparadoxen – varför smarta organisationer gör så dumma saker

2 apr.•52 min

150. Berget AI med Christian Landgren

2 mars•1 tim 14 min

149. Agila AI-agenterna - OpenClaw

12 feb.•26 min

148. Agila året 2026 & Claude

4 feb.•41 min

147. Alla bolag måste bli mjukvarubolag med Peter Arrhenius

16 dec. 2025•59 min

146. AI-hypen synad i sömmarna – med Pontus Wärnestål

1 dec. 2025•52 min

145. Transformation till produktorganisation

13 nov. 2025•43 min

144. Kommer jobben försvinna med AI?

23 okt. 2025•30 min

143. AI: hype, slop och verkligt värde

1 okt. 2025•44 min

Agilpodden med Erik Hultgren och Dick Lyhammar finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.