I avsnitt 153 pratar Erik och Dick om hur man bygger och kvalitetssäkrar AI-agenter. Med exempel på hur chatbotar kan “luras” går de igenom vad evaluations (evals) är, hur LLM-as-a-judge fungerar och hur företag använder detta för att förbättra sina AI-system över tid. De diskuterar också feedbackloopar, skillnaden mellan offline och online-utvärdering samt varför human in the loop fortfarande är avgörande. Ett avsnitt för dig som vill förstå hur AI-produkter fungerar bakom kulisserna
Fler avsnitt av Agilpodden
Visa alla avsnitt av AgilpoddenAgilpodden med Erik Hultgren och Dick Lyhammar finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.
