Sveriges mest populära poddar
Microsoft Partnerpodden

Bästa AI-tjänsten på Azure du inte visste fanns

31 min30 september 2024
När man byggt och skalar AI-lösningar stöter man sannolikt på ett specifikt problem, nämligen att slå i taket för rate limits och hur många requests man kan göra under en viss tid. Ett sätt att hantera detta är att ha flera instanser av AI-modellerna och växla mellan dom. I det här avsnittet pratar jag med Simon Kurtz om hur GenAI Gateway för API Management kan hjälpa till på riktigt smarta sätt för att lastbalansera och minska antal tokens som behövs.

Hosted on Acast. See acast.com/privacy for more information.

Fler avsnitt av Microsoft Partnerpodden

Visa alla avsnitt av Microsoft Partnerpodden

Microsoft Partnerpodden med Microsoft finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.