I detta avsnitt diskuterar Ken och Petter språkmodeller och ger exempel på deras märkliga beteenden. De utforskar hur språkmodeller reagerar på mänsklig interaktion, hur de kan manipuleras och de potentiella riskerna med alignment faking, där modeller döljer sina verkliga avsikter.
Genom exempel och insikter belyser de komplexiteten i AI:s interaktion med människor.
Fler avsnitt av 7 minuter AI
Visa alla avsnitt av 7 minuter AI7 minuter AI med Ken Larsson och Petter Jacobs finns tillgänglig på flera plattformar. Informationen på denna sida kommer från offentliga podd-flöden.
