I detta avsnitt diskuterar Ken och Petter språkmodeller och ger exempel på deras märkliga beteenden. De utforskar hur språkmodeller reagerar på mänsklig interaktion, hur de kan manipuleras och de potentiella riskerna med alignment faking, där modeller döljer sina verkliga avsikter.
Genom exempel och insikter belyser de komplexiteten i AI:s interaktion med människor.