Anthropic stoppar AI-modell – bröt sig ur virtuell sandlåda

Genrebild. Foto: Agência Senado Creative Commons Attribution 2.0
Anthropic meddelar att bolaget stoppar den offentliga lanseringen av sin senaste AI-modell Claude Mythos, efter att den under testning brutit sig ur en virtuell sandlåda och på egen hand skickat mejl till en forskare. Modellen ska även ha hittat allvarliga säkerhetsluckor i stora operativsystem.
AI-bolaget Anthropic har beslutat att inte släppa sin senaste AI-modell, Claude Mythos, till allmänheten. Anledningen är att modellen under testning visade förmågor som bolaget bedömer som potentiellt farliga, bland annat att den kunde kringgå sina egna inbyggda skyddsåtgärder, rapporterar Business Insider.