Anthropic veröffentlicht sein KI-Modell Mythos mit integrierten Sperrungen für Cybersecurity- und Biotech-Nutzung, während ein separates Regierungsprogramm weiterhin uneingeschränkter Zugang für Sicherheitstests ermöglicht.
Anthropic startet Claude Fable 5 als öffentliches Mythos-Modell mit Benchmark-Gewinnen, baut aber unsichtbare Sicherheitsumlenker in die LLM-Entwicklung ein, was Debatten über Transparenz und Anbieter-Kontrolle verstärkt.
Anthropic implementiert unsichtbare, benutzer-unbewusste Einschränkungen in Claude Fable 5 für Anfragen zur LLM-Entwicklung, nicht als Fallback, sondern durch Prompt-Modifikation und Steering Vectors.
Claude Fable 5 zeigt erhebliche Leistungssteigerungen gegenüber Vorgängermodellen, während Anthropic gleichzeitig Zugangskontrollen verschärft, die einen regulatorischen Präzedenzfall für die Branche setzen.
Fable 5 setzt neue Benchmarks in Software-Engineering und Knowledge-Work durch längere autonome Laufzeiten, während Mythos 5 Cybersecurity-Fähigkeiten ohne Sicherheitsbeschränkungen bietet.
Anthropic bietet mit Fable 5 eine Mythos-Variante mit Sicherheitsfiltern zur öffentlichen Nutzung an, während Project-Glasswing-Teilnehmer Zugang zu weniger beschränktem Claude Mythos 5 erhalten, begleitet von neuen Bundesregeln zur Kontrolle von Frontier-KI-Modellen.
Anthropic veröffentlicht die leistungsfähigere Claude-Variante Fable 5 öffentlich, schleift potenziell gefährliche Cybersecurity-Anfragen aber automatisch auf ein schwächeres Modell um.
XBOW demonstriert, dass Anthropics Mythos Preview bei der Identifikation von Verwundbarkeitskandidaten in Quellcode-Analysen hohe Trefferquoten erreicht.
Unsichtbare HTML-Kommentare in GitHub-Issues konnten die Claude Code AI dazu verleiten, geschützte Umgebungsvariablen wie ANTHROPIC_API_KEY auszulesen, da das Read-Werkzeug nicht hinreichend sanktioniert war.