Auf den Punkt: Anthropic veröffentlicht die leistungsfähigere Claude-Variante Fable 5 öffentlich, schleift potenziell gefährliche Cybersecurity-Anfragen aber automatisch auf ein schwächeres Modell um.
Anthropic hat zwei neue Modelle auf Basis seiner Mythos-Architektur vorgestellt: Claude Fable 5 wird öffentlich verfügbar gemacht, während Claude Mythos 5 auf rund 150 ausgewählte Cybersecurity- und Infrastruktur-Partner beschränkt bleibt. Fable 5 soll die bisher fähigste öffentlich zugängliche Claude-Version sein, enthält aber Schutzmaßnahmen gegen Missbrauch für offensive Cyberoperationen.
Anthropic beschreibt Fable 5 als seine bislang leistungsfähigste öffentlich verfügbare Variante. Das Modell übertrifft frühere Claude-Versionen in Software-Engineering, wissenschaftlicher Forschung, Bildverarbeitung und komplexen Knowledge-Work-Aufgaben. Der Leistungsvorteil wächst mit der Komplexität und Länge der Aufgaben, was Nutzern ermöglicht, umfangreichere Projekte mit weniger direkter Überwachung zu delegieren.
Das Mythos-Modell war im April mit Zugang für etwa 50 Empfänger eingeführt worden, da seine Fähigkeiten in Vulnerability-Discovery und offensiven Cyberoperationen Sicherheitsbedenken aufwarfen. Diesen Zugang hat Anthropic jetzt auf 150 Organisationen erweitert. Um Fable 5 breiter verfügbar zu machen, ohne Missbrauchsrisiken einzugehen, nutzt Anthropic Sicherheitsklassifizierer. Sie leiten Anfragen aus definierten Kategorien — Cybersecurity, Biologie, Chemie und Model-Distillation — automatisch auf das schwächere Modell Claude Opus 4.8 um. Laut Anthropic tritt dies in weniger als 5 Prozent der Sessions auf.
Erste Tests durch Security-Researcher deuten jedoch darauf hin, dass die Cyber-Schutzmaßnahmen breiter greifen als beschrieben. Rob T. Lee, Chief AI Officer am SANS Institute, berichtet, dass Routineaufgaben zu Incident Response, Detection und forensischen Workflows während seiner Tests zu Opus 4.8 weitergeleitet wurden. Das könnte bedeuten, dass die Klassifizierer pauschal Cybersecurity-Anfragen identifizieren, statt zwischen benignen und bösartigen Aktivitäten zu unterscheiden.
Anthropic bezeichnet die Vorkehrungen bewusst als konservativ gehalten. Das Unternehmen hat sich entschieden, Sicherheit über Nutzbarkeit zu priorisieren, während es das System weiter verfeinert. Umfangreiche interne und externe Tests hätten keine konsistent wirksamen Jailbreak-Methoden aufgedeckt, mit denen sich die Schutzmaßnahmen systematisch umgehen ließen.
Quelle: www.csoonline.com · Erschienen 9. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.6.5.