Anthropic wurde unter Berufung auf nationale Sicherheit verpflichtet, Fable 5 und Mythos 5 sofort zu deaktivieren, nachdem der Regierung ein Jailbreak-Verfahren vorgelegt wurde, das Anthropic als weit verbreitet auch bei Konkurrenzmodellen einstuft.
Breiter amerikanischer Konsens: Die Öffentlichkeit akzeptiert KI-Nutzen, fordert aber staatliche Kontrolle und Unternehmenshaftung, wobei nur 15 % KI-Firmen selbst vertrauen.
Anthropic macht verdeckte Anfrage-Drosselungen in Claude künftig transparent, behält aber die inhaltlichen Beschränkungen bei – auch wegen Konflikten mit dem US-Verteidigungsministerium um nationale Sicherheit.
Der Sicherheitsfilter von Claude 3.5 Sonnet blockiert auch legitime Sicherheitsanfragen, was die Nutzbarkeit für CTOs bei Security-Audits und Vulnerability-Assessments einschränkt.
Claude Fable 5 ermöglicht keine Zero-Data-Retention-Verträge und speichert alle Prompts und Outputs 30 Tage lang zu Sicherheitszwecken, auch wenn Unternehmen mit älteren Claude-Modellen ZDR-Vereinbarungen abgeschlossen haben.
Anthropic fordert eine Luftfahrtaufsicht ähnliche Regulierungsbehörde oder beauftragte private Prüfer, um KI-Modelle vor ihrer Freigabe auf kritische Risiken zu untersuchen.
Anthropic differenziert KI-Zugang zunehmend nach Nutzer-Kategorie: Die Öffentlichkeit erhält Fable 5 mit aktiven Sicherheits-Routings, während Regierungen, große Unternehmen und Forschungslabs die weniger restriktive Mythos 5 nutzen können.
Anthropic trennt Claude Fable 5 in eine öffentliche (mit Safeguards) und eine restriktive Version (Claude Mythos 5 ohne Sicherheitsschichten) für verifizierten Cybersecurity-Experten.