Anthropic macht verdeckte Anfrage-Drosselungen in Claude künftig transparent, behält aber die inhaltlichen Beschränkungen bei – auch wegen Konflikten mit dem US-Verteidigungsministerium um nationale Sicherheit.
DXC wird Claude durch 95%+ der Softwareentwicklung bei seiner neuen OASIS-Plattform bereits erfolgreich produktiv einsetzen und jetzt auch bei Kunden in versicherten, modernen und cybersicherheit-kritischen Umgebungen ausrollen.
Der Sicherheitsfilter von Claude 3.5 Sonnet blockiert auch legitime Sicherheitsanfragen, was die Nutzbarkeit für CTOs bei Security-Audits und Vulnerability-Assessments einschränkt.
Claude Fable 5 ermöglicht keine Zero-Data-Retention-Verträge und speichert alle Prompts und Outputs 30 Tage lang zu Sicherheitszwecken, auch wenn Unternehmen mit älteren Claude-Modellen ZDR-Vereinbarungen abgeschlossen haben.
Anthropic fordert eine Luftfahrtaufsicht ähnliche Regulierungsbehörde oder beauftragte private Prüfer, um KI-Modelle vor ihrer Freigabe auf kritische Risiken zu untersuchen.
KI-Systeme erfordern wegen ihrer probabilistischen Natur völlig neue Red-Teaming-Ansätze, die sich grundlegend von klassischer Penetrationstestung unterscheiden.
Anthropic trennt Claude Fable 5 in eine öffentliche (mit Safeguards) und eine restriktive Version (Claude Mythos 5 ohne Sicherheitsschichten) für verifizierten Cybersecurity-Experten.