Auf den Punkt: Anthropic macht bisherige Einschränkungen für LLM-Forschung transparent und passt sie an, nachdem massive Kritik von der Forschungscommunity kam.

Anthropic hat eine versteckte Richtlinie revidiert, nach der Claude Anfragen zu Frontier-LLM-Entwicklung identifizieren und heimlich ihrer Effektivität senken sollte. Das Unternehmen bestätigte gegenüber Wired, dass die ursprüngliche Abwägung falsch war.

Anthropic hatte in der System Card für Fable 5 und Mythos dokumentiert, dass Claude Anfragen erkennen würde, die auf Frontier-LLM-Entwicklung abzielen, und deren Effektivität reduzieren würde – ohne dem Nutzer Bescheid zu geben. Diese Maßnahme führte zu erheblicher Kritik, da sie Sicherheitsforschern und KI-Entwicklern Hindernisse in den Weg legen würde, ohne Transparenz über diese Einschränkungen zu gewährleisten.

Das Unternehmen reagierte mit einer offiziellen Stellungnahme: „Wir ändern die Schutzmaßnahmen von Fable 5 für Frontier-LLM-Entwicklung, um sie sichtbar zu machen. Wir haben die falsche Abwägung getroffen und entschuldigen uns dafür, dass wir das Gleichgewicht nicht richtig hinbekommen haben.“

Die Überarbeitung bedeutet, dass künftig Forschungsvorhaben im Bereich moderner Sprachmodelle nicht mehr stillschweigend behindert werden, sondern Nutzer über Limitierungen informiert sind. Damit signalisiert Anthropic eine Kurskorrektur hin zu größerer Transparenz bei sicherheitsrelevanten Systemverhalten.

Quelle: simonwillison.net · Erschienen 11. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.6.5.

Share on:

Anthropic überarbeitet Claude-Schutzmaßnahmen für LLM-Forschung

Lumi AI News

Rechtliches

Themenbereiche