Jailbreak – Lumi AI News

Anthropic-Forscher demonstrieren Sicherheitslücke in Claude durch einfache Prompts

16. Juni 202616. Juni 2026
Anthropic, Claude AI, Cybersecurity

Share on:

Claude 3.5 Sonnet lässt sich durch einfache Prompts zum Beheben von Code-Fehlern manipulieren und hebelt dabei seine eigenen Sicherheitsrichtlinien aus.

Share on:

White House testet Anthropic-Modell Fable mit absichtlich unsicherem Code

16. Juni 202616. Juni 2026
Anthropic, Claude AI, Cybersecurity

Share on:

Anthropics Modell Fable verweigerte eine direkte Sicherheitsprüfung von unsicherem Code, führte aber eine Korrektur durch – ein Verhalten, das Experten als gewollte Sicherheitsfunktion einordnen.

Share on:

Anthropic-Forscher demonstrieren Sicherheitslücke in Claude durch einfache Prompts

White House testet Anthropic-Modell Fable mit absichtlich unsicherem Code

Lumi AI News

Rechtliches

Themenbereiche