Mehrsprachigkeit offenbart Sicherheitslücken in europäischen KI-Systemen

24. Juli 202624. Juli 2026
AI Models, Cybersecurity

KI-Sicherheitsmechanismen schützen in nicht-englischen Sprachen schwächer vor Jailbreaking, was in mehrsprachigen europäischen Umgebungen zu erhöhten Risiken führt.

Share on:

SafePyramid: Benchmark zeigt Schwächen von LLM-Guardrails bei kontextabhängigen Richtlinien

30. Juni 20264. Juli 2026
AI Models, Cybersecurity

Selbst GPT-4.5 erkennt bei kontextabhängigen Sicherheitsrichtlinien vollständig kritische Regelkonfigurationen nur in 54% der einfachen, 35% der mittleren und 13% der komplexen Fälle.

Share on:

KI-Sicherheitssysteme als DoS-Ziel: Poisoned Documents lahmen Guardrails

15. Juni 20264. Juli 2026
AI Models, Cybersecurity

Vergiftete Dokumente können Reasoning-basierte KI-Guardrails zu DoS-Waffen machen, indem sie Sicherheitssysteme selbst als Ressourcensenke nutzen – ein neuer Angriffsvektor mit Konzentrationrisiken in gemeinsamer Governance-Infrastruktur.

Share on:

Heretic: Tool entfernt KI-Sicherheitsbarrieren in wenigen Minuten

2. Juni 20262. Juni 2026
AI Models, Cybersecurity, EU AI Act

Mit dem Tool Heretic können Sicherheitsfilter aus Open-Source-KI-Modellen in Minuten entfernt werden – ein strukturelles Kontrollrisiko, das bisherige Compliance-Strukturen bei lokal betriebenen Modellen untergräbt.

Share on:

Mehrsprachigkeit offenbart Sicherheitslücken in europäischen KI-Systemen

SafePyramid: Benchmark zeigt Schwächen von LLM-Guardrails bei kontextabhängigen Richtlinien

KI-Sicherheitssysteme als DoS-Ziel: Poisoned Documents lahmen Guardrails

Heretic: Tool entfernt KI-Sicherheitsbarrieren in wenigen Minuten

Lumi AI News

Rechtliches

Themenbereiche