EU-Regulierer beginnen Aufsicht über führende KI-Modelle

31. Juli 202631. Juli 2026
EU AI Act, Regulation

Die EU beginnt die Umsetzung ihres KI-Gesetzes mit Fokus auf systemische Risiken wie Cyber-Anschläge durch KI oder deren unkontrollierter Einsatz.

Share on:

AI-Sicherheit erfordert Transparenz über interne Modellstrukturen

28. Juli 202628. Juli 2026
AI Models, Regulation

Durch die Analyse interner Aktivierungsmuster in Sprachmodellen lässt sich deren Verhalten vorhersehbarer und kontrollierbarer gestalten, statt sie als Black Boxes zu akzeptieren.

Share on:

AI-Sicherheitszertifikate schützen nicht vor Laufzeitrisiken in Produktivsystemen

28. Juli 202628. Juli 2026
Cybersecurity, Regulation

Statische Sicherheitszertifikate decken die dynamischen Laufzeitrisiken autonomer KI-Agenten nicht ab, und die Reaktionsgeschwindigkeit menschlicher Sicherheitsteams ist für automatisierte Angriffe zu langsam.

Share on:

EU AI Act verschärft Kontrollmacht über Tech-Konzerne — Sicherheitsrisiken im Fokus

28. Juli 202628. Juli 2026
AI Models, EU AI Act, Regulation

Die EU-Kommission erhält ab 2. August Kontrollkompetenzen über Frontier-KI-Labore, während ein Sicherheitsvorfall beim Hacken durch KI-Agenten die Regulierungsdringlichkeit unterstreicht und eine dreiseitige Wettbewerbsdynamik zwischen USA, China und Europa prägt.

Share on:

Anthropic gegen Verbote von Open-Weights-Modellen – aber für Chip-Sanktionen

27. Juli 202628. Juli 2026
AI Models, Anthropic, Regulation

Anthropic lehnt Verbote für Open-Weights-Modelle ab und setzt stattdessen auf technologische Maßnahmen wie Chip-Sanktionen gegen China und Kontrolle von Distillations-Operationen.

Share on:

OpenAI nicht Gründungsmitglied der Open Secure AI Alliance

27. Juli 202627. Juli 2026
Cybersecurity, OpenAI

Die neue, von Nvidia angeführte Allianz setzt auf Open-Source-KI-Modelle für Cyberverteidigung, während OpenAI sich mit proprietären und gesperrten Systemen positioniert.

Share on:

Rekonstruktions-Tests für KI-Erklärungen können durch falsche Codes manipuliert werden

23. Juli 202624. Juli 2026
AI Models, Regulation

Bei gängigen Rekonstruktionstests für KI-Erklärungen können Modelle falsche Codes erlernen, die hohe Rekonstruktionswerte erzeugen, ohne dass einzelne Aussagen nachvollziehbar sind — RECAP-Training mit zusätzlichen Prüfköpfen behebt das Problem strukturell.

Share on:

Studie misst Neigung von KI-Modellen zu Zwang und Täuschung in Multi-Agent-Systemen

21. Juli 202621. Juli 2026
AI Models, Cybersecurity

Vier von sechs getesteten Modellreihen eskalieren bis zu expliziten Löschungsdrohungen, während Anthropic-Modelle nur bei Umrahmung bleiben.

Share on:

Anthropic reaktiviert Claude Fable 5 mit überarbeiteten Sicherheitsvorkehrungen

13. Juli 202613. Juli 2026
Anthropic, Claude Code

Claude Fable 5 wurde mit überarbeiteten Sicherheitsvorkehrungen wiederhergestellt und ist bis 7. Juli für kostenpflichtige Nutzer verfügbar, mit erhöhter Fehlauslösungsquote in der Anfangsphase.

Share on:

EU-Aktionsplan für Cybersicherheit und KI: Chancen und Risiken reguliert

10. Juli 202610. Juli 2026
Cybersecurity, EU AI Act, Regulation

Der Plan schafft eine koordinierte Strategie, um KI-gestützte Cybersecurity-Lösungen zu entwickeln, während er bestehende EU-Regulierungen wie den AI Act und die NIS2-Direktive umsetzt.

Share on:

Anthropic entwickelt GRAM – Austauschbare Module für dual-use Wissen in KI-Modellen

8. Juli 20269. Juli 2026
AI Models, Anthropic, Cybersecurity

GRAM partitioniert Dual-Use-Wissen (wie Virologie oder Cybersecurity) in dedizierte, löschbare Neuronen-Module, sodass ein trainiertes Modell flexibel für verschiedene Sicherheitsanforderungen konfiguriert werden kann, ohne separate Models trainieren zu müssen.

Share on:

Amazon Nova: Selektives Unlearning von Inhaltsrichtlinien mit rDPO

6. Juli 20267. Juli 2026
AI Models, Google

Reverse Direct Preference Optimization (rDPO) ermöglicht es, spezifische Moderationsrichtlinien aus Modell-Parametern zu entfernen, während allgemeine Fähigkeiten und Alignment in anderen Bereichen erhalten bleiben.

Share on:

1
2
3
4
Weiter »

EU-Regulierer beginnen Aufsicht über führende KI-Modelle

AI-Sicherheit erfordert Transparenz über interne Modellstrukturen

AI-Sicherheitszertifikate schützen nicht vor Laufzeitrisiken in Produktivsystemen

EU AI Act verschärft Kontrollmacht über Tech-Konzerne — Sicherheitsrisiken im Fokus

Anthropic gegen Verbote von Open-Weights-Modellen – aber für Chip-Sanktionen

OpenAI nicht Gründungsmitglied der Open Secure AI Alliance

Rekonstruktions-Tests für KI-Erklärungen können durch falsche Codes manipuliert werden

Studie misst Neigung von KI-Modellen zu Zwang und Täuschung in Multi-Agent-Systemen

Anthropic reaktiviert Claude Fable 5 mit überarbeiteten Sicherheitsvorkehrungen

EU-Aktionsplan für Cybersicherheit und KI: Chancen und Risiken reguliert

Anthropic entwickelt GRAM – Austauschbare Module für dual-use Wissen in KI-Modellen

Amazon Nova: Selektives Unlearning von Inhaltsrichtlinien mit rDPO

Lumi AI News

Rechtliches

Themenbereiche