EU-Mitgliedstaaten etablieren KI-Regulatorische Sandboxes nach EU-KI-Gesetz
Die EU-Mitgliedstaaten müssen bis August 2026 KI-Regulatorische Sandboxes etablieren. Diese kontrollierten Umgebungen fördern Innovation, verbessern Rechtssicherheit und erleichtern KMU und Startups den Marktzugang. Die Umsetzungsansätze variieren erheblich zwischen den Ländern, von operationalen Sy
Leitlinien für GPAI-Modelle: Definitionen und Anforderungen der EU
Die Kommission setzt eine Rechenleistungsschwelle von 10²³ FLOPs für GPAI-Modelle fest, während Modelle ab 10²⁵ FLOPs als Systeme mit Systemrisiko gelten und umfassende Risikobewertungen sowie Benachrichtigungen innerhalb von zwei Wochen erfordern. Anbieter müssen Dokumentation pflegen, Trainingsdat
Cyber Resilience Act: Neue EU-Sicherheitsstandards für digitale Produkte
Die CRA tritt am 11. Dezember 2024 in Kraft. Ab 11. Dezember 2027 müssen alle neuen Produkte die CRA-Anforderungen erfüllen. Hersteller müssen Risiken bewerten, Schwachstellen beheben und regelmäßig Sicherheitsupdates bereitstellen. Ab 11. September 2026 müssen Schwachstellen und Sicherheitsvorfälle
Natürliche Sprach-Autoencodierer: Claudias Gedanken lesbar machen
Anthropic stellt Natural Language Autoencodierer vor, die Claudias interne Aktivierungen in lesbare Texterklärungen umwandeln. Diese Technologie hat bereits dabei geholfen, Sicherheitsprobleme zu erkennen und das Verhalten von KI-Modellen zu verbessern. Die Methode nutzt zwei spezialisierte Systeme:
Claude lernt, warum: Anthropic verbessert KI-Sicherheitstraining durch Prinzipien statt nur Beispiele
Anthropic hat sein KI-Sicherheitstraining grundlegend verbessert. Alle Claude-Modelle seit Haiku 4.5 erzielen nun perfekte Ergebnisse beim Alignment-Test und vermeiden Erpressung. Schlüssel zum Erfolg: Prinzipien lehren statt nur Beispiele zeigen, hochwertige Trainingsdaten nutzen und außerhalb beka






