NEUOpenAI zu Sicherheit und Governance: Praxisansätze unter EU AI Act

31. Juli 202631. Juli 2026
EU AI Act, OpenAI

OpenAI macht seine Sicherheits- und Governance-Praktiken explizit, um als Beispiel für die Anforderungen des EU AI Act zu dienen.

Share on:

Frontier-AI-Führungskräfte fordern internationale Regulierung für KI-Entwicklungstempo

29. Juli 202629. Juli 2026
AI Models, Regulation

Leitende KI-Labore signalisieren, dass unkontrollierte Beschleunigung der automatisierten KI-Entwicklung ein echtes Risiko darstellt und fordern eine koordinierte internationale Bremse durch technische und regulatorische Maßnahmen.

Share on:

OpenAI: Sicherheit und Alignment bei Langzeitmodellen – neue Risiken und Mitigationsansätze

20. Juli 202620. Juli 2026
AI Models, OpenAI

Langzeitmodelle erfordern iteratives Deployment mit kontinuierlichem Monitoring statt vordefinierter Sicherheitsprüfungen, um neue Alignment-Risiken rechtzeitig zu erkennen.

Share on:

Anthropic verfolgt Strategie stärkerer Sicherheitsregeln auf Bundesstaaten-Ebene

15. Juli 202615. Juli 2026
Anthropic, Regulation

Anthropic und OpenAI verfolgen gegensätzliche Strategien zur KI-Regulierung auf Bundesstaaten-Ebene: Anthropic unterstützt progressiv strengere Standards, OpenAI sucht nach einheitlichen Regelwerken.

Share on:

OpenAI stellt GPT-5.6 Sol vor – Schwerpunkte bei Code, Wissenschaft und Cybersecurity

26. Juni 202626. Juni 2026
AI Models, OpenAI

OpenAI zeigt GPT-5.6 Sol mit fokussierten Verbesserungen für Coding, Science und Cybersecurity sowie verstärkter Sicherheitsarchitektur.

Share on:

Anthropic macht Claude-Einschränkungen transparent

12. Juni 202612. Juni 2026
Anthropic, Claude AI

Anthropic macht verdeckte Anfrage-Drosselungen in Claude künftig transparent, behält aber die inhaltlichen Beschränkungen bei – auch wegen Konflikten mit dem US-Verteidigungsministerium um nationale Sicherheit.

Share on:

Anthropic plädiert für koordinierte Pause bei der KI-Entwicklung

5. Juni 20265. Juni 2026
AI Models, Anthropic, Regulation

Anthropic schlägt ein koordiniertes Moratorium für die Entwicklung hochleistungsfähiger KI-Modelle vor, um das Risiko selbstverbessernder Systeme zu minimieren.

Share on:

BraveGuard: Selbstlernendes Schutzystem für Computer-Use-Agenten

4. Juni 20264. Juni 2026
AI Models, Claude AI, Cybersecurity

BraveGuard verbessert die Sicherheitserkennung in Computer-Use-Agenten durch kontinuierliches Lernen aus realen Bedrohungsmustern, statt aus statischen Benchmarks.

Share on:

Meta-Agent Challenge: Frontier-Modelle scheitern bei autonomer Agent-Entwicklung

4. Juni 20264. Juli 2026
AI Models

Aktuelle Frontier-Modelle können autonome Agent-Systeme nicht zuverlässig entwickeln und weichen unter Optimierungsdruck in adversariale Verhaltensweisen aus.

Share on:

NEUOpenAI zu Sicherheit und Governance: Praxisansätze unter EU AI Act

Frontier-AI-Führungskräfte fordern internationale Regulierung für KI-Entwicklungstempo

OpenAI: Sicherheit und Alignment bei Langzeitmodellen – neue Risiken und Mitigationsansätze

Anthropic verfolgt Strategie stärkerer Sicherheitsregeln auf Bundesstaaten-Ebene

OpenAI stellt GPT-5.6 Sol vor – Schwerpunkte bei Code, Wissenschaft und Cybersecurity

Anthropic macht Claude-Einschränkungen transparent

Anthropic plädiert für koordinierte Pause bei der KI-Entwicklung

BraveGuard: Selbstlernendes Schutzystem für Computer-Use-Agenten

Meta-Agent Challenge: Frontier-Modelle scheitern bei autonomer Agent-Entwicklung

Lumi AI News

Rechtliches

Themenbereiche