Blind-Spots-Bench: Neue Benchmark deckt Schwachstellen in KI-Modellen auf

15. Juli 202615. Juli 2026
AI Models

Eine spezialisierte Benchmark mit 235 Aufgaben zeigt, dass etablierte Benchmarks erhebliche Schwachstellen moderner KI-Modelle systematisch überschätzen oder ignorieren.

Share on:

Vier AsyncAPI-Pakete mit Multi-Stage-Botnet kompromittiert

15. Juli 202615. Juli 2026
Cybersecurity

Die npm-Pakete @asyncapi/generator-helpers@1.1.1, @asyncapi/generator-components@0.7.1, @asyncapi/generator@3.3.1 und @asyncapi/specs (v6.11.2, v6.11.2-alpha.1) liefern schädliche Botnet-Software aus.

Share on:

GPT-5.6 Sol löscht Nutzerdaten unerwartet – OpenAI kannte Problem vor Release

15. Juli 202615. Juli 2026
Cybersecurity, OpenAI

GPT-5.6 Sol zeigt ungesteuertes Löschverhalten bei Nutzerdaten, was OpenAI bei der Freigabe bereits bekannt war.

Share on:

Claude for Teachers: Kostenloser KI-Zugang für US-Lehrkräfte mit Curriculum-Integration

15. Juli 202615. Juli 2026
Anthropic, Claude AI

Anthropic stellt K-12-Lehrkräften in den USA Claude kostenlos zur Verfügung, integriert mit standardisierten Lehrplänen aller Bundesstaaten und einem Ökosystem von Eductech-Tools.

Share on:

EU AI Act: Fristverlängerung für Hochrisiko-Systeme bis Dezember 2027

15. Juli 202615. Juli 2026
EU AI Act, Regulation

Die Fristverlängerung ist keine Entwarnung, sondern signalisiert den Beginn einer strikteren Durchsetzung ab 2027 – wie die Erfahrungen mit DSGVO und NIS2 zeigen.

Share on:

148 npm-Pakete als Student-Proxies getarnt – Browser wurden zu DDoS-Bots

14. Juli 202614. Juli 2026
Cybersecurity

148 npm-Pakete wurden als Student-Proxies missbraucht, um Browser-Besucher für DDoS-Anschläge einzuspannen, ohne dass Entwickler als primäre Ziele angegriffen wurden.

Share on:

KI-Skalierungsvertrauen von CTOs fällt von 82 auf 48 Prozent

14. Juli 202614. Juli 2026
AI Models

Während die KI-Technologie reift, wird deren unternehmensweite Skalierung zunehmend durch organisatorische Lücken, mangelndes Management-Know-how und niedrige Mitarbeiterakzeptanz gebremst, nicht durch technische Grenzen.

Share on:

Anthropic testet Wertetreue von Claude 3 über Sprachräume hinweg

14. Juli 202614. Juli 2026
AI Models, Anthropic

Anthropic prüft, ob Claude seine Werterichtlinien konsistent über verschiedene Sprachen hinweg umsetzt.

Share on:

NeuroCogMap: Funktionale Organisation von LLMs kartografiert

14. Juli 202614. Juli 2026
AI Models, Claude AI

NeuroCogMap bildet interne Repräsentationen von LLMs in funktionale Systeme ab, identifiziert mechanistisch Ausfallmuster wie Halluzinationen und Bias, und verbessert zugleich die Vorhersage von menschlichen Hirnaktivitäten.

Share on:

OpenAI GPT-5.6 Sol, Terra und Luna auf Amazon Bedrock verfügbar

13. Juli 202613. Juli 2026
AI Models, OpenAI

OpenAI GPT-5.6 Sol, Terra und Luna stehen auf Amazon Bedrock zur Verfügung und decken Anforderungen von komplexem Reasoning bis zu kostengünstiger Hochvolumen-Inferenz ab.

Share on:

Claude zeigt unterschiedliche Wertemuster je nach Modellversion und Sprache

13. Juli 202613. Juli 2026
Anthropic, Claude AI

Claude drückt je nach Modellversion und Sprache unterschiedliche Werte aus – etwa mehr Sorgfalt in Opus 4.7 oder mehr Wärmebezug in Arabisch – was CTOs bei der Modellauswahl berücksichtigen sollten.

Share on:

Hebbia nutzt Claude 3.5 für hochpräzise Finanzanalysen mit Zitiergenauigkeit

13. Juli 202613. Juli 2026
AI Models

Claude 3.5 zeigt in Hebbias Finance-Benchmark 20 Prozent Genauigkeitszuwachs bei der Finanzanalyse und präziserer Quellenattribution, was für institutionelle Finanzdiligence kritisch ist.

Share on:

« Zurück
1
…
7
8
9
10
11
…
67
Weiter »

Blind-Spots-Bench: Neue Benchmark deckt Schwachstellen in KI-Modellen auf

Vier AsyncAPI-Pakete mit Multi-Stage-Botnet kompromittiert

GPT-5.6 Sol löscht Nutzerdaten unerwartet – OpenAI kannte Problem vor Release

Claude for Teachers: Kostenloser KI-Zugang für US-Lehrkräfte mit Curriculum-Integration

EU AI Act: Fristverlängerung für Hochrisiko-Systeme bis Dezember 2027

148 npm-Pakete als Student-Proxies getarnt – Browser wurden zu DDoS-Bots

KI-Skalierungsvertrauen von CTOs fällt von 82 auf 48 Prozent

Anthropic testet Wertetreue von Claude 3 über Sprachräume hinweg

NeuroCogMap: Funktionale Organisation von LLMs kartografiert

OpenAI GPT-5.6 Sol, Terra und Luna auf Amazon Bedrock verfügbar

Claude zeigt unterschiedliche Wertemuster je nach Modellversion und Sprache

Hebbia nutzt Claude 3.5 für hochpräzise Finanzanalysen mit Zitiergenauigkeit

Lumi AI News

Rechtliches

Themenbereiche