NEUFairness Pruning: Demografische Verzerrungen in LLM-Architekturen lokalisieren und abbauen

31. Juli 20261. August 2026
AI Models, Regulation

Fairness Pruning lokalisiert demografische Verzerrungen in GLU-MLP-Schichten durch Analyse differentieller Neuronenaktivierung und entfernt sie mit minimalem Capability-Verlust.

Share on:

NEUGemini Enterprise Agent Platform: Evaluierungsdienst jetzt allgemein verfügbar

31. Juli 202631. Juli 2026
AI Models, Google

Gemini Enterprise Agent Platform stellt einen GA-fähigen Evaluierungsdienst bereit, der über 20 Metriken und LLM-basierte Bewertungstools für die systematische Agent-Qualitätskontrolle über Dev und Produktion hinweg bietet.

Share on:

Ontologien für Agentic Systems: Logische Struktur statt reiner Wahrscheinlichkeit

30. Juli 202630. Juli 2026
AI Models

Etablierte Web-Ontologien wie Schema.org und OWL dienen als „logische Guardrails“ für LLM-basierte Agenten und sind bereits in deren Trainingsmaterialien enthalten.

Share on:

InMind-Benchmark: Speichersysteme verfehlen Anfragen über implizite Verbindungen

29. Juli 202629. Juli 2026
AI Models

Speichersysteme für Agenten verfehlen 86 Prozent der Anfragen, bei denen das richtige Faktum nicht sprachlich mit der Anfrage übereinstimmt, obwohl sie den Fakt abrufen können, wenn er direkt sichtbar ist.

Share on:

GitHub und PyPI führen zeitbasierte Schutzmechanismen gegen Supply-Chain-Angriffe ein

27. Juli 202627. Juli 2026
Cybersecurity

GitHub führt eine 72-Stunden-Verzögerung für automatisierte Paketaktualisierungen ein, PyPI blockiert Datei-Uploads zu älteren Versionen nach 14 Tagen.

Share on:

Google stellt Gemini 3.6 Flash und spezialisierte Varianten vor

27. Juli 202627. Juli 2026
Google, Google Gemini

Google erweitert die Gemini-Modellreihe um eine schnellere 3.6-Version und zwei spezialisierte Varianten für unterschiedliche Anwendungsszenarien.

Share on:

Multi-Head Latent Control: Agenten-Entscheidungen direkt aus dem Modell auslesen

27. Juli 202627. Juli 2026
AI Models

Eine leichte Zusatzschicht liest versteckte Generierungszustände aus gefrorenen LLMs aus und reduziert damit Anfragen an größere Modelle um bis zu 90,7 % bei gleichbleibender Leistung.

Share on:

Agentic Context Management: Kontextualität als Lifecycle-Problem für Production Agents

27. Juli 202627. Juli 2026
AI Models

Validated Compaction-Strategien ermöglichen lineares Token-Wachstum mit erhaltener Accuracy, statt zwischen quadratischen Kosten oder Accuracy-Cliffs zu wählen.

Share on:

Tencent WorkBuddy Bench: Benchmark für KI-Coding-Agenten über mehrere Domänen

24. Juli 202624. Juli 2026
AI Models, Claude Code

Das WorkBuddy Bench Framework validiert Coding-Agenten über vier praktische Domänen mit Contamination-resistenter Task-Konstruktion und vollständiger Reproduzierbarkeit durch offene Veröffentlichung.

Share on:

SLPO: Outcome-Reward-Training für latente Reasoner ohne Token-Dekodierung

23. Juli 202624. Juli 2026
AI Models

Surrogate Latent Policy Optimization ermöglicht effizientes Outcome-Reward-Training für latente Reasoner, die kontinuierliche Vektoren statt Tokens für Zwischenschritte verwenden.

Share on:

Verifikationsschleifen in Claude Code mit Skills implementieren

22. Juli 202622. Juli 2026
Claude Code, Claude Cowork

Verifikationsschleifen ermöglichen es Claude, deterministische und projektspezifische Qualitätsprüfungen selbstständig auszuführen und zu iterieren, ohne manuelle Eingriffe zwischen den Entwicklungsschritten.

Share on:

Google stellt Gemini 3.5 Flash Cyber vor

21. Juli 202621. Juli 2026
Cybersecurity, Google, Google Gemini

Gemini 3.5 Flash Cyber ist ein auf Cybersecurity ausgerichtetes Modell, das schnelle Bedrohungsanalysen und Incident-Response-Aufgaben ermöglicht.

Share on:

1
2
3
…
42
Weiter »

NEUFairness Pruning: Demografische Verzerrungen in LLM-Architekturen lokalisieren und abbauen

NEUGemini Enterprise Agent Platform: Evaluierungsdienst jetzt allgemein verfügbar

Ontologien für Agentic Systems: Logische Struktur statt reiner Wahrscheinlichkeit

InMind-Benchmark: Speichersysteme verfehlen Anfragen über implizite Verbindungen

GitHub und PyPI führen zeitbasierte Schutzmechanismen gegen Supply-Chain-Angriffe ein

Google stellt Gemini 3.6 Flash und spezialisierte Varianten vor

Multi-Head Latent Control: Agenten-Entscheidungen direkt aus dem Modell auslesen

Agentic Context Management: Kontextualität als Lifecycle-Problem für Production Agents

Tencent WorkBuddy Bench: Benchmark für KI-Coding-Agenten über mehrere Domänen

SLPO: Outcome-Reward-Training für latente Reasoner ohne Token-Dekodierung

Verifikationsschleifen in Claude Code mit Skills implementieren

Google stellt Gemini 3.5 Flash Cyber vor

Lumi AI News

Rechtliches

Themenbereiche