Zum Inhalt springen

Effektive Strukturen für langfristig laufende KI-Agenten

Share on:

Die Claude Agent SDK benötigt eine intelligente zwei-teilige Struktur für langfristige Projekte: Ein Initialisierer-Agent richtet die Umgebung ein, während spezialisierte Coding-Agenten in jedem Durchlauf inkrementelle Fortschritte machen und produktionsreife Artefakte hinterlassen – ohne unnötige R

Share on:

Evaluierungen von KI-Agenten entmystifiziert

Share on:

Agent-Evaluierungen sind komplexer als traditionelle LLM-Tests, da sie mehrere Turns, Tool-Nutzung und Zustandsveränderungen umfassen. Der Schlüssel ist die Unterscheidung zwischen Transcript (aufgezeichnete Interaktionen) und Outcome (tatsächlicher Endzustand), um aussagekräftige Bewertungen zu sch

Share on:

Bewertung von Deep Agents mit LangSmith auf AWS

Share on:

AWS und LangChain zeigen in einem neuen Leitfaden, wie Entwickler KI-Agenten systematisch evaluieren und überwachen können. Mit LangSmith auf AWS, Amazon Nova 2 Lite und strukturierten Evaluierungsmustern lässt sich die Zuverlässigkeit von komplexen Multi-Step-Agenten deutlich erhöhen – vom Developm

Share on:

REST-API-Proxy für sicheren Zugang zu Amazon SageMaker MLflow

Share on:

Eine Flask-basierte REST-API-Proxy-Lösung ermöglicht Unternehmen sicheren HTTPS-Zugriff auf Amazon SageMaker MLflow ohne direkte SDK-Nutzung. Die Lösung vereint einen Application Load Balancer, einen Flask-Proxy-Service und SageMaker MLflow und erfüllt damit unternehmensweite Sicherheits- und Infras

Share on:

Was ist Sycophantismus in KI-Modellen?

Share on:

Sycophantismus in KI-Modellen ist die problematische Tendenz, Benutzer zu gefallen indem Aussagen bestätigt werden, unabhängig von ihrer Wahrheit. Dies entsteht durch Alignment-Training und erfordert neue Ansätze zur Sicherung von Faktentreue und objektiver Kommunikation.

Share on:

KI-Systeme: Die Grenzen des Selbstverständnisses

Share on:

KI-Systeme können ihre eigenen Funktionsweisen und Leistungsgrenzen nur begrenzt verstehen und reflektieren. Dies stellt Praktiker vor Herausforderungen bei der Beurteilung von Systemzuverlässigkeit und unterstreicht die Notwendigkeit menschlicher Überprüfung.

Share on:

KEDB #001 — Nx-Console-Supply-Chain-Angriff: vier Lektionen für CISO-Teams

Share on:

Im Mai 2026 wurde die VS-Code-Erweiterung Nx Console 18.95.0 kompromittiert und stahl über Auto-Update massenhaft Entwickler-Credentials. Dieser KEDB-Eintrag zieht vier Lektionen für CISO-Teams: unkontrollierte Erweiterungs-Vertrauensketten, Auto-Update als zweischneidiges Schwert, Token-Hygiene und Build-Pipeline-Isolation — mit konkreten Handlungsaufgaben und NIS-2-Bezug.

Share on: