
Claude-Plattform erhält erweiterte Tool-Nutzung für AI-Agenten
Anthropic führt Tool Search, Programmatic Tool Calling und Tool Use Examples ein. Diese Features ermöglichen es KI-Agenten, mit Tausenden von Tools zu arbeiten, ohne Kontext zu verschwenden. Interne Tests zeigen signifikante Verbesserungen bei Speichereffizienz und Fehlerreduktion.
Effektive Strukturen für langfristig laufende KI-Agenten
Die Claude Agent SDK benötigt eine intelligente zwei-teilige Struktur für langfristige Projekte: Ein Initialisierer-Agent richtet die Umgebung ein, während spezialisierte Coding-Agenten in jedem Durchlauf inkrementelle Fortschritte machen und produktionsreife Artefakte hinterlassen – ohne unnötige R
Evaluierungen von KI-Agenten entmystifiziert
Agent-Evaluierungen sind komplexer als traditionelle LLM-Tests, da sie mehrere Turns, Tool-Nutzung und Zustandsveränderungen umfassen. Der Schlüssel ist die Unterscheidung zwischen Transcript (aufgezeichnete Interaktionen) und Outcome (tatsächlicher Endzustand), um aussagekräftige Bewertungen zu sch
Amazon Bedrock AgentCore: Versionierte Test-Datasets für zuverlässige Agent-Evaluierung
Amazon Bedrock AgentCore führt versionierte Test-Datasets ein, die stabile Evaluierung von Agenten ermöglichen. Mit unveränderlichen Versionen für CI/CD-Gates und Draft-Modus für Entwicklung bietet es Ground Truth für verifiable Messungen statt subjektiver Bewertungen – optimal für Inner-Loop-Iterat
Bewertung von Deep Agents mit LangSmith auf AWS
AWS und LangChain zeigen in einem neuen Leitfaden, wie Entwickler KI-Agenten systematisch evaluieren und überwachen können. Mit LangSmith auf AWS, Amazon Nova 2 Lite und strukturierten Evaluierungsmustern lässt sich die Zuverlässigkeit von komplexen Multi-Step-Agenten deutlich erhöhen – vom Developm
REST-API-Proxy für sicheren Zugang zu Amazon SageMaker MLflow
Eine Flask-basierte REST-API-Proxy-Lösung ermöglicht Unternehmen sicheren HTTPS-Zugriff auf Amazon SageMaker MLflow ohne direkte SDK-Nutzung. Die Lösung vereint einen Application Load Balancer, einen Flask-Proxy-Service und SageMaker MLflow und erfüllt damit unternehmensweite Sicherheits- und Infras
Custom Portal mit eingebetteter Amazon SageMaker AI MLflow App aufbauen
Ein Custom Portal mit eingebetteter MLflow-UI bietet ML-Teams eine persistent bookmarkbare URL für Experiment-Tracking. Die Architektur kombiniert React Frontend, Flask Reverse Proxy mit AWS SigV4-Authentifizierung und Application Load Balancer für sichere, zentrale Zugriffsverwaltung über SSO-Integ
Claude Opus 4.8: Neue KI-Generation mit verbesserter Zusammenarbeit
Anthropic stellt Claude Opus 4.8 vor: Das verbesserte KI-Modell bietet besseres Urteilsvermögen, schnellere Verarbeitung und neue Funktionen wie Dynamic Workflows – bei gleichem Preis wie der Vorgänger. Early Tester berichten von deutlich höherer Zuverlässigkeit bei agentischen Aufgaben.






