
Amazon Bedrock AgentCore: Versionierte Test-Datasets für zuverlässige Agent-Evaluierung
Amazon Bedrock AgentCore führt versionierte Test-Datasets ein, die stabile Evaluierung von Agenten ermöglichen. Mit unveränderlichen Versionen für CI/CD-Gates und Draft-Modus für Entwicklung bietet es Ground Truth für verifiable Messungen statt subjektiver Bewertungen – optimal für Inner-Loop-Iterat
Bewertung von Deep Agents mit LangSmith auf AWS
AWS und LangChain zeigen in einem neuen Leitfaden, wie Entwickler KI-Agenten systematisch evaluieren und überwachen können. Mit LangSmith auf AWS, Amazon Nova 2 Lite und strukturierten Evaluierungsmustern lässt sich die Zuverlässigkeit von komplexen Multi-Step-Agenten deutlich erhöhen – vom Developm
Google DeepMind startet Accelerator-Programm für Klimatechnologien in Asien-Pazifik
Google DeepMind lanciert in Asien-Pazifik ein neues Accelerator-Programm zur Förderung von KI-basierten Klimatechnologien. Das dreimonatige Programm bietet Startups, Forschungsteams und Nonprofit-Organisationen Mentorship und technische Unterstützung. Das Bootcamp startet in Singapur.
Bausteine für Foundation-Model-Training und Inferenz auf AWS
Foundation-Model-Entwicklung skaliert heute über drei Kanäle: Pre-Training, Post-Training und Test-Zeit-Compute. AWS zeigt, wie ihre Infrastruktur – Beschleuniger, Netzwerk, Speicher – mit Open-Source-Tools wie PyTorch, Kubernetes und Prometheus zusammenwirkt, um effizientes Training und Inferenz zu








