
Russland-nahes Cyberkriminalitätskollektiv Greyvibe nutzt systematisch Künstliche Intelligenz in Angriffen
Die Hacker-Gruppe Greyvibe nutzt generative KI systematisch für alle Phasen ihrer Cyberangriffe gegen Ukraine-Ziele. Die Gruppe entwickelte mehrere Malware-Programme (PhantomRelay, LegionRelay, FallSpy) mit LLM-Unterstützung und setzt verschiedenste Social-Engineering-Taktiken ein. Security-Analyste
Effektive Strukturen für langfristig laufende KI-Agenten
Die Claude Agent SDK benötigt eine intelligente zwei-teilige Struktur für langfristige Projekte: Ein Initialisierer-Agent richtet die Umgebung ein, während spezialisierte Coding-Agenten in jedem Durchlauf inkrementelle Fortschritte machen und produktionsreife Artefakte hinterlassen – ohne unnötige R
Evaluierungen von KI-Agenten entmystifiziert
Agent-Evaluierungen sind komplexer als traditionelle LLM-Tests, da sie mehrere Turns, Tool-Nutzung und Zustandsveränderungen umfassen. Der Schlüssel ist die Unterscheidung zwischen Transcript (aufgezeichnete Interaktionen) und Outcome (tatsächlicher Endzustand), um aussagekräftige Bewertungen zu sch
EU-AI-Act: Der Verhaltenskodex für Entwickler von Allzweck-KI-Modellen
Die EU verabschiedet einen Verhaltenskodex für KI-Entwickler mit Inkrafttreten am 2. August 2025. Neue Modelle müssen sofort konform sein, ältere Modelle erhalten bis 2027 Zeit. Der Kodex regelt Transparenz, Urheberrecht und Sicherheit mit detaillierten Dokumentations- und Reporting-Anforderungen.
Leitlinien für GPAI-Modelle: Definitionen und Anforderungen der EU
Die Kommission setzt eine Rechenleistungsschwelle von 10²³ FLOPs für GPAI-Modelle fest, während Modelle ab 10²⁵ FLOPs als Systeme mit Systemrisiko gelten und umfassende Risikobewertungen sowie Benachrichtigungen innerhalb von zwei Wochen erfordern. Anbieter müssen Dokumentation pflegen, Trainingsdat
Amazon Bedrock AgentCore: Versionierte Test-Datasets für zuverlässige Agent-Evaluierung
Amazon Bedrock AgentCore führt versionierte Test-Datasets ein, die stabile Evaluierung von Agenten ermöglichen. Mit unveränderlichen Versionen für CI/CD-Gates und Draft-Modus für Entwicklung bietet es Ground Truth für verifiable Messungen statt subjektiver Bewertungen – optimal für Inner-Loop-Iterat
Bewertung von Deep Agents mit LangSmith auf AWS
AWS und LangChain zeigen in einem neuen Leitfaden, wie Entwickler KI-Agenten systematisch evaluieren und überwachen können. Mit LangSmith auf AWS, Amazon Nova 2 Lite und strukturierten Evaluierungsmustern lässt sich die Zuverlässigkeit von komplexen Multi-Step-Agenten deutlich erhöhen – vom Developm
Custom Portal mit eingebetteter Amazon SageMaker AI MLflow App aufbauen
Ein Custom Portal mit eingebetteter MLflow-UI bietet ML-Teams eine persistent bookmarkbare URL für Experiment-Tracking. Die Architektur kombiniert React Frontend, Flask Reverse Proxy mit AWS SigV4-Authentifizierung und Application Load Balancer für sichere, zentrale Zugriffsverwaltung über SSO-Integ


