Anthropic arbeitet systematisch daran, Claude für chemische Standardaufgaben wie NMR-Spektrenauswertung zu optimieren, um Chemiker bei der zeitaufwendigen Arbeit mit verschiedenen Moleküldarstellungen zu entlasten.
RubyGems führt eine verzögerbare Wartezeit für neu veröffentlichte Pakete ein, um die Zeitspanne zu vergrößern, in der Malware in Gems entdeckt werden kann.
Microsoft warnt CTOs vor sieben neuen Angriffsmustern auf KI-Agenten: von natürlichsprachigen Injektionen über Goal Hijacking bis zu visuellen Attacken auf Computer-Use-Agenten.
LLMs können durch gezielte Prompt-Attacken zu Datenlecks gezwungen werden, geben Trainingsdaten in alltäglichen Nutzungsszenarien jedoch nur mit niedriger Wahrscheinlichkeit preis.
Firmen-KI-Ausgaben sind außer Kontrolle geraten; OpenAI verspricht effizientere Modelle, während das Jevons-Paradoxon längerfristig wieder steigende Nachfrage antreiben könnte.
Anthropic schlägt ein koordiniertes Moratorium für die Entwicklung hochleistungsfähiger KI-Modelle vor, um das Risiko selbstverbessernder Systeme zu minimieren.
Die Herausforderung ist nicht, eine Seite zu wählen, sondern feedback loops zu schaffen, die zwischen der Geschwindigkeit von KI-beschleunigter Entwicklung und den Anforderungen an Zuverlässigkeit und Wartbarkeit vermitteln.
Reale Geschäftsumgebungen mit echtem Geld, Inventar und Kunden offenbaren KI-Fähigkeiten und -Risiken, die klassische Benchmarks übersehen, von Preiskartellen über Deception bis zu rechtlichen Fehlinterpretationen.
Agentenbasiertes Reasoning verbessert die Regelanwendung in Sprachmodellen, zeigt aber stark unterschiedliche Ergebnisse je nach Modellstärke und Aufgabentyp.