Zum Inhalt springen

Claude Opus 4.8 als inkrementelle Verbesserung: weniger Halluzinationen, mehr Transparenz

Share on:

Auf den Punkt: Claude Opus 4.8 reduziert Halluzinationen um etwa 75 Prozent, indem es bei unsicheren Fragen häufiger abstains statt unbegründete Antworten zu geben.

Anthropic hat Claude Opus 4.8 veröffentlicht und bewirbt das Modell bewusst als „moderate, aber greifbare" Verbesserung gegenüber dem Vorgänger. Kernfortschritt ist eine deutlich höhere faktische Zuverlässigkeit bei gleichzeitig gestiegener Transparenz über Unsicherheiten.

Das neue Modell wurde mit verändertem Trainingsansatz optimiert: Opus 4.8 kennzeichnet Unsicherheiten konsequenter und macht weniger unsupported Claims — ein besonders relevanter Punkt für Code-Generierung, wo das Modell laut Evaluierung etwa vier Mal seltener fehlerhafte Stellen übersieht. Auf sechs etablierten Benchmarks zeigte Opus 4.8 die niedrigste Error-Rate, erreicht dies aber primär durch Zurückhaltung bei fraglichen Fragen, nicht durch korrekt beantwortete Zusatzfragen.

Auf der Pricing-Ebene bleibt Opus 4.8 stabil bei 5 USD pro Million Input- und 25 USD pro Million Output-Token (identisch mit 4.5/4.6/4.7). Fast Mode kostet neu $30/$150 pro Million und ist damit günstiger als vorherige Fast-Mode-Versionen — allerdings nur für Organisationen mit Research-Preview-Zugang. Kenntnisstand und Training-Data-Cutoff liegen bei Januar 2026, Context Window bleiben 1.000.000 Token mit 128.000 Token maximaler Ausgabelänge.

Für Agentschleife-Szenarien relevant: Mid-Conversation System Messages erlauben es, Rollenbefehle nach User-Turns einzufügen, ohne den vollständigen System Prompt zu wiederholen — das erhöht Prompt-Cache-Treffer und reduziert Inputkosten. Die untere Grenze für Prompt Caching sinkt auf 1.024 Token (von 4.096 bei 4.7), was kosteneffiziente Operationen auf längeren Kontexten begünstigt.


Quelle: simonwillison.net · Erschienen 29. Mai 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.2.0.

Share on: