OpenAI senkt Preise für GPT-5.6 deutlich – Luna wird konkurrenzfähiger

31. Juli 202631. Juli 2026
AI Models, OpenAI

GPT-5.6 Luna kostet nach 80-prozentiger Preissenkung 0,20 Dollar pro Million Input-Token und ist damit günstiger als Googles Gemini 3.1 Flash-Lite und ein Fünftel von Anthropics Claude Haiku 4.5.

Share on:

Direct-OPD: Policy-Shifts von kleineren auf größere Modelle übertragen

14. Juli 202614. Juli 2026
AI Models

Direct-OPD transferiert RL-induzierte Policy-Verschiebungen von schwächeren auf stärkere Modelle, indem es das implizite Reward-Signal aus dem Log-Ratio der RL-verschobenen und Original-Policy nutzbar macht.

Share on:

Variable-Width Transformers: Ungleichmäßige Kapazitätsverteilung über Layern

17. Juni 202617. Juni 2026
AI Models

Unterschiedliche Layer erfüllen unterschiedliche Rollen und könnten daher eine ungleichmäßige Verteilung von Parametern und Rechenressourcen ermöglichen als alternative zu konstanter Architektur-Breite.

Share on:

OPRD: Representation Distillation mit versteckten Zuständen schlägt Output-Only-Methode

5. Juni 20264. Juli 2026
AI Models

Hidden-State-Alignment reduziert Sampling-Varianz, schließt die Schüler-Lehrer-Lücke besser und trainiert mit weniger Speicher und Rechenzeit als Output-Only-Distillation.

Share on:

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

4. Juni 20264. Juli 2026
AI Models

ThoughtFold identifiziert und entfernt überflüssige Explorations-Schritte in Reasoning-Ketten, senkt den Token-Verbrauch um 56% bei DeepSeek-R1-Distill-Qwen-7B und erhält dabei State-of-the-Art-Genauigkeit.

Share on:

OpenAI senkt Preise für GPT-5.6 deutlich – Luna wird konkurrenzfähiger

Direct-OPD: Policy-Shifts von kleineren auf größere Modelle übertragen

Variable-Width Transformers: Ungleichmäßige Kapazitätsverteilung über Layern

OPRD: Representation Distillation mit versteckten Zuständen schlägt Output-Only-Methode

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

Lumi AI News

Rechtliches

Themenbereiche