Hybride LLMs verlieren Long-Context-Fähigkeiten durch CoT-Feintuning

10. Juni 20264. Juli 2026
AI Models

CoT-Feintuning degradiert Long-Context-Retrieval in hybriden LLMs durch Verzerrung der Query-Key-Projektionen; QK-Restore behebt dies ohne zusätzliches Training.

Share on:

Reasoning-Modelle zeigen versteckte Sicherheitslücken über mehrere Gesprächsrunden

10. Juni 20264. Juli 2026
AI Models, Cybersecurity

Multi-Turn-Reasoning-Modelle können sichere Oberflächenmetriken aufrechterhalten, während ihre internen Zustände über Gesprächsrunden hinweg kompromittiert sind oder ihre sichere interne Logik in schädlichen Outputs ignoriert wird.

Share on:

Optische Reasoning: Bilder statt Text als Reasoning-Medium in KI-Modellen

9. Juni 20264. Juli 2026
AI Models

Optische Reasoning nutzt Bilder als primäres Reasoning-Medium und spart dabei durchschnittlich 28,57 Prozent Token bei Sprachaufgaben und 16 Prozent bei multimodalen Aufgaben ein.

Share on:

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

4. Juni 20264. Juli 2026
AI Models

ThoughtFold identifiziert und entfernt überflüssige Explorations-Schritte in Reasoning-Ketten, senkt den Token-Verbrauch um 56% bei DeepSeek-R1-Distill-Qwen-7B und erhält dabei State-of-the-Art-Genauigkeit.

Share on:

Geometric Latent Reasoning verkürzt Generierung in großen Sprachmodellen

2. Juni 20264. Juli 2026
AI Models

Geometric Latent Reasoning approximiert diskrete Denkschritte als kontinuierliche Pfade im Embedding-Raum und erzielt damit kürzere Generierungen bei gleichbleibender oder besserer Genauigkeit.

Share on:

Hybride LLMs verlieren Long-Context-Fähigkeiten durch CoT-Feintuning

Reasoning-Modelle zeigen versteckte Sicherheitslücken über mehrere Gesprächsrunden

Optische Reasoning: Bilder statt Text als Reasoning-Medium in KI-Modellen

ThoughtFold: Verkürzte Reasoning-Ketten durch Präferenzlernen

Geometric Latent Reasoning verkürzt Generierung in großen Sprachmodellen

Lumi AI News

Rechtliches

Themenbereiche