Gefrorenes 12B-Modell erreicht 100%-Genauigkeit bei verifizierten Aufgaben ohne Token-Verbrauch

28. Juli 202628. Juli 2026
AI Models

Ein gefrorenes 12B-Modell kombiniert mit verifiziertem Lösungsspeicher erreicht 100%-Genauigkeit bei verifizierten Problemfamilien mit null Token-Verbrauch und deterministischen, bitgenauen Ergebnissen.

Share on:

JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding

26. Juni 20264. Juli 2026
AI Models

JetSpec überwindet Skalierungsgrenzen von Speculative Decoding durch paralleles Tree Drafting mit kausaler Konditionierung und erreicht bis zu 9,64x Speedup bei LLM-Inferenz.

Share on:

MiniMax Sparse Attention: Effiziente Long-Context-Verarbeitung für Milliarden-Parameter-Modelle

12. Juni 20264. Juli 2026
AI Models

MSA reduziert die Aufmerksamkeitsberechnung für Million-Token-Kontexte um das 28,4-Fache durch blockweise Sparse-Selektion und erreichbare praktische Speedups durch Co-Design von Algorithmus und GPU-Kernel.

Share on:

Geometric Latent Reasoning verkürzt Generierung in großen Sprachmodellen

2. Juni 20264. Juli 2026
AI Models

Geometric Latent Reasoning approximiert diskrete Denkschritte als kontinuierliche Pfade im Embedding-Raum und erzielt damit kürzere Generierungen bei gleichbleibender oder besserer Genauigkeit.

Share on:

Gefrorenes 12B-Modell erreicht 100%-Genauigkeit bei verifizierten Aufgaben ohne Token-Verbrauch

JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding

MiniMax Sparse Attention: Effiziente Long-Context-Verarbeitung für Milliarden-Parameter-Modelle

Geometric Latent Reasoning verkürzt Generierung in großen Sprachmodellen

Lumi AI News

Rechtliches

Themenbereiche