Lookahead Sparse Attention: DeepSeek-V4 reduziert KV-Cache auf 13,5 Prozent

9. Juni 20264. Juli 2026
AI Models

LSA prognostiziert relevante Kontextabschnitte vorab und behält nur diese im GPU-Speicher, wodurch der KV-Cache um über 86 Prozent komprimiert wird, ohne die Genauigkeit zu opfern.

Share on:

Offene Frontier-Modelle: Gemma 4, DeepSeek V4 und andere im Vergleich zu geschlossenen Systemen

31. Mai 20261. Juni 2026
AI Models, Google Gemini

Offene Modelle schließen zur Frontier auf, aber unterschiedliche Benchmarking-Methoden und Evaluationsrahmenbedingungen erschweren verlässliche Leistungsvergleiche zwischen offenen und geschlossenen Systemen.

Share on:

Lookahead Sparse Attention: DeepSeek-V4 reduziert KV-Cache auf 13,5 Prozent

Offene Frontier-Modelle: Gemma 4, DeepSeek V4 und andere im Vergleich zu geschlossenen Systemen

Lumi AI News

Rechtliches

Themenbereiche