JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding

26. Juni 20264. Juli 2026
AI Models

JetSpec überwindet Skalierungsgrenzen von Speculative Decoding durch paralleles Tree Drafting mit kausaler Konditionierung und erreicht bis zu 9,64x Speedup bei LLM-Inferenz.

Share on:

JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding

Lumi AI News

Rechtliches

Themenbereiche