JetSpec: Paralleles Tree Drafting löst Bottleneck in Speculative Decoding26. Juni 20264. Juli 2026AI ModelsJetSpec überwindet Skalierungsgrenzen von Speculative Decoding durch paralleles Tree Drafting mit kausaler Konditionierung und erreicht bis zu 9,64x Speedup bei LLM-Inferenz. Share on: