JetSpec: paralleelne puu-draftimine lahendab pudelikaela spekulatiivses dekodeerimises26. juuni 20264. juuli 2026Tehisintellekti mudelidJetSpec ületab spekulatiivse dekodeerimise skaleeritavuse piiranguid paralleelse puu-draftimisega ja kausaalse tingimustusvõimega, saavutades kuni 9,64x kiirenduse LLM-inferentsis. Share on: