Continuous Batching:按迭代粒度调度📅 2026年04月22日 · 📝 2026年05月30日 · ☕ 5 分钟 · ✍️ k4i为什么按 decode iteration 做调度能消除静态 batch 的 GPU 空转,以及 prefill 和 decode 如何被打包进同一次 forward。