Paged Attention:GPU 上的虚拟内存📅 2026年04月22日 · 📝 2026年05月30日 · ☕ 7 分钟 · ✍️ k4ivLLM 如何借鉴操作系统分页思想,消除 KV cache 显存碎片,将 GPU 显存利用率从约 30% 推到约 96%。