K4i
简体中文
light
dark
hacker
solarized
kimbie
文章
归档
关于
标签
分类
系列
简体中文
light
dark
hacker
solarized
kimbie
文章
归档
关于
k4i's blog
标签
优化
优化
LLM 推理中为什么 K、V 可以被缓存
📅 2026年04月20日
· ☕ 7 分钟
·
✍️
k4i
解释 KV 缓存如何在自回归解码中避免冗余计算,以及它带来的显存/计算权衡。