大模型推理采样:temperature、top-p、top-k 到底在控制什么📅 2026年06月18日 · ☕ 5 分钟 · ✍️ k4i用一个 5-token 的小例子解释大模型推理时 temperature、top-p、top-k 的区别,并对照 vLLM V1 sampler 看它们在源码里的位置。