模型里的数值类型：FP32、BF16、FP8、INT8 到 INT4

sky_io@outlook.com (K4i) — Tue, 23 Jun 2026 10:30:00 +0800

先给结论

模型里不是只有浮点类型，也会用整数类型。最重要的区别不是“浮点 vs 整数”，而是这个类型用在什么位置：

一句话记住：训练主路径通常是浮点；推理和存储会大量使用低精度浮点和整数；整数如果表示模型数值，通常需要 scale、zero point 或 codebook 才能还原成近似实数。