<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:media="http://search.yahoo.com/mrss/"><channel><title>Bf16 on k4i's blog</title><link>https://k4i.top/zh/tags/bf16/</link><description>Recent content in Bf16 on k4i's blog</description><generator>Hugo -- gohugo.io</generator><language>zh</language><managingEditor>sky_io@outlook.com (K4i)</managingEditor><webMaster>sky_io@outlook.com (K4i)</webMaster><copyright>All content is subject to the license of &lt;a rel="license noopener" href="https://creativecommons.org/licenses/by-nc-sa/4.0/" target="_blank"&gt;CC BY-NC-SA 4.0&lt;/a&gt; .</copyright><lastBuildDate>Tue, 23 Jun 2026 10:30:00 +0800</lastBuildDate><atom:link href="https://k4i.top/zh/tags/bf16/index.xml" rel="self" type="application/rss+xml"/><item><title>模型里的数值类型：FP32、BF16、FP8、INT8 到 INT4</title><link>https://k4i.top/zh/posts/model-numeric-types/</link><pubDate>Tue, 23 Jun 2026 10:30:00 +0800</pubDate><author>sky_io@outlook.com (K4i)</author><atom:modified>Tue, 23 Jun 2026 10:30:00 +0800</atom:modified><guid>https://k4i.top/zh/posts/model-numeric-types/</guid><description>&lt;h2 id="quick-answer"&gt;先给结论&lt;/h2&gt;
&lt;p&gt;模型里不是只有浮点类型，也会用整数类型。最重要的区别不是“浮点 vs 整数”，而是这个类型用在什么位置：&lt;/p&gt;
&lt;table&gt;
&lt;thead&gt;
&lt;tr&gt;
&lt;th&gt;位置&lt;/th&gt;
&lt;th&gt;常见类型&lt;/th&gt;
&lt;th&gt;作用&lt;/th&gt;
&lt;/tr&gt;
&lt;/thead&gt;
&lt;tbody&gt;
&lt;tr&gt;
&lt;td&gt;训练计算&lt;/td&gt;
&lt;td&gt;FP32、TF32、FP16、BF16&lt;/td&gt;
&lt;td&gt;保持梯度和激活稳定，同时利用 Tensor Core&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;推理计算&lt;/td&gt;
&lt;td&gt;BF16、FP16、FP8、INT8&lt;/td&gt;
&lt;td&gt;降低带宽和计算成本&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;权重存储&lt;/td&gt;
&lt;td&gt;BF16、FP16、FP8、INT8、INT4、NF4&lt;/td&gt;
&lt;td&gt;减少模型文件和显存占用&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;KV cache / activation&lt;/td&gt;
&lt;td&gt;BF16、FP16、FP8、INT8&lt;/td&gt;
&lt;td&gt;长上下文和高并发时省显存&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
&lt;td&gt;token id / mask / index&lt;/td&gt;
&lt;td&gt;INT32、INT64、bool&lt;/td&gt;
&lt;td&gt;表示离散索引，不是量化参数&lt;/td&gt;
&lt;/tr&gt;
&lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;一句话记住：&lt;strong&gt;训练主路径通常是浮点；推理和存储会大量使用低精度浮点和整数；整数如果表示模型数值，通常需要 scale、zero point 或 codebook 才能还原成近似实数。&lt;/strong&gt;&lt;/p&gt;</description><dc:creator>K4i</dc:creator><media:content url="https://k4i.top//images/posts/model-numeric-types/numeric-types-cover.svg" medium="image"><media:title type="html">featured image</media:title></media:content><category>llm</category><category>数值类型</category><category>bf16</category><category>fp8</category><category>int8</category><category>量化</category><category>AI</category><category>LLM Quantization and Low-Precision Serving</category></item></channel></rss>