脉冲神经网络量化：超越准确率的评估¶

核心问题¶

传统 SNN（Spiking Neural Network）量化研究几乎完全以准确率作为唯一评估指标，忽视了量化后的网络是否保留了全精度版本的脉冲发放行为（firing behavior）。在资源受限的边缘设备上部署 SNN 时，仅关注准确率会导致一个隐藏问题：即使两个量化网络的准确率相同，它们的脉冲发放分布可能截然不同——而这种差异对能耗、硬件兼容性和时间编码特性至关重要。

方法/架构¶

该研究系统性地分析了三个关键因素对量化后 SNN 脉冲行为的影响：

量化方法：不同的量化策略（均匀量化、对数量化等）对脉冲模式的影响差异显著
裁剪范围（Clipping Range）：激活值的裁剪边界直接影响脉冲频率和分布
位宽选择：从 INT8 到超低比特量化，不同位宽对脉冲行为的保存程度不同

论文提出了超越准确率的评估框架，引入了脉冲分布相似度等度量指标，用于量化评估量化前后的 firing behavior 保持程度。

实验结果/关键数据¶

在同等准确率水平下，不同的量化方法+裁剪范围组合产生了显著不同的脉冲发放分布
这种差异在标准准确率指标下完全不可见，但在硬件行为层面是关键的
研究验证了传统评估指标在 SNN 量化场景下的不充分性

关键洞察¶

准确率≠行为等价性：对于 SNN 这类依赖时间编码和事件驱动计算的模型，仅用准确率评估量化效果是不充分的
能耗敏感性：脉冲发放模式直接关系到神经形态硬件的实际能耗——脉冲越多、越不规则，能耗越高
量化设计需要多目标优化：SNN 量化应同时优化准确率和脉冲行为保持度，而非仅关注分类性能

为什么重要¶

SNN 是边缘 AI 和神经形态计算的核心模型之一，其事件驱动、稀疏计算的特性天然适合低功耗设备。随着 SNN 在可穿戴设备、IoT 传感器和移动端的部署增加，量化成为必然选择。该研究指出当前量化评估的根本性缺陷，为设计真正适合边缘部署的 SNN 量化方案提供了重要的理论基础和评估方法论。

关联¶

[[kl-quantization-ssm-transformer]] — SSM-Transformer 模型的 KL 敏感性量化理论
[[int4-quantization-collapse]] — FP32 收敛后 INT4 量化的崩溃机制
[[septq-post-training-quantization]] — 简单有效的 LLM 后训练量化范式
[[codebook-init-extreme-llm-quantization]] — 极端量化下的码本初始化策略
[[biotrain-ondevice-finetuning-mcu]] — 微控制器上的端侧训练，与 SNN 量化互补