type: concept tags: [量化, deepfake-detection, edge-deployment, mobile-inference, real-time, post-training-quantization] related: [[septq-post-training-quantization]], [[kv-cache-quantization-ondevice]], [[multimodal-edge-pruning]], [[fastshade-mobile-denoising]], [[facelivtv2-mobile-face]] sources: - url: https://arxiv.org/abs/2604.08847 title: "DeFakeQ: Enabling Real-Time Deepfake Detection on Edge Devices via Adaptive Bidirectional Quantization" date: 2026-04-15 reliability: high created: 2026-04-16 updated: 2026-04-16
DeFakeQ: 端侧实时 Deepfake 检测的自适应双向量化¶
首个面向 Deepfake 检测的量化框架——模型压缩至原始 10%,保留 90%+ 检测精度,已在真实手机上部署验证。
核心问题¶
Deepfake 检测对移动支付、视频会议、社交媒体至关重要,但现有检测器计算量过大: - Xception-based 检测器需要 28M 参数、1.2G FLOPs - 在高端手机 SoC 上推理延迟达 350ms,远超实时阈值 - 现有轻量化方案(剪枝、紧凑架构设计)仍依赖全精度权重,内存开销大 - 直接量化会破坏 Deepfake 检测的核心:微表情不一致、细微纹理异常等超细粒度特征对量化噪声极为敏感
方法架构¶
DeFakeQ 包含两个核心创新模块:
水平自适应块量化 (HAQ - Horizontal Adaptive Block Quantization)¶
- 在每个 block 内逐层计算权重和激活的重要性
- 信息密度高的层分配更高比特宽度
- 信息密度低的层压缩更激进
- 目标:最小化信息损失的同时最大化计算和存储效率
垂直高效特征微调 (VEFT - Vertical Efficient Feature Fine-Tuning)¶
- 随机选择少量特征通道,恢复到全精度格式
- 构建渐进式对比度量学习损失函数
- 在量化 block 内保留判别性特征
- 补充 HAQ 的层级优化,进一步增强精度
双向优化:HAQ 横向自适应分配比特宽度,VEFT 纵向选择性恢复关键通道。两者协同工作。
实验结果¶
实验设置¶
- 数据集:5 个 Deepfake 基准数据集
- 检测器:11 个主流 SOTA/骨干 Deepfake 检测器
- 部署:真实移动设备上的端到端验证
关键数据¶
| 指标 | 结果 |
|---|---|
| 参数压缩比 | 压缩至全精度的 10% |
| 精度保留 | 保留原始 90%+ 检测性能 |
| 移动端部署 | 已在真实手机上验证实时推理 |
| 对比基线 | 显著优于现有轻量化设计和传统量化方法 |
与现有方案对比¶
- 优于轻量化架构设计(如 EfficientNet-based 检测器)
- 优于通用 PTQ 方法(如 AdaRound、BitSplit)
- 优于任务特定量化方法(通用计算机视觉量化无法处理 Deepfake 的特殊性)
关键洞察¶
-
Deepfake 检测量化的独特挑战:与一般分类不同,Deepfake 检测依赖超细微的面部伪造痕迹。标准量化方法会平滑掉这些关键特征。DeFakeQ 的自适应比特宽度分配解决了这个问题。
-
双向优化的必要性:仅做水平(层间)自适应不够——需要垂直(通道内)选择性恢复来保留判别性特征。两个维度缺一不可。
-
从 350ms 到实时:在手机 SoC 上将推理延迟从 350ms 降到实时级别,这意味着可以在用户拍照/视频通话时即时检测 Deepfake。
-
实用价值:论文已在真实手机上部署验证,不是实验室概念。这对移动支付、在线会议等场景有直接应用价值。
为什么重要¶
随着生成式 AI 的普及,Deepfake 威胁已从专业领域扩散到日常生活。用户主要通过手机进行视频通话、移动支付、社交分享——这些场景需要即时、本地的 Deepfake 检测。DeFakeQ 首次证明了在资源受限的移动设备上实现实时 Deepfake 检测的可行性,为端侧安全生态填补了关键空白。
关联¶
- [[septq-post-training-quantization]] — 通用 LLM 量化技术,DeFakeQ 是 Deepfake 检测领域的专门化量化
- [[kv-cache-quantization-ondevice]] — KV-Cache 量化降低 LLM 内存,DeFakeQ 降低检测器内存
- [[multimodal-edge-pruning]] — 模态感知剪枝 vs 自适应量化,两种端侧优化路径
- [[fastshade-mobile-denoising]] — 移动端图像处理(去噪),DeFakeQ 是移动端视觉安全(检测)
- [[facelivtv2-mobile-face]] — 移动端人脸识别,DeFakeQ 专注于人脸伪造检测,两者构成移动端人脸安全双保险