type: concept tags: [量化, 边缘部署, Deepfake检测, 模型压缩, 实时推理, 移动端] related: [[septq-post-training-quantization]], [[edgeflow-cold-start]], [[edgecim-hardware-codesign]] sources: - url: https://arxiv.org/abs/2604.08847 title: "DeFakeQ: Enabling Real-Time Deepfake Detection on Edge Devices via Adaptive Bidirectional Quantization" date: 2026-04-10 reliability: high created: 2026-04-16 updated: 2026-04-16

DeFakeQ：在边缘设备上实现实时 Deepfake 检测¶

首个专为 Deepfake 检测器设计的量化框架，通过自适应双向压缩将模型缩减至原始大小的 10-20%，同时保留 90% 基线精度。2026 年 4 月南洋理工大学发表。

核心问题¶

Deepfake 检测在边缘设备上部署面临一个根本矛盾：

检测精度需要大模型：SOTA 的 Xception-based 检测器需要 2800 万参数、1.2G FLOPs/推理
边缘设备资源有限：上述模型在高端移动 SoC 上单次推理延迟 350ms，远超实时阈值
伪造痕迹极其细微：Deepfake 检测依赖微小的面部伪造线索，这些线索对模型压缩极为敏感
通用量化方案失效：现有的通用量化方法（BRECQ、Adalog、FIMA-Q）在检测任务上严重退化

方法架构¶

自适应双向量化框架¶

DeFakeQ 的核心创新是双向压缩策略：

向前方向（特征相关性利用）： - 分析检测器中间层特征图之间的相关性 - 识别并保留对检测最关键的特征通道 - 自适应分配比特预算给不同重要性的层

向后方向（冗余消除）： - 识别并移除量化过程引入的冗余信息 - 通过梯度感知的敏感度分析确定最优量化策略 - 针对 Deepfake 检测特有的细微特征进行专门优化

关键技术¶

任务特定的量化感知训练：在量化过程中注入 Deepfake 检测领域的先验知识
双向协同优化：向前和向后两个方向交替优化，避免单一方向的局部最优
自适应比特分配：不同层、不同通道根据其对检测的贡献动态分配量化比特数

实验结果¶

跨数据集评估（训练集：FF++）¶

检测器	方法	存储(MB)↓	压缩率(%)↑	DFD精度(%)↑	CDF-v1(%)↑	DFDC(%)↑
DeiT-Tiny	BRECQ	5.9→2.8	52.5	-	-	-
DeiT-Tiny	DeFakeQ	5.9→2.2	62.7	显著提升	+11.2~35.5	+11.2~23.7
Xception	原始FP16	80MB	-	基线	基线	基线
Xception	DeFakeQ	8-16MB	80-90%	保留90%	显著优于竞品	显著优于竞品

关键数据¶

模型大小：缩减至原始的 10-20%
精度保留：保留高达 90% 的基线检测精度
对比提升：在 CDF-v1、CDF-v2、DFDC、DFDCP 上比 BRECQ 提升 11.2%~35.5%，比 Adalog 提升 17.5%~22.6%
实时部署：已在真实移动设备上验证实时 Deepfake 检测能力

关键洞察¶

量化必须任务特定：通用量化方案对 Deepfake 检测效果差，因为伪造线索极其细微——这说明端侧 AI 的量化策略需要针对具体任务定制
双向策略优于单向：同时利用特征相关性（向前）和消除冗余（向后）比单一方向效果好得多
移动端可行性已验证：不是停留在论文实验，而是在真实移动设备上部署并验证了实时性能
检测器无关性：在 11 种不同骨干检测器上均有效，说明框架具有泛化能力

为什么重要¶

对于手机端 AIOS 生态： - 端侧媒体真实性验证：用户可以在手机上实时检测视频/图片的 Deepfake 篡改 - 隐私保护：敏感内容不需要上传到云端分析 - 量化技术通用化：DeFakeQ 的双向自适应量化思路可以推广到其他端侧视觉任务 - 展示端侧 AI 的实际可行性：证明了即使在资源受限的移动设备上，复杂 AI 任务也是可行的

关联¶

[[septq-post-training-quantization]] — 通用 LLM 量化方法，DeFakeQ 是视觉任务的特化版本
[[edgeflow-cold-start]] — 量化后模型的冷启动更快
[[edgecim-hardware-codesign]] — 量化与 CIM 硬件加速的协同
[[sustainability-ondevice-intelligence]] — 模型压缩是可持续端侧 AI 的关键技术