type: concept tags: [face-detection, forgery-detection, lightweight, mobile, edge, security, deepfake, cross-domain] related: [[facelivtv2]], [[apple-intelligence]], [[coremltools-9]], [[ggml-llamacpp-hf]] sources: - url: https://arxiv.org/abs/2604.10862 title: "LRD-Net: A Lightweight Real-Centered Detection Network for Cross-Domain Face Forgery Detection" date: 2026-04-13 reliability: high created: 2026-04-22 updated: 2026-04-22
LRD-Net:轻量级跨域人脸伪造检测¶
基于频域引导的轻量级人脸伪造检测网络,仅 2.63M 参数即可实现跨域泛化,适合移动端实时部署
核心问题¶
扩散模型驱动的深度伪造技术日益逼真,但现有检测方法面临两大瓶颈: 1. 跨域泛化差:在未见过的伪造类型上性能急剧下降 2. 计算开销大:无法部署在资源受限的移动端设备
传统的双分支架构(空间+频域并行处理)存在冗余计算,不适合实时场景。
方法/架构¶
LRD-Net 采用序列式频域引导架构,核心创新:
1. 多尺度小波引导模块(MWGM)¶
- 不并行处理空间和频域,而是用频域信号指导空间主干
- 基于离散小波变换生成多尺度注意力信号
- 注意力信号条件化 MobileNetV3 空间主干的特征提取
2. 真实中心学习策略¶
- 不直接建模多样化伪造模式(传统方法)
- 而是将特征表示锚定在真实人脸图像周围
- 使用指数移动平均原型更新 + 漂移正则化
- 通过真实分布的偏离程度检测伪造
3. 轻量化设计¶
- 主干网络:MobileNetV3(高效移动端骨干)
- 参数量:2.63M(比传统方法少约 9 倍)
- 支持 INT8 量化部署
实验结果¶
在 DiFF 基准上的跨域评估(来源:论文摘要):
| 指标 | LRD-Net | 基线方法 |
|---|---|---|
| 跨域检测准确率 | SOTA | — |
| 参数量 | 2.63M | ~24M |
| 训练速度 | 8x+ 更快 | 基线 |
| 推理速度 | ~10x 更快 | 基线 |
关键发现:LRD-Net 在保持跨域泛化能力的同时,将计算量压缩到可实时部署的水平。这打破了"检测精度"与"计算效率"之间的传统权衡。
关键洞察¶
- 频域引导优于并行处理:序列式架构用频域信号指导空间特征提取,避免了双分支的冗余计算,同时保留了频域信息的判别力
- 真实中心学习更高效:建模"什么是真实的"比建模"什么是假的"更具泛化性,因为伪造模式是无限的但真实分布是有限的
- 轻量化的关键在于设计而非压缩:从架构层面(MWGM + MobileNetV3)实现轻量化,而非后处理压缩
为什么重要¶
对手机端 AI 生态的意义: - 移动端反欺诈:可集成到手机人脸认证系统中,实时检测 deepfake 攻击 - 隐私保护:本地化检测避免上传人脸数据到云端 - 边缘设备部署:2.63M 参数适合 NPU/GPU 低功耗推理 - 与 FaceLiVTv2 互补:FaceLiVTv2 聚焦活体检测,LRD-Net 聚焦伪造检测,两者可组合为完整的人脸安全方案
关联¶
- [[facelivtv2]] — 同为轻量级移动端人脸模型,活体检测方向
- [[apple-intelligence]] — Apple 端侧安全策略
- [[coremltools-9]] — 可通过 Core ML 部署到 iOS 设备
- [[ggml-llamacpp-hf]] — 可通过 GGUF 量化部署到跨平台边缘设备