type: concept tags: [face-detection, forgery-detection, lightweight, mobile, edge, security, deepfake, cross-domain] related: [[facelivtv2]], [[apple-intelligence]], [[coremltools-9]], [[ggml-llamacpp-hf]] sources: - url: https://arxiv.org/abs/2604.10862 title: "LRD-Net: A Lightweight Real-Centered Detection Network for Cross-Domain Face Forgery Detection" date: 2026-04-13 reliability: high created: 2026-04-22 updated: 2026-04-22

LRD-Net：轻量级跨域人脸伪造检测¶

基于频域引导的轻量级人脸伪造检测网络，仅 2.63M 参数即可实现跨域泛化，适合移动端实时部署

核心问题¶

扩散模型驱动的深度伪造技术日益逼真，但现有检测方法面临两大瓶颈： 1. 跨域泛化差：在未见过的伪造类型上性能急剧下降 2. 计算开销大：无法部署在资源受限的移动端设备

传统的双分支架构（空间+频域并行处理）存在冗余计算，不适合实时场景。

方法/架构¶

LRD-Net 采用序列式频域引导架构，核心创新：

1. 多尺度小波引导模块（MWGM）¶

不并行处理空间和频域，而是用频域信号指导空间主干
基于离散小波变换生成多尺度注意力信号
注意力信号条件化 MobileNetV3 空间主干的特征提取

2. 真实中心学习策略¶

不直接建模多样化伪造模式（传统方法）
而是将特征表示锚定在真实人脸图像周围
使用指数移动平均原型更新 + 漂移正则化
通过真实分布的偏离程度检测伪造

3. 轻量化设计¶

主干网络：MobileNetV3（高效移动端骨干）
参数量：2.63M（比传统方法少约 9 倍）
支持 INT8 量化部署

实验结果¶

在 DiFF 基准上的跨域评估（来源：论文摘要）：

指标	LRD-Net	基线方法
跨域检测准确率	SOTA	—
参数量	2.63M	~24M
训练速度	8x+ 更快	基线
推理速度	~10x 更快	基线

关键发现：LRD-Net 在保持跨域泛化能力的同时，将计算量压缩到可实时部署的水平。这打破了"检测精度"与"计算效率"之间的传统权衡。

关键洞察¶

频域引导优于并行处理：序列式架构用频域信号指导空间特征提取，避免了双分支的冗余计算，同时保留了频域信息的判别力
真实中心学习更高效：建模"什么是真实的"比建模"什么是假的"更具泛化性，因为伪造模式是无限的但真实分布是有限的
轻量化的关键在于设计而非压缩：从架构层面（MWGM + MobileNetV3）实现轻量化，而非后处理压缩

为什么重要¶

对手机端 AI 生态的意义： - 移动端反欺诈：可集成到手机人脸认证系统中，实时检测 deepfake 攻击 - 隐私保护：本地化检测避免上传人脸数据到云端 - 边缘设备部署：2.63M 参数适合 NPU/GPU 低功耗推理 - 与 FaceLiVTv2 互补：FaceLiVTv2 聚焦活体检测，LRD-Net 聚焦伪造检测，两者可组合为完整的人脸安全方案

关联¶

[[facelivtv2]] — 同为轻量级移动端人脸模型，活体检测方向
[[apple-intelligence]] — Apple 端侧安全策略
[[coremltools-9]] — 可通过 Core ML 部署到 iOS 设备
[[ggml-llamacpp-hf]] — 可通过 GGUF 量化部署到跨平台边缘设备