Continual Learning of Feedback-based Molecular Communication¶
论文基本信息¶
- 作者: Siddhant Setia, Junichi Suzuki, Tadashi Nakano
- arXiv: https://arxiv.org/abs/2605.01020
- 领域: cs.LG
- 类别: 持续学习 → 分子通信场景下的增量学习
摘要(翻译)¶
分子通信(Molecular Communication, MC)是一种利用分子信息传递信息的仿生通信范式,在医疗植入物、纳米网络等场景有重要应用。评估分子通信协议的 성능 需要大量仿真实验,而这些实验通常按顺序在不同的设置下进行。本文提出利用持续学习(Continual Learning, CL)算法来执行顺序仿真实验的性能估计器。该估计器能够增量地学习一系列未体验过的估计任务,同时不损害已学习的知识。研究者将 CL 策略(正则化和回放)整合到损失函数中,在标准神经网络架构上运行。实验表明,估计器能够有效学习连续流的仿真结果,在多种计算成本下提升基线神经网络的估计精度。本文的贡献在于建立了持续学习在分子通信领域的影响。
核心贡献¶
- 首个将持续学习应用于分子通信仿真估计的任务:将 CL 引入分子通信协议评估,填补了该交叉领域的空白。
- 增量式性能估计器:能够在顺序执行的仿真实验中持续学习新任务,而不遗忘旧任务的知识。
- 基于损失函数整合的 CL 策略:通过在标准神经网络中定制正则化和回放策略,使 CL 方法工程上易于部署。
- 多成本下的精度提升:在多种计算成本配置下均优于基线神经网络,验证了方法的通用性。
- 为纳米级植入式设备的在线学习提供了新范式:分子通信是体内纳米网络的核心使能技术,本工作使其能适应动态变化的生理环境。
研究背景与问题¶
分子通信背景¶
分子通信是纳米尺度/微米尺度生物系统中的信息传递机制:发送方通过释放特定分子(如钙离子、葡萄糖分子)编码信息,接收方通过检测分子浓度变化解码信息。在体内给药系统、尿路纳米机器人、胃肠道靶向给药等场景有广泛应用。
核心问题¶
评估分子通信协议的性能需要大量物理层仿真。这些仿真是顺序进行的——研究者在不同参数配置、温度条件、分子类型下逐步探索。当使用神经网络作为性能估计器时,传统方法面临两个困境: - 灾难性遗忘:学习新配置时完全遗忘旧配置下学到的知识 - 效率低下:每次新配置都从头训练,而不是增量适应
Benchmarks 报告性能从 0.455 降至 0.05(LOCOMO)和 LOCCO 数据集说明了持续学习问题的普遍性和严重性。
为什么重要¶
分子通信协议的设计空间巨大(分子类型、释放时机、扩散系数、信噪比等),穷举仿真成本极高。神经网络估计器可以快速预测任意配置下的性能,但需要能够持续适应新的实验结果——这正是本文要解决的问题。
核心方法¶
架构¶
标准前馈神经网络作为性能估计器,输入为分子通信配置参数,输出为性能指标(如误码率、吞吐量)。
CL 策略整合¶
在损失函数中整合两类 CL 策略:
正则化策略:通过在损失中加入正则项,限制重要参数在新任务学习时的更新幅度。在本文中体现为 weight decay 的自适应调度——对编码关键物理关系的参数施加更大的正则化强度。
回放策略(Replay):在训练新任务时,保留一小部分旧任务的样本(通常通过显存 buffer 或外部存储),使网络能够同时见到新旧样本。本文中具体采用经验回放(empirical replay),保留少量历史仿真实例。
在线增量学习¶
估计器以在线方式处理仿真结果的连续流:每个新仿真完成后立即用于更新模型,无需存储完整的历史数据集。
为什么重要¶
- 交叉学科创新:首次将 CL 引入分子通信,为纳米级通信系统的在线适应提供了新范式
- 实际部署价值:能够在资源受限的纳米设备上进行在线学习,无需离线批处理
- 科学发现加速:使研究者能够快速探索巨大的设计空间,而非逐一手动仿真
与移动端/端侧相关性¶
中等相关。虽然本文场景是分子通信,但其核心贡献——有限容量下的增量学习、不遗忘旧知识的神经网络——对端侧 AI 有直接参考价值:
- 移动端持续学习:移动设备上的个性化模型需要持续学习用户行为,同时不遗忘先前学到的通用知识
- 边缘推理加速:分子通信中的低功耗需求与移动/可穿戴设备的能效目标高度一致
- 资源受限学习:本文方法专门针对"有限容量"场景设计,与端侧设备的内存/计算约束天然契合
关键词:有限容量学习、增量仿真估计、分子通信、纳米网络、在线学习