Continual Learning of Feedback-based Molecular Communication¶

论文基本信息¶

作者: Siddhant Setia, Junichi Suzuki, Tadashi Nakano
arXiv: https://arxiv.org/abs/2605.01020
领域: cs.LG
类别: 持续学习 → 分子通信场景下的增量学习

摘要（翻译）¶

分子通信（Molecular Communication, MC）是一种利用分子信息传递信息的仿生通信范式，在医疗植入物、纳米网络等场景有重要应用。评估分子通信协议的 성능 需要大量仿真实验，而这些实验通常按顺序在不同的设置下进行。本文提出利用持续学习（Continual Learning, CL）算法来执行顺序仿真实验的性能估计器。该估计器能够增量地学习一系列未体验过的估计任务，同时不损害已学习的知识。研究者将 CL 策略（正则化和回放）整合到损失函数中，在标准神经网络架构上运行。实验表明，估计器能够有效学习连续流的仿真结果，在多种计算成本下提升基线神经网络的估计精度。本文的贡献在于建立了持续学习在分子通信领域的影响。

核心贡献¶

首个将持续学习应用于分子通信仿真估计的任务：将 CL 引入分子通信协议评估，填补了该交叉领域的空白。
增量式性能估计器：能够在顺序执行的仿真实验中持续学习新任务，而不遗忘旧任务的知识。
基于损失函数整合的 CL 策略：通过在标准神经网络中定制正则化和回放策略，使 CL 方法工程上易于部署。
多成本下的精度提升：在多种计算成本配置下均优于基线神经网络，验证了方法的通用性。
为纳米级植入式设备的在线学习提供了新范式：分子通信是体内纳米网络的核心使能技术，本工作使其能适应动态变化的生理环境。

研究背景与问题¶

分子通信背景¶

分子通信是纳米尺度/微米尺度生物系统中的信息传递机制：发送方通过释放特定分子（如钙离子、葡萄糖分子）编码信息，接收方通过检测分子浓度变化解码信息。在体内给药系统、尿路纳米机器人、胃肠道靶向给药等场景有广泛应用。

核心问题¶

评估分子通信协议的性能需要大量物理层仿真。这些仿真是顺序进行的——研究者在不同参数配置、温度条件、分子类型下逐步探索。当使用神经网络作为性能估计器时，传统方法面临两个困境： - 灾难性遗忘：学习新配置时完全遗忘旧配置下学到的知识 - 效率低下：每次新配置都从头训练，而不是增量适应

Benchmarks 报告性能从 0.455 降至 0.05（LOCOMO）和 LOCCO 数据集说明了持续学习问题的普遍性和严重性。

为什么重要¶

分子通信协议的设计空间巨大（分子类型、释放时机、扩散系数、信噪比等），穷举仿真成本极高。神经网络估计器可以快速预测任意配置下的性能，但需要能够持续适应新的实验结果——这正是本文要解决的问题。

核心方法¶

架构¶

标准前馈神经网络作为性能估计器，输入为分子通信配置参数，输出为性能指标（如误码率、吞吐量）。

CL 策略整合¶

在损失函数中整合两类 CL 策略：

正则化策略：通过在损失中加入正则项，限制重要参数在新任务学习时的更新幅度。在本文中体现为 weight decay 的自适应调度——对编码关键物理关系的参数施加更大的正则化强度。

回放策略（Replay）：在训练新任务时，保留一小部分旧任务的样本（通常通过显存 buffer 或外部存储），使网络能够同时见到新旧样本。本文中具体采用经验回放（empirical replay），保留少量历史仿真实例。

在线增量学习¶

估计器以在线方式处理仿真结果的连续流：每个新仿真完成后立即用于更新模型，无需存储完整的历史数据集。

为什么重要¶

交叉学科创新：首次将 CL 引入分子通信，为纳米级通信系统的在线适应提供了新范式
实际部署价值：能够在资源受限的纳米设备上进行在线学习，无需离线批处理
科学发现加速：使研究者能够快速探索巨大的设计空间，而非逐一手动仿真

与移动端/端侧相关性¶

中等相关。虽然本文场景是分子通信，但其核心贡献——有限容量下的增量学习、不遗忘旧知识的神经网络——对端侧 AI 有直接参考价值：

移动端持续学习：移动设备上的个性化模型需要持续学习用户行为，同时不遗忘先前学到的通用知识
边缘推理加速：分子通信中的低功耗需求与移动/可穿戴设备的能效目标高度一致
资源受限学习：本文方法专门针对"有限容量"场景设计，与端侧设备的内存/计算约束天然契合

关键词：有限容量学习、增量仿真估计、分子通信、纳米网络、在线学习