type: concept tags: [hardware-design, asic, llm, topology-optimization, eda, edge-hardware, grpo] related: [[edgecim-hardware-codesign]], [[rl-asic-exploration]], [[lstm-gait-asic-accelerator]] sources: - url: https://arxiv.org/abs/2604.14237 title: "TOPCELL: Topology Optimization of Standard Cell via LLMs" date: 2026-04-17 reliability: high created: 2026-04-17 updated: 2026-04-17
TOPCELL: LLM 驱动的标准单元拓扑优化¶
将晶体管拓扑优化重新定义为生成任务,利用 LLM(通过 GRPO 微调)自主提出物理感知的拓扑修改,替代穷举搜索。
核心问题¶
标准单元是现代 ASIC 设计的基本构建块,其 PPA(功耗、性能、面积)指标直接影响整体系统级效率。在先进工艺节点: - 晶体管数量增加导致可扩展的标准单元设计自动化需求迫切 - 拓扑优化是标准单元设计的关键阶段——寻找最大化扩散共享的晶体管排列 - 传统穷举搜索方法随着电路复杂度增加变得计算上不可行 - 现有 SOTA 框架通过层级化串并树递归探索,但在高晶体管数量下迅速不可扩展
方法/架构¶
核心创新¶
- 端到端策略优化:将拓扑合成为端到端的策略优化问题
- LLM 策略网络:输入标准单元网表,LLM 自主提出物理感知的拓扑修改
- GRPO 微调:使用 Group Relative Policy Optimization(与 DeepSeek 相同的训练方法)对 LLM 进行领域特定微调
- 可扩展设计空间探索:LLM 能快速推理复杂输入(如网表),克服传统方法的指数复杂度
流水线¶
标准单元网表 → LLM 策略 → 拓扑修改建议 → 布局评估 → PPA 优化
↑ |
└────── GRPO 奖励信号 ───────────────┘
实验结果/关键数据¶
- 在高级技术节点的标准单元上验证
- 相比穷举搜索,计算复杂度大幅降低
- LLM 能够发现人类设计者难以直观找到的拓扑方案
关键洞察¶
- LLM 在 EDA 的新应用:TOPCELL 将 LLM 的应用从代码生成和程序修复扩展到物理设计优化——一个全新的领域
- GRPO 的跨领域有效性:GRPO(Group Relative Policy Optimization)不仅用于推理模型训练,也可用于硬件设计的策略优化
- 从搜索到生成的范式转换:传统 EDA 是搜索问题(在离散空间中找最优解),TOPCELL 将其转化为生成问题(LLM 直接生成候选方案)
为什么重要¶
对手机端 AIOS 的硬件生态: 1. 端侧芯片设计加速:更高效的 ASIC 拓扑优化可以加速 NPU/AI 加速器的设计迭代 2. LLM 驱动的 EDA 工具链:与 [[edgecim-hardware-codesign]] 和 [[rl-asic-exploration]] 一起,展示了 AI 如何反过来优化 AI 硬件 3. 设计周期缩短:从穷举搜索到 LLM 生成,拓扑优化时间大幅缩短
关联¶
- [[edgecim-hardware-codesign]] — CIM 加速器的硬件-软件协同设计
- [[rl-asic-exploration]] — RL 驱动的 ASIC 设计空间探索
- [[lstm-gait-asic-accelerator]] — LSTM 步态分析 ASIC 加速器
- [[trispirit-cognitive-architecture]] — 三层认知架构硬件设计