type: concept tags: [hardware-design, asic, llm, topology-optimization, eda, edge-hardware, grpo] related: [[edgecim-hardware-codesign]], [[rl-asic-exploration]], [[lstm-gait-asic-accelerator]] sources: - url: https://arxiv.org/abs/2604.14237 title: "TOPCELL: Topology Optimization of Standard Cell via LLMs" date: 2026-04-17 reliability: high created: 2026-04-17 updated: 2026-04-17

TOPCELL: LLM 驱动的标准单元拓扑优化¶

将晶体管拓扑优化重新定义为生成任务，利用 LLM（通过 GRPO 微调）自主提出物理感知的拓扑修改，替代穷举搜索。

核心问题¶

标准单元是现代 ASIC 设计的基本构建块，其 PPA（功耗、性能、面积）指标直接影响整体系统级效率。在先进工艺节点： - 晶体管数量增加导致可扩展的标准单元设计自动化需求迫切 - 拓扑优化是标准单元设计的关键阶段——寻找最大化扩散共享的晶体管排列 - 传统穷举搜索方法随着电路复杂度增加变得计算上不可行 - 现有 SOTA 框架通过层级化串并树递归探索，但在高晶体管数量下迅速不可扩展

方法/架构¶

核心创新¶

端到端策略优化：将拓扑合成为端到端的策略优化问题
LLM 策略网络：输入标准单元网表，LLM 自主提出物理感知的拓扑修改
GRPO 微调：使用 Group Relative Policy Optimization（与 DeepSeek 相同的训练方法）对 LLM 进行领域特定微调
可扩展设计空间探索：LLM 能快速推理复杂输入（如网表），克服传统方法的指数复杂度

流水线¶

标准单元网表 → LLM 策略 → 拓扑修改建议 → 布局评估 → PPA 优化
                    ↑                                    |
                    └────── GRPO 奖励信号 ───────────────┘

实验结果/关键数据¶

在高级技术节点的标准单元上验证
相比穷举搜索，计算复杂度大幅降低
LLM 能够发现人类设计者难以直观找到的拓扑方案

关键洞察¶

LLM 在 EDA 的新应用：TOPCELL 将 LLM 的应用从代码生成和程序修复扩展到物理设计优化——一个全新的领域
GRPO 的跨领域有效性：GRPO（Group Relative Policy Optimization）不仅用于推理模型训练，也可用于硬件设计的策略优化
从搜索到生成的范式转换：传统 EDA 是搜索问题（在离散空间中找最优解），TOPCELL 将其转化为生成问题（LLM 直接生成候选方案）

为什么重要¶

对手机端 AIOS 的硬件生态： 1. 端侧芯片设计加速：更高效的 ASIC 拓扑优化可以加速 NPU/AI 加速器的设计迭代 2. LLM 驱动的 EDA 工具链：与 [[edgecim-hardware-codesign]] 和 [[rl-asic-exploration]] 一起，展示了 AI 如何反过来优化 AI 硬件 3. 设计周期缩短：从穷举搜索到 LLM 生成，拓扑优化时间大幅缩短

关联¶

[[edgecim-hardware-codesign]] — CIM 加速器的硬件-软件协同设计
[[rl-asic-exploration]] — RL 驱动的 ASIC 设计空间探索
[[lstm-gait-asic-accelerator]] — LSTM 步态分析 ASIC 加速器
[[trispirit-cognitive-architecture]] — 三层认知架构硬件设计