跳转至

type: concept tags: [hardware-design, asic, llm, topology-optimization, eda, edge-hardware, grpo] related: [[edgecim-hardware-codesign]], [[rl-asic-exploration]], [[lstm-gait-asic-accelerator]] sources: - url: https://arxiv.org/abs/2604.14237 title: "TOPCELL: Topology Optimization of Standard Cell via LLMs" date: 2026-04-17 reliability: high created: 2026-04-17 updated: 2026-04-17


TOPCELL: LLM 驱动的标准单元拓扑优化

将晶体管拓扑优化重新定义为生成任务,利用 LLM(通过 GRPO 微调)自主提出物理感知的拓扑修改,替代穷举搜索。

核心问题

标准单元是现代 ASIC 设计的基本构建块,其 PPA(功耗、性能、面积)指标直接影响整体系统级效率。在先进工艺节点: - 晶体管数量增加导致可扩展的标准单元设计自动化需求迫切 - 拓扑优化是标准单元设计的关键阶段——寻找最大化扩散共享的晶体管排列 - 传统穷举搜索方法随着电路复杂度增加变得计算上不可行 - 现有 SOTA 框架通过层级化串并树递归探索,但在高晶体管数量下迅速不可扩展

方法/架构

核心创新

  1. 端到端策略优化:将拓扑合成为端到端的策略优化问题
  2. LLM 策略网络:输入标准单元网表,LLM 自主提出物理感知的拓扑修改
  3. GRPO 微调:使用 Group Relative Policy Optimization(与 DeepSeek 相同的训练方法)对 LLM 进行领域特定微调
  4. 可扩展设计空间探索:LLM 能快速推理复杂输入(如网表),克服传统方法的指数复杂度

流水线

标准单元网表 → LLM 策略 → 拓扑修改建议 → 布局评估 → PPA 优化
                    ↑                                    |
                    └────── GRPO 奖励信号 ───────────────┘

实验结果/关键数据

  • 在高级技术节点的标准单元上验证
  • 相比穷举搜索,计算复杂度大幅降低
  • LLM 能够发现人类设计者难以直观找到的拓扑方案

关键洞察

  1. LLM 在 EDA 的新应用:TOPCELL 将 LLM 的应用从代码生成和程序修复扩展到物理设计优化——一个全新的领域
  2. GRPO 的跨领域有效性:GRPO(Group Relative Policy Optimization)不仅用于推理模型训练,也可用于硬件设计的策略优化
  3. 从搜索到生成的范式转换:传统 EDA 是搜索问题(在离散空间中找最优解),TOPCELL 将其转化为生成问题(LLM 直接生成候选方案)

为什么重要

对手机端 AIOS 的硬件生态: 1. 端侧芯片设计加速:更高效的 ASIC 拓扑优化可以加速 NPU/AI 加速器的设计迭代 2. LLM 驱动的 EDA 工具链:与 [[edgecim-hardware-codesign]] 和 [[rl-asic-exploration]] 一起,展示了 AI 如何反过来优化 AI 硬件 3. 设计周期缩短:从穷举搜索到 LLM 生成,拓扑优化时间大幅缩短

关联

  • [[edgecim-hardware-codesign]] — CIM 加速器的硬件-软件协同设计
  • [[rl-asic-exploration]] — RL 驱动的 ASIC 设计空间探索
  • [[lstm-gait-asic-accelerator]] — LSTM 步态分析 ASIC 加速器
  • [[trispirit-cognitive-architecture]] — 三层认知架构硬件设计