+高级检索
网刊加载中。。。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

面向标准单元布局的自适应加权平均线长模型  PDF

  • 迟元晓 1,2
  • 王志君 3
  • 梁利平 3
  • 邱昕 1
1. 中国科学院 微电子研究所,北京 100029; 2. 中国科学院大学 集成电路学院,北京100049; 3. 北京邮电大学 集成电路学院,北京 100876

中图分类号: TN431.2

最近更新:2025-04-24

DOI: 10.16339/j.cnki.hdxbzkb.2025276

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

现有EDA工具通过在密度约束条件下使半周长线长(half-perimeter wirelength, HPWL)总和最小化方法来解决集成电路物理版图设计中标准单元的全局布局问题.然而,HPWL 的不可导性使得基于梯度的先进求解方法无法直接应用于全局布局.因此,布局中通常使用加权平均线长(weighted-average wirelength, WAWL)模型来近似 HPWL,但无法兼顾平滑度和精度.因此,本文提出了一种改进的自适应加权平均线长(SaWAWL)模型,通过每条连线实际长度自适应地调整各自的加权因子γ,在保证平滑度的同时使拟合HPWL的误差更小,提高了标准单元全局布局质量.基于所提出的模型实现了一个全局布局器,并完成了在DAC 2012 开源基准上的验证.结果表明,该模型可以使半周长线长总和减少3.69%.

布局(placement)决定超大规模集成电路(very large scale integration, VLSI)物理设计中的标准单元在版图中的位置,其结果直接影响设计质量,包括功耗、时序收敛、信号完整性等各项性能指标,是物理设计的基石,可以说,如果不能实现高质量的布局结果,物理设计的后续步骤(如时钟树综合和布线)是没必要进行的.因此,寻求一种高效的方法来解决布局问题对整个物理设计来说意义重大.然而,布局是一个难以直接求解的NP 困难问

1,其求解方法经历了三个阶段,依次分别是模拟退火算2、基于划分的布局方3-4和解析布局方法,其中解析布局是目前解决 VLSI 布局问题最先进的方5-14,也是当下主流自动布局布线工具(电子设计自动化,electronic design automation, EDA)如Innovus采用的方法.解析布局将整个布局过程分为三个步骤,依次为全局布局(global placement, GP)、合法化(legalization, LG)和详细布局(detailed placement, DP).在这三个步骤中,全局布局是最重要的一步,因为它大致决定了所有标准单元的位置,而这直接决定了解析布局的结15;LG 负责在GP的基础上将标准单元合理摆放,主要任务是消除它们之间的重叠;DP则在前述两个步骤的基础上进行增量优化,进一步提高布局的质量.

总体来讲,在VLSI物理设计中,总线长,即所有单元互连的总半周长线长(HPWL)与设计的各关键指标呈正相关关系,更短的线长意味着更低的功耗、更小的串扰、更短的延时、更小的压降等.因此,在GP阶段采用线长驱动的布局算法(wirelength-driven placement, WDP)是提高电路整体性能的常用方法.

WDP通过在密度约束下,最小化设计中所有单元的半周长线长(HPWL)之和的方式来确定标准单元的位

16.由于 HPWL 不可导,提出了许多可导的线长模型来逼近HPWL,如长和指数(long-sum-Exp,LSE)线长模17、二次线长模18、CHKS 线长模19、加权平均线长(weighted-average wirelength, WAWL)模20等.在所有模型中,WAWL虽然最初是为了解决三维布局问题而提出的,但其性能优异且同样适用于二维,几乎所有当下领先的布局器如 RePlace13、NTUPlace8-9和DREAMPlace 21都采用了WAWL这一模型.然而WAWL这一当下最先进的模型仍存在一个问题——无法平衡精度和模型平滑度之间的关系.这是因为WAWL的性能由系数 γ 控制,γ 的值越大,函数越平滑,但相应的拟合误差也越大.

本文旨在解决前述WAWL线长模型不能兼顾精度与平滑度的问题.为此,首先推导了 WAWL与标准HPWL模型之间的拟合误差函数,研究了该误差随 γ 和线长的变化.并在此基础上,提出了一种改进的自适应加权平均线长模型.不同于传统的WAWL为所有连线设置统一的γ值,新模型在布局过程中使得每根连线可根据其自身实际长度自适应地调整各自的γ值.这样,由加权平均模型计算得到的线长的误差就能稳定在一个很小的值上,且保证了较好的模型平滑度.接着,我们将提出的线长模型集成到当前最先进的线长驱动的全局布局器 DREAMPlace

21中,得到了一个新的全局布局器.最后,在广受认可的开源数据集DAC 2012基准套件上进行了布局实验.实验结果显示,相比于文献[21],基于本文所提模型的布局算法能在全局布局中使HPWL目标降低3.69%,证明了提出的自适应加权平均线长模型的优越性.

本文第1节介绍解析布局中全局布局的基础知识与加权平均线长模型;第2节推导并分析加权平均线长模型的误差函数;第3节提出本文核心的自适应加权平均线长模型,并将其集成到先进的 DREAMPlace上,实现了一个新的全局布局器;第4节介绍了实验环境与实验结果;第5节总结.

1 解析布局

GP将物理设计中的所有标准单元分散摆放,大致决定每个标准单元在版图中的位置,是解析布局中最重要,也是耗时最长的一

21.一般来说,GP分为两类,一类称为二次布局(quadratic placement22-24,另一类称为非线性布局(nonlinear placement8-925. 二次布局由于采用了平方项的目标函数,效率相对更高;而非线性布局则能获得更高的布局质21,本文主要探究性能更优的非线性布局.如前文所述,非线性布局通过在密度约束下最小化线长目标来解决布局问题,如式(1)所示:

min eEWL(e;x,y) (1)
s.t. dx,y  dt

式中:x,y分别表示单元在版图中的横、纵坐标;WL(·;·)表示设计中所有单元(包括标准单元和宏单元)的总的连线长度; dt是预先设定的目标密度,用于规范全局布局后单元间的重叠.采用拉格朗日松弛法将密度约束放宽到线长目标,作为密度惩罚,即得到全局布局算法的目标函数,如式(2)

7-9

min  eEWLe;x,y+λD(x,y) (2)

式中: D(·) 是避免布局过于集中的密度惩罚函数;λ表示密度约束的权重.要利用当下先进的梯度方法解决式(2)的非线性优化问题,WL(·;·)目标必须是可微分的,但HPWL的表达式如式(3)

15所示,显然是不可导的.

WL(x,y)hpwl=eϵEmaxvi,vjϵexi-xj+                           maxvi,vjϵeyi-yj (3)

因此,非线性布局需要采用平滑的线长模型来近似HPWL.式(4)

10介绍了当前最先进的平滑模型 WAWL,此模型已被广泛应用于非线性布线.

WL(x,y)wawl=iexiexiγiEexiγ-iexie-xiγiEe-xiγ (4)

在WAWL中,γ是预定义的参数,用于调节 WAWL的性能.文献[

21]指出,WAWL的平滑度和精度相互冲突,由γ控制,但未给出相应的数学推导. 因此,为了更好地探究WAWL的平滑度与精度之间的关系,并更好地发挥WAWL在布局问题中的作用,我们推导了WAWL与标准的HPWL的误差函数,并详细研究了其数学特性.

2 误差函数

在不失一般性的前提下,考虑两个单元在 x 方向上连接的情况(y方向的分析完全相同).假设两个单元的横坐标分别为 x1x2,将坐标分别代入两种线长模型的表达式(3) 和(4),可以得到如下公式:

WAWLx=x1ex1γ+x2ex2γex1γ+ex2γ-x1e-x1γ+x2e-x2γe-x1γ+e-x2γ (5)
HPWLx=x1-x2 (6)

式中:WAWLxHPWLx分别表示由WAWL和 HPWL计算得出的连线长度.假设x1>x2,可以将 式(6)重写为式(7)

HPWLx=x1-x2 (7)

然后,从式(7)中减去式(5), 即可计算出误差:

Δ=HPWLx-WAWLx (8)

式中:Δ表示误差函数.将HPWLxWAWLx的具体表达式代入式(8),误差函数可表述如下:

Δ=x1-x2-x1ex1γ+x2ex2γex1γ+ex2γ+x1e-x1γ+x2e-x2γe-x1γ+e-x2γ (9)

简化式(9)即可得到:

Δ=x-xexγ-xe-xγ2+exγ+e-xγ (10)

式中:x=x1-x2.

为了进一步探讨γxΔ之间的关系,求Δ关于x的导数,得到式(11)

Δ'=2(e-xγ)2+2exγ+6e-xγ-2xγe-xγ-2xγexγ+6-4xγ(2+exγ+e-xγ)2 (11)

注意到式(11) 的分母恒为正值,且对于导函数我们只关注其值的正负,因此,可提取Δ'的分子作为一个新函数g(t),并研究其取值变化情况.

gt=2(e-t)2+2et+6e-t-2tet-2te-t+6-4t (12)

其中t=x/γt>0.然后,求出gt)关于t的导数:

g(t)'=-4e-t+12-2t(et-e-t) (13)

显然,当t>0时,g(t)'总是负值,即g(t)在区间 [0,+)内是单调递减的.因此,Δ'也是[0,+)的单调减函数.又因为Δ'(0)=1Δ'(+)=-,所以有且仅有一个满足Δ(x0)'=0的点x0,使得误差函数Δ[0,x0]内单调递增,在[x0,+)内单调递减,即误差函数在x=x0处取得最大值.在Matlab的帮助下,可以求得x0的近似值.

x1.275γ时,Δ'0Δmax=0.557γ.即误差函数Δ在区间[0,1.275γ)内单调递增,在[x0,+∞)内单调递减.

3 自适应加权平均线长模型与全局布局器

3.1 自适应加权平均线长模型

式(14)所示,连线长度越接近 1.275γ,误差就越大,且最大误差与 γ 的取值成正比.当连线长度接近式(14)的极大值点1.275γ时,若γ 的值越小,误差就会越小;但γ的值不能过小,以免影响WAWL的平滑度.基于此,考虑提出一个自适应的γ',其值可以根据连线长度实现自调节:在实际线长接近极大值点时将γ调节到较小的值以减小误差;在远离极大值点时,γ调节至较大的值以保证平滑度和收敛性能.

基于上述推导,考虑具有以下特性的函数式(14)(如表1所示),该函数具有有限的取值区间,一个极小值点,在极限值点两侧与误差函数相反的增减性,借助该函数可以通过适当的k取值来构造满足需求的自适应γ表达式.

fx=x/ekx (14)
表1  自适应加权平均线长函数
Tab.1  Function of proposed wirelength model
函数fx=x/ekx,k>0
极小值点 x=1/k
取值范围 [0,1/(e×k)]
单调性 [0,1/k] ↑, [k,+∞) ↓

构造的自适应γ的表达式见式(15),其中γmaxγmin是为平衡精度和平滑度而预先设定的γ取值上限和下限,γ的取值只会在两者之间变化;x表示连线的实际长度.γx变化的情况见图1,可见借助 式(15)γ可以实现基于x的自适应调节.

fig

图1  γ随连线长度的自适应变化曲线

Fig.1  The self-adaptive γ with different half-perimeter wirelength

γ=-xγmax-γmin×exp -x/1.275(γmax+γmin)+γmax (15)

式(15)应用到加权平均线长模型中,即可得到一种新的自适应加权平均线长(self-adaptive weighted-average wirelength, SaWAWL)模型.不同于传统的加权平均线长模型为所有连线设置一个统一的 γ,本模型给设计中的每根连线分配一个独立的γ,其值由连线根据其实际长度自适应调整,从而在全局布局过程中始终以较小误差拟合HPWL的同时保持模型的平滑度.具体的算法实现如表 2 所示.

表2  自适应加权平均线长模型算法实现
Tab.2  Algorithm of proposed wirelength model

算法1: 自适应加权平均线长模型

输入:γ取值边界γmax,γmin,设计,连线总数K,迭代参数k← 0

while k<K do

xmaxmax (net_k)

xmin min (net_k)

xxmax- xmin

γkγ(x)

WL ← WAWL(x,γ

k++

end

返回: 更新γ后的加权平均连线长度

3.2 基于SaWAWL的全局布局器

基于本文提出的SaWAWL 模型和文献[

21]中实现的目前最先进的 DREAMPlace 框架,实现了新的全局布局器,具体的算法结构如表3所示.在每轮迭代中,进行线长的前向传播和反向传播运算时,会调用算法1更新γ的值,并计算相应的加权平均线长,直至整个布局达到预设的收敛条件.

表3  基于SaWAWL的全局布局算法
Tab.3  Algorithm of SaWAWL based global placement

算法2:基于SaWAWL的全局布局算法

输入:设计,γ的取值边界γmaxγmin,停止判断条件stop_overflow

初始化:

x=x0,y=y0

While 密度溢出stop_overflow do

for eE do

WLe0

xeHPWLx, yeHPWL(y)

γxγx,  γyγy;

xeiWAWL(xe,γx)   yeiWAWL(ye,γy)

WLeixei+yei

WLeWLe+WLei

end for

计算 WL=eEWLe

解析最小化 WL+λ×density_penalty

更新 x,y

计算 密度溢出;

Return (x*,y*

4 实验环境与实验结果

4.1 实验环境

本文所有实验基于配有英伟达RTX3090显卡的英特尔2.7GHz Linux 服务器完成,代码则由Python和CUDA联合编程实现.布局实验在广受认可的开源数据集 DAC 2012 基准套

26上进行.

对本文布局器与当前最先进的全局布局器 DREAMPlace进行一系列对比实验,以验证所提出的线长模型的优越性.DREAMPlace有不同的版本,本实验采用的是DREAMPlace-Master.为了直观展示线长模型对全局布局结果的影响,关闭具有增量优化效果的DP,并设置与DREAMPlace完全相同的停止迭代的密度溢出条件(stop overflow),从而保证相同的LG影响.

4.2 模型仿真结果

SaWAWL的模型仿真结果如图2所示,图中曲线展示了WAWL和SaWAWL对HPWL的拟合结果.从图中可以看见,在红虚线标注区间内,WAWL不能很好地近似HPWL,而SaWAWL则实现了对HPWL较好的拟合,这是因为其通过将此区间内的γ调整到较小值(如图1),减小了模型的拟合误差.图3显示了两种线长模型相对HPWL的误差,证实了本文算法确实可以实现更小的误差.

fig

图2  线长模型的仿真结果

Fig.2  Simulation result of wirelength models

fig

图3  线长模型的误差曲线

Fig.3  Error curve of wirelength models

4.3 全局布局结果

全局布局在宏单元固定的基础上将标准单元逐步分散,确定其在版图中的位置.图4展示了本实验采用的数据集DAC 2012中一个测试基准SB2的布局过程,其中橘色区域表示预先放置好的宏单元,蓝色代表需进行布局的标准单元.从图中可以看出, 图4(a)的初始状态阶段,标准单元集中分布;在布局迭代过程中,布局器将集中摆放的标准单元逐渐分散摆放,如图4(b)图4(c)所示,并最终得到了标准单元均匀摆放布局结果,如图4(d)所示.

fig

(a) 

(b) 

  

fig

(c) 

(d) 

  

图4  SB2的全局布局过程

Fig.4  Four stages of global placement on dataset SB2

本文全局布局器的实验结果见表4.表4的左侧介绍了数据集DAC 2012的基本信息,由表可知该数据集涵盖了从523k门到1 014k门的设计,具有代表性.表4的右侧展示了本文算法与当下最先进的线长驱动全局布局器DREAMPlace的对比实验结果.可见与最先进的布局器相比,采用本文所提SaWAWL 模型的布局器实现了更优的布局结果:在开源基准上实现了HPWL 最多3.69%的减少.实验结果证明了本文所提出的加权平均线长模型的优越性.

表4  基于DAC 2012数据集的全局布局实验结果
Tab.4  Results of global placement based on DAC 2012 benchmarks
DesignnodesnetsHPWL/(107μmourDiff/%
DREAMPlace*
SB2 1 014k 991k 56.98 56.20 -1.37
SB3 920k 898k 28.34 27.79 -1.94
SB6 1014k 1 007k 29.97 29.72 -0.83
SB7 1 365k 1 340k 35.52 34.43 -3.69
SB9 847k 936k 20.56 20.49 -0.34
SB11 955k 1 293k 31.36 31.22 -0.45
SB14 635k 620k 20.66 20.23 -2.08
SB16 699k 697k 23.90 23.51 -1.63
SB19 523k 512k 13.37 13.00 -2.77
Norm -1.68

注:  *为了直接验证模型对全局布局的影响,我们在实验环境中运行了文献[

21
]中实现的布局器,参数均与文献[21]保持一致,与对比试验采用完全相同21自带默认参数设置.

5 结 论

本文提出了一种适用于超大规模集成电路全局布局的新型自适应加权平均线长模型.该模型在设计中每个连线可根据其实际线长自适应地调整γ值,在全局布局过程中精确地拟合HPWL.仿真结果表明,与最先进的WAWL模型相比,本文所提出的模型可实现更小的拟合误差.基于DAC 2012开源基准的全局布局实验结果表明,基于 SaWAWL的全局布局器相比基于WAWL的DREAMPlace可取得更好的布局结果,证明了所提出的模型的有效性.

本文实现的线长驱动的布局算法(wirelength-driven placement, WDP)综合考虑物理设计中的各项指标,如时序、功耗、可布线性等,通过追求总体最短的连线长度近似优化以上指标,但未落实到具体的性能指标,下一步将聚焦于探索具体指标如时序驱动的布局算法(timing-driven placement, TDP)研究.

参考文献

1

DONATH W EDONATH W EComplexity theory and design automation[C]//Proceedings of the 17th Design Automation Conference. Minneapolis,MinnesotaUSA. ACM1980412-419 [百度学术] 

2

TAGHAVI TYANG X JCHOI B KDragon2005:large-scale mixed-size placement tool[C]//Proceedings of the 2005 International Symposium on Physical DesignSan Francisco, California, USA.ACM2005245-247 [百度学术] 

3

ROY J APAPA D AADYA S Net alCapo:robust and scalable open-source Min-cut floorplacer[C]//Proceedings of the 2005 International Symposium on Physical DesignSan Francisco California, USA.ACM2005224-226 [百度学术] 

4

JIANG Z WCHENY T CHSUY T Cet alNTUplace2:a hybrid placer using partitioning and analytical techniques[C]//Proceedings of the 2006 International Symposium on Physical DesignSan Jose, California, USA.ACM2006215-217 [百度学术] 

5

KAHNG A BREDA SWANG Q KArchitecture and details of a high quality,large-scale analytical placer[C]//ICCAD-2005.IEEE/ACM International Conference on Computer-Aided Design,2005San Jose,CA,USA.IEEE2005891-898 [百度学术] 

6

CHAN TCONG JSZE KMultilevel generalized force-directed method for circuit placement[C]//Proceedings of the 2005 International Symposium on Physical DesignSan Francisco, California, USA.ACM2005185-192 [百度学术] 

7

KAHNG A BWANG Q KA faster implementation of APlace[C]//Proceedings of the 2006 International Symposium on Physical DesignSan Jose, California, USA.ACM2006218-220 [百度学术] 

8

CHEN T CJIANG Z WHSU T Cet al. NTUplace3:an analytical placer for large-scale mixed-size designs with preplaced blocks and density constraints[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems2008277):1228-1240 [百度学术] 

9

HSU M KCHEN Y FHUANG C Cet al. NTUplace4h: a novel routability-driven placement algorithm for hierarchical mixed-size circuit designs[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems20143312): 1914-1927 [百度学术] 

10

LU J WCHEN P WCHANG C Cet al. ePlace:electrostatics-based placement using fast Fourier transform and nesterov’s method[J]. ACM Transactions on Design Automation of Electronic Systems2015202):1-34 [百度学术] 

11

LU J WZHUANG HCHEN P Wet alePlace-MS:electrostatics-based placement for mixed-size circuits[J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems2015345):685-698 [百度学术] 

12

ZHU Z RCHEN J LPENG Zet alGeneralized augmented Lagrangian and its applications to VLSI global placement[C]//2018 55th ACM/ESDA/IEEE Design Automation Conference (DAC)San Francisco,CA,USA.IEEE20181-6 [百度学术] 

13

HE XHUANG TXIAO L Fet alRipple:a robust and effective routability-driven placer[J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems20133210):1546-1556 [百度学术] 

14

LIN TCHU CWU GPOLAR 3.0:an ultrafast global placement engine[C]//2015 IEEE/ACM International Conference on Computer-Aided Design (ICCAD). Austin,TX,USA. IEEE2015520-527 [百度学术] 

15

CHANG Y WJIANG Z WCHEN T C. Essential issues in analytical placement algorithms[J]. IPSJ Transactions on System LSI Design Methodology20092145-166. [百度学术] 

16

ALPERT C JMEHTA D PSAPATNEKAR S SHandbook of algorithms for physical design automation[M]. Boca Raton, FlaAuerbach Publications2008. [百度学术] 

17

KAHNG A BWANG Q K. A faster implementation of APlace[C]//Proceedings of the 2006 International Symposium on Physical Design. San Jose, California, USA. ACM2006218-220 [百度学术] 

18

VISWANATHAN NPAN MCHU CFastPlace 3.0:a fast multilevel quadratic placement algorithm with placement congestion control[C]//2007 Asia and South Pacific Design Automation Conference. YokohamaJapan.IEEE2007135-140 [百度学术] 

19

BHRAMAR RAY B NDAS SHAZRA Ket alAn optimized HPWL model for VLSI analytical placement[C]//2015 International Conference on Information Technology (ICIT). BhubaneswarIndia. IEEE20157-12 [百度学术] 

20

HSU M KCHANG Y WBALABANOV V. TSV-aware analytical placement for 3D IC designs[C]//Proceedings of the 48th Design Automation Conference. San Diego, California,USA. ACM2011664-669 [百度学术] 

21

LIN Y BJIANG Z XGU J Qet al. DREAMPlace:deep learning toolkit-enabled GPU acceleration for modern VLSI placement[J]. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems2021404): 748-761 [百度学术] 

22

KIM M CVISWANATHAN NALPERT C Jet alMAPLE:multilevel adaptive placement for mixed-size designs[C]//Proceedings of the 2012 ACM International Symposium on International Symposium on Physical Design. NapaCalifornia, USA. ACM2012193-220 [百度学术] 

23

KIM M CLEE D JMARKOV I LSimPL:an effective placement algorithm[C]//2010 IEEE/ACM International Conference on Computer-Aided Design (ICCAD). San Jose,CA,USA.IEEE2010649-656 [百度学术] 

24

LIN TCHU CSHINNERL J Ret alPOLAR:a high performance mixed-size wirelengh-driven placer with density constraints[J].IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems2015343):447-459 [百度学术] 

25

LI W XLIN Y BPAN D ZelfPlace:electrostatics-based placement for large-scale heterogeneous FPGAs[C]//2019 IEEE/ACM International Conference on Computer-Aided Design (ICCAD). Westminster,COUSA.IEEE20191-8 [百度学术] 

26

VISWANATHAN NALPERT CSZE Cet alThe DAC 2012 routability-driven placement contest and benchmark suite[C]//DAC Design Automation Conference 2012San Francisco,CA,USA. IEEE2012774-782 [百度学术] 

作者稿件一经被我刊录用,如无特别声明,即视作同意授予我刊论文整体的全部复制传播的权利,包括但不限于复制权、发行权、信息网络传播权、广播权、表演权、翻译权、汇编权、改编权等著作使用权转让给我刊,我刊有权根据工作需要,允许合作的数据库、新媒体平台及其他数字平台进行数字传播和国际传播等。特此声明。
关闭