摘要
结构形状的优化设计本质上是一类泛函极值求解问题. 在求解高维度泛函极值问题时,传统的变分法往往面临着求解目标函数类型有限、求解过程呈现振荡行为等问题. 利用深度学习模型的高维非线性映射能力,建立了一种基于物理驱动深度学习的泛函极值求解模型. 首先将描述结构形状优化问题的物理信息(控制方程、初始条件和边界条件等)作为正则化项嵌入深度学习模型中,基于性能目标构建损失函数;采用随机梯度下降法完成深度学习模型的训练,进而实现泛函极值的求解和结构形状的优化设计;通过分析最优曲面和最优拱轴线问题验证模型的有效性,并与遗传算法进行对比,结果表明该模型在小样本的目标任务上具有较高的预测精度和效率. 作为一种非参数模型化技术,物理驱动深度学习模型对解决数据采集成本高、难度大的工程问题具有重要意义.
工程中结构的形状优化是在给定约束条件下,在结构形状的优化空间内求解性能目标函数的极值. 结构的形状优化问题涉及建筑工程、结构工程、航天航空和岩土工程等领域,可归结为泛函极值问题,即寻找使对应泛函取极值的目标函数. 现阶段,基于Euler-Lagrange方
为了弥补传统数值方法的不足,国内外学者提出了一系列求解泛函极值问题的新型数值方法. Mahdy
此外,传统数值方法可能会受到高维空间的限制,耗费大量计算资源. 近年来,很多学者结合启发式算法对泛函极值问题开展了新的研究. Vogt
相较于启发式算法,深度学习算法展现出更强的鲁棒性、自适应性和广泛的应用范围. 随着计算机科学的飞速发展,深度学习在泛函极值问题上的应用日益广泛. 根据通用逼近定
机器学习作为新兴技术,已广泛应用于数值领域. 其中,物理驱动深度学习(Physics-Informed Deep Learning, PIDL)模型备受瞩目,该方法将深度学习与物理方程相结合,以更准确地建模和求解物理问题. 物理信息神经网络(Physics-Informed Neural Network, PINN
基于此,本文建立了一种基于物理驱动深度学习的结构形状优化求解方法. 该方法通过神经网络构建函数空间,在传统的深度学习模型中嵌入形状优化问题的物理知识(控制方程、初始条件和边界条件等),实现了物理知识与数据驱动模型的有机结合. 通过分析最优曲面和最优拱轴线问题,验证了该方法在结构形状优化中的有效性.
1 基于PIDL的泛函极值求解模型
1.1 形状优化问题的泛函极值描述
一般而言,考虑y(x)为待优化的结构几何特征,在外荷载f (x)作用下,结构的基本物理信息涵盖控制方程、初始条件和边界条件等,分别对应式(1)~
控制方程:
(1) |
边界条件:
(2) |
初始条件:
(3) |
结构形状优化旨在达成特定最优性能目标,寻求结构最优形状y*(x),该问题可视作在函数空间H上,满足物理信息条件的泛函极值问题:
(4) |
式中:L(y)为目标泛函;
1.2 泛函极值问题的PIDL模型
为解决泛函目标函数类型有限的问题,利用PIDL构造的函数空间,提出基于物理信息的深度学习泛函极值求解方法,将优化问题的物理信息嵌入传统神经网络中. 由PIDL方法构建神经网络,通过训练神经网络,得到使目标最优的函数.具体步骤如下:首先,采用神经网络构建函数空间,用于逼近最优函数. 其次,将形状优化问题的物理信息嵌入神经网络中. 最后,构建包含目标函数与物理约束的损失函数. 其中,目标函数项旨在反映结构形状的性能优化目标,物理约束项通过物理信息(控制方程、初始条件和边界条件等)对模型施加约束. 在模型训练过程中,首先随机初始化曲面函数,再利用随机梯度下降算法训练深度学习模型,通过训练数据逐步迭代调整参数得到最小化损失函数. 通过在优化问题的自定义区间、边界条件、初始条件上采样,利用基于深度学习的随机梯度下降算法进行网络训练,求解泛函极值问题,最终获得结构的最优化形状.
1.3 损失函数构建
用泛函极值问题的变分形式所对应的优化问题作为损失函数来训练神经网络. 下面构建损失函数:在函数空间H中,考虑所有光滑函数y(x)的集合. 若测试函数y(x)满足式(1)~
(5) |
(6) |
(7) |
(8) |
(9) |
Lloss | (10) |
式中:LF为目标泛函损失,Lf为控制方程损失,Lc为泛函约束损失,Lb为边界条件损失,LI为初始条件损失,Wf为控制方程损失权重,Wc为泛函约束损失权重,Wb为边界条件损失权重,WI为初始条件损失权重.
1.4 自动微分与积分离散化
物理驱动的深度学习方法训练分别采纳了自动微分算法与积分离散化算法,实现微分与积分计算. 自动微分利用符号微分处理基本算子,并通过链式法则整合各部分导数,从而精确评估由计算机程序表达的数值函数的导
泛函极值问题在样本空间选取采样点,采用辛普森法
1.5 梯度下降训练算法
神经网络训练旨在通过调整参数实现泛函的最小化,训练算法的应用可加快收敛. 模型迭代过程采用批量梯度下降法,具体步骤如下:首先,使用TensorFlow提供的自动微分功能计算目标函数的梯度;其次,进行梯度反向传播,结合Adam算
Adam算法是梯度下降法的一个变种. 该算法结合了一阶动量算法与RMSprop算
(11) |
(12) |
(13) |
符号 | 符号说明 | 符号 | 符号说明 |
---|---|---|---|
损失函数梯度一阶矩 | 目标函数梯度 | ||
损失函数梯度二阶矩 |
在第i次迭代时的 参数值 | ||
一阶矩的衰减系数 | 学习率 | ||
二阶矩的衰减系数 |
极小的常量 (防止分母为零) |
2 算例分析
2.1 最小旋转曲面问题
已知连续曲线通过两固定点,当该曲线绕横轴旋转时,所生成的旋转曲面面积最小,即对于通过点A(0, cosh(-1))和B(2, cosh(1))的曲线函数y= y(x),求最优函数y=y*(x),使旋转曲面面积最小. 其表达式为:
(14) |
式中:S为面积泛函,和为边界值.
构建损失函数需考虑结构的基本物理信息. 该案例中考虑端点约束条件,求一个测试函数,使得定义在函数空间H上的泛函达到最小值或最大值,可得损失函数如式(15)~
(15) |
(16) |
(17) |
式中:Wb=100.
利用PIDL求解最小旋转曲面问题,训练数据为在样本空间[0, 2]上均匀选取的100个样本点,网络训练采用Adam优化器. 神经网络结构包含1个神经元的输入层、10个神经元的隐藏层和1个神经元的输出层,且均为全连接层. 常用激活函数有Sigmoid函数、Tanh函数和Relu函数
(18) |

图1 泛函极值问题神经网络图
Fig.1 Neural network diagram for functional extremum problem
超参数 | 属性 | 值 |
---|---|---|
lr | 训练学习率 | 0.001 |
β1 | 一阶矩估计的指数衰减率 | 0.9 |
β2 | 二阶矩估计的指数衰减率 | 0.999 |
ε | 用于数值稳定性的常数 | 1e-7 |
Epoch | 训练总回合数 | 60 000 |
显式表达神经网络输出的计算公式如下:
(19) |
式中:、与、分别为第一层、第二层的神经网络的权重与偏置.
训练采用2.70 GHz Intel/6核/11代Intel Core i5-11 400 H处理器. 迭代60 000次所花费时间为55.15 s. 训练得到的预测母线表达式如下:
(20) |
式中:σ表示Sigmoid函数,
为进行对比研究,本文采用遗传算法搜索最小旋转曲面. 该算法首先随机初始化一定数量的个体,个体基因代表了泰勒展开系数的一组取值. 在每一代中计算旋转曲面面积,并在区间端点引入惩罚项以评估个体适应度. 通过多元竞标赛选择适应度最好的个体,并利用单点交叉生成新的子代. 在子代中进行变异操作,并用新子代替换原有种群中的部分个体,形成新的种群. 通过不断迭代,逐渐优化种群中的个体,寻找具有最优泰勒展开系数的旋转曲面母线,以满足性能优化目标和物理约束条件. 遗传算法的超参数设置如
超参数名称 | 参数取值 |
---|---|
种群大小 | 200 |
个体基因数量 | 4 |
迭代次数 | 6 000 |
变异率 | 0.000 1 |
变异扰动大小 | 0.02 |
多元竞标赛规模 | 3 |
遗传算法迭代6 000次用时182.95 s. 最小旋转曲面问题的PIDL预测解、GA预测解和理论计算得到的精确解分别如

(a) PIDL预测解

(b) GA预测解

(c) 精确解
图2 最小旋转曲面问题的解
Fig.2 Solutions of minimum rotation surface problem

图3 最小旋转曲面母线的PIDL预测解、GA预测解与精确解
Fig.3 Predictive solution of PIDL , predictive solution of GA and exact solution of the minimum rotation surface generatrix

图4 PIDL迭代收敛曲线
Fig.4 Iterative convergence curve of PIDL

图5 GA适应度曲线
Fig.5 Fitness curve of GA
如
(21) |

图6 PIDL预测母线平方误差曲线
Fig.6 Square error curve of the generatrix predicted by PIDL

图7 GA预测母线平方误差曲线
Fig.7 Square error curve of the generatrix predicted by GA
计算方法 | 旋转曲面面积 | 相对误差绝对值/% |
---|---|---|
PIDL预测值 | 17.594 92 | 0.466 |
GA预测值 | 17.837 02 | 0.904 |
2.2 最优拱轴线问题
最优拱轴线问题可描述为:确定三铰拱的拱轴线,使其在指定荷载下仅产生轴力. 已知拱上填料的荷载集度计算公式为:
(22) |
建立如

图8 三铰拱受力图
Fig.8 Force diagram of three-hinge arch
符号 | 参数名称 | 参数取值 |
---|---|---|
γ | 填料重度 |
20 kN/ |
qc | 拱脚荷载集度 |
700 kN/ |
f | 拱高度 | 17.5 m |
l | 拱跨度 | 50 m |
上述问题可描述为寻找一个最优函数,通过点O(0, 0)满足边界条件,且满足各拱截面弯矩M(x)为零. 鉴于对称性,仅考虑O点右侧拱轴线. 数学表述如下:
(23) |
式中:M(x)为对应截面弯矩,y0为O点对应的边界值.
三铰拱的截面弯矩,可表达为对应简支梁的截面弯矩减去拱脚水平推力产生的弯矩. 计算公式如
(24) |
式中:
(25) |
构建损失函数需考虑结构的基本物理信息. 该案例中考虑边界约束条件和控制条件,求一个测试函数,使得定义在函数空间上的泛函达到最小值或最大值. 由此可得损失函数如
(26) |
(27) |
式中:N为采样点总数. 损失函数如
(28) |
式中:Wb=1.
利用PIDL求解最优拱轴线问题,训练数据为在样本空间[0,25]上均匀选取的100个采样点. 神经网络结构与最小旋转曲面问题相同,隐藏层中的激活函数采用Sigmoid函数,优化器采用Ada
超参数 | 属性 | 值 |
---|---|---|
lr | 训练学习率 | 0.001 |
β1 | 一阶矩估计的指数衰减率 | 0.9 |
β2 | 二阶矩估计的指数衰减率 | 0.999 |
ε | 用于数值稳定性的常数 | 1e-7 |
Epoch | 迭代次数 | 50 000 |
对于2.70 GHz Intel/6核/11代Intel Core i5- 11400H处理器,迭代次数为50 000,用时16.82 s. 神经网络训练后得到的预测曲线表达式如
为进行对比研究,采用遗传算法寻找最小旋转曲面. 首先随机初始化一定数量的个体,个体基因为泰勒展开系数的一组取值. 在每一代中计算各采样点处截面弯矩平方和,并引入惩罚项以评估个体适应度. 通过多元竞标赛选择适应度最好的个体. 在子代中进行变异操作,并用新子代替换原有种群中的部分个体. 通过不断迭代,逐渐优化种群中的个体,寻找具有最优泰勒展开系数的最优拱轴线. 遗传算法的超参数设置如
超参数名称 | 参数取值 |
---|---|
种群大小 | 300 |
个体基因数量 | 3 |
迭代次数 | 10 000 |
变异率 | 0.000 1 |
变异扰动大小 | 0.01 |
多元竞标赛规模 | 3 |
遗传算法迭代10 000次,用时98.65 s. 最优拱轴线的PIDL预测解、GA预测解与精确解对比曲线如

图9 最优拱轴线的PIDL预测解、GA预测解与精确解
Fig.9 PIDL predictive solution, GA prediction solution and exact solution of optimal arch axis
由

图10 最优拱轴线的PIDL迭代收敛曲线
Fig.10 PIDL iterative convergence curve of optimal arch axis

图11 最优拱轴线的GA适应度曲线
Fig.11 GA fitness curve of optimal arch axis

图12 PIDL预测拱轴线的平方误差曲线
Fig.12 Square error curve of the arch axis predicted by PIDL

图13 GA预测拱轴线平方误差曲线
Fig.13 Square error curve of the arch axis predicted by GA
计算方法 | 拱轴线长度 | 相对误差绝对值/% |
---|---|---|
PIDL预测值 | 63.456 88 | 0.482 |
GA预测值 | 63.149 16 | 0.965 |
3 结 论
建立了一种基于物理驱动深度学习的泛函极值求解模型,用于解决形状优化问题. 该方法将形状优化问题的物理信息嵌入传统的神经网络模型中. 通过性能目标泛函极值构建损失函数,并利用样本空间中的样本点数据进行网络训练,实现泛函极值问题的求解. 主要结论如下:
1)建立了泛函极值问题的物理信息深度学习求解方法,并对最优曲面和拱轴线形状问题进行求解,结果与真实值吻合较好,相较于遗传算法,该方法的误差更小且计算效率更高. 旋转曲面面积的相对误差绝对值为0.466%,预测拱轴线长度的相对误差绝对值为0.482%,表明该模型具有较高精度.
2)PIDL模型作为一种无网格技术,其优势在于融合数据和物理知识. PIDL无须标签数据即可求解高度非线性非凸的最优化问题,适用于形状优化类的泛函极值问题. 该方法对于解决数据收集成本高、数据采集困难的工程问题具有重要意义. 未来考虑将其推广至复杂约束的形状优化问题.
3)PIDL在训练过程中不仅能够利用大量的数据样本,还可施加物理信息作为约束. 相较于纯数据驱动的机器学习方法,该方法具有较好的泛化性,能够求解不同类型的优化问题. 同时,利用边界和初始条件等物理信息来约束模型,避免了过拟合问题,提高了泛化能力.
尽管PIDL相较于遗传算法具有显著优势,但仍存在局限性,如复杂工况下模型训练需要大量计算资源. 未来可考虑采用并行计算、自适应学习等技术提高训练效率. 为增强PIDL的泛化能力,可结合迁移学习、集成学习等方法,改善模型的鲁棒性和泛化性能.
参考文献
LEVINE W.Optimal control theory:an introduction[J].IEEE Transactions on Automatic Control,1972,17(3): 423. [百度学术]
MAHDY A M S,YOUSSEF E S M.Numerical solution technique for solving isoperimetric variational problems[J].International Journal of Modern Physics C,2021, 32(1): 2150002. [百度学术]
RAZZAGHI M. Fourier series direct method for variational problems[J].International Journal of Control,1988,48(3): 887-895. [百度学术]
ZHOU C C,LIU Y.The pade approximant based network for variational problems[J]. arXiv: 2004.00711, 2020. [百度学术]
GORNOV A Y,ZARODNYUK T S,ANIKIN A S,et al.Extension technology and extrema selections in a stochastic multistart algorithm for optimal control problems[J].Journal of Global Optimization,2020,76(3):533-543. [百度学术]
VOGT T,STREKALOVSKIY E,CREMERS D,et al.Lifting methods for manifold-valued variational problems[M]//Handbook of Variational Methods for Nonlinear Geometric Data.Cham:Springer International Publishing,2020:95-119. [百度学术]
PEDREGAL P.A direct algorithm for constrained variational problems in several dimensions[J].Computers & Mathematics with Applications,2018,75(1):105-121. [百度学术]
YE J X,REY D,KADAKIA N,et al.Systematic variational method for statistical nonlinear state and parameter estimation[J].Physical Review.E,Statistical,Nonlinear,and Soft Matter Physics,2015,92(5):052901. [百度学术]
MERA N S,ELLIOTT L,INGHAM D B.Numerical solution of a boundary detection problem using genetic algorithms[J].Engineering Analysis with Boundary Elements,2004,28(4):405-411. [百度学术]
HOSSEINI S E,KARIMI O,ALI ASEMANBAKHSH M.Experimental investigation and multi-objective optimization of savonius wind turbine based on modified non-dominated sorting genetic algorithm-II[J].Wind Engineering,2024,48(3):446-467. [百度学术]
KORDA V Y, BEREZOVSKY S V, MOLEV A S, et al.Solving variational problems via evolutionary algorithm[J].International Journal of Modern Physics C,2013,24(3):1350009. [百度学术]
HORNIK K,STINCHCOMBE M,WHITE H.Multilayer feedforward networks are universal approximators[J].Neural Networks,1989,2(5):359-366. [百度学术]
WEINAN E, YU B. The deep ritz method: a deep learning-based numerical algorithm for solving variational problems[J]. Communications in Mathematics and Statistics, 2018, 6(1):1-12. [百度学术]
ARAZ J Y,CRIADO J C, SPANNOWSKY M.Elvet: a neural network-based differential equation and variational problem solver[J]. arXiv: 2103.14575,2021. [百度学术]
ABADI M, BARHAM P, CHEN J M, et al. TensorFlow:a system for large-scale machine learning[C]//Proceedings of the 12th USENIX Symposium on Operating Systems Design and Implementation(OSDI’16). Savannah, GA: USENIX Association, 2016:265-283. [百度学术]
QIU Y T,ARUNACHALA P K,LINDER C.SenseNet:a physics-informed deep learning model for shape sensing[J]. Journal of Engineering Mechanics,2023,149(3):04023002. [百度学术]
LIU J Q,CHEN R Q,LOU J H,et al.Deep-learning-based aerodynamic shape optimization of rotor airfoils to suppress dynamic stall[J].Aerospace Science and Technology,2023,133:108089. [百度学术]
RAISSI M, PERDIKARIS P, KARNIADAKIS G E. Physics-informed neural networks:a deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations[J].Journal of Computational Physics,2019, 378: 686-707. [百度学术]
RAMABATHIRAN A A,RAMACHANDRAN P.SPINN:sparse,physics-based,and partially interpretable neural networks for PDEs[J].Journal of Computational Physics,2021,445:110600. [百度学术]
LEUNG W T, LIN G, ZHANG Z C. NH-PINN: neural homogenization-based physics-informed neural network for multiscale problems[J]. Journal of Computational Physics, 2022,470: 111539. [百度学术]
RAISSI M,YAZDANI A,KARNIADAKIS G E.Hidden fluid mechanics:learning velocity and pressure fields from flow visualizations[J].Science, 2020, 367(6481): 1026-1030. [百度学术]
张子龙,潘秋景,仉文岗,等.基于物理信息神经网络的盾构隧道诱发地表沉降预测[J].工程力学,2024,41(4):161-173. [百度学术]
ZHANG Z L, PAN Q J, ZHANG W G, et al. Prediction of surface settlements induced by shield tunnelling using physics-informed neural networks[J]. Engineering Mechanics, 2024, 41(4): 161-173.(in Chinese) [百度学术]
唐和生,何展朋,廖洋洋,等.基于物理驱动深度迁移学习的薄板力学正反问题[J].工程力学, 2023, 40(8): 1-10. [百度学术]
TANG H S,HE Z P, LIAO Y Y, et al.Forward and inverse problems of thin plate mechanics based on physics-informed deep transfer learning[J].Engineering Mechanics, 2023, 40(8):1-10.(in Chinese) [百度学术]
BAYDIN A G, PEARLMUTTER B A,RADUL A A,et al.Automatic differentiation in machine learning: a survey[J]. The Journal of Machine Learning Research, 2018, 18(1): 5595-5637. [百度学术]
UDDIN M J,MOHEUDDIN M M,KOWSHER M.A new study of trapezoidal,Simpson’s 1/3 and Simpson’s 3/8 rules of numerical integral problems[J]. Applied Mathematics and Sciences an International Journal (MathSJ),2019,6(4):1-13. [百度学术]
KINGMA D P, BA J L. Adam: a method for stochastic optimization[C]//ICLR 2015-Conference Track Proceedings,2015. [百度学术]
HAJI S H,ABDULAZEEZ A M.Comparison of optimization techniques based on gradient descent algorithm: a review[J].PalArch’s Journal of Archaeology of Egypt/Egyptology, 2021, 18(4):2715-2743. [百度学术]
SAMANIEGO E,ANITESCU C,GOSWAMI S,et al.An energy approach to the solution of partial differential equations in computational mechanics via machine learning:concepts,implementation and applications[J].Computer Methods in Applied Mechanics and Engineering,2020,362:112790. [百度学术]