从弱非线性可解到强非线性失效：LLG方程中梯度冲突诱导的PINN失效边界

马丁; 陈丽娜; 刘荣华

doi:10.13232/j.cnki.jnju.2026.02.013

南京大学学报（自然科学） ›› 2026, Vol. 62 ›› Issue (02) : 309 -322. DOI: 10.13232/j.cnki.jnju.2026.02.013

从弱非线性可解到强非线性失效：LLG方程中梯度冲突诱导的PINN失效边界

马丁 ¹ ,
陈丽娜 ²^,³ ,
刘荣华 ¹

作者信息 +

Phase transition to failure: Quantifying critical thresholds of gradient conflict in PINN for LLG dynamics

Ding Ma ¹ ,
Lina Chen ²^,³ ,
Ronghua Liu ¹

Author information +

文章历史 +

PDF (1961K)

摘要

近年来，机器学习的蓬勃发展推动了新型微分方程求解算法的探索，经过近30年的积累，大量针对特定场景具有显著性能优势的机器学习求解器相继问世.然而，最新研究表明，当前研究普遍存在对负面结果的系统性回避，所以对机器学习求解能力的评估存在过度乐观倾向，亟需通过更全面的数据对算法效能进行客观衡量，尤其需要建立对失败案例与性能边界的理性认知.选取广泛应用的物理信息内嵌神经网络（Physics⁃Informed Neural Network，PINN）针对微磁学核心方程，即朗道⁃利夫希兹⁃吉尔伯特方程（Landau⁃Lifshitz⁃Gilbert equation，LLG equation）进行求解，通过调节磁晶各向异性常数（ $K u$ ）及退磁因子 $N ⃡$ 以控制方程非线性强度，系统探讨PINN的求解性能.结果表明，PINN仅能有效求解弱非线性条件下的LLG方程，在强非线性场景下求解失效，揭示了此类机器学习方法应对强非线性微分方程的内在局限性.该失效机制可归因于微分方程的强非线性特性在梯度下降迭代中引发的梯度冲突，导致求解失效或精度崩溃.

Abstract

Recent remarkable advances in machine learning (ML) have inspired the exploration of novel algorithms for solving differential equations. After nearly three decades of development，numerous ML⁃based solvers have emerged，demonstrating significant performance advantages in specific scenarios. However，recent studies have revealed a widespread and systematic omission of negative results in current literature，leading to an overly optimistic bias in the academic assessment of ML’s capabilities for solving differential equations. Consequently，there is an urgent need for more comprehensive empirical evidence to objectively evaluate algorithmic efficacy，particularly to establish a rational understanding of failure cases and performance boundaries. This study investigates the widely used Physics⁃Informed Neural Network (PINN) framework for solving the Landau–Lifshitz–Gilbert (LLG) equation,the core governing equation in micromagnetics. By systematically varying the magnetocrystalline anisotropy constant （ $K u$ ） and the demagnetization factor $N ⃡$ to modulate the strength of nonlinearity in the system，we comprehensively assess PINN’s solution performance. Our results show that PINN can effectively solve the LLG equation only under weakly nonlinear conditions. In strongly nonlinear regimes，however，PINN fails to converge or produces inaccurate solutions，revealing an inherent limitation of such machine learning approaches when applied to strongly nonlinear differential equations. This failure mechanism is attributed to gradient conflicts induced by the strong nonlinearity during gradient descent iterations，which lead to either solution divergence or catastrophic loss of accuracy.

Graphical abstract

关键词

PINN / LLG equation / 非线性磁化动力学 / 微磁模拟

Key words

PINN / LLG equation / nonlinear magnetization dynamics / micromagnetic simulation

引用本文

引用格式 ▾

马丁,陈丽娜,刘荣华. 从弱非线性可解到强非线性失效：LLG方程中梯度冲突诱导的PINN失效边界[J]. 南京大学学报（自然科学）, 2026, 62(02): 309-322 DOI:10.13232/j.cnki.jnju.2026.02.013

登录浏览全文

4963

注册一个新账户忘记密码

微分方程^［1-4］作为描述物理系统的核心建模语言在现代科学中被广泛应用，然而，多数微分方程难以获得解析解.传统数值算法^［5-8］虽然可提供数值逼近，却需要承担高昂的计算成本以换取高求解精度，针对高维、非线性等复杂场景，开发兼具计算效率与求解精度的新型算法已成为该领域的关键挑战.

随着人工智能^［9-14］的迅猛发展，机器学习已成为实现微分方程高效求解的重要技术路径^［15-18］.1994年Dissanayake and Phan‐Thien^［19］提出了基于神经网络的泊松方程与非线性热传导方程求解算法，奠定了该领域的早期基础.此后，基于机器学习的偏微分方程求解研究持续深化，如2022年Sun et al^［20］的符号基因算法，成功求解非线性Burgers方程、Korteweg⁃de Vries方程等复杂系统^［21］.理论层面，研究者期望通过机器学习实现大幅提高数值计算效率的目标.然而，2024年McGreivy and Hakim^［22］指出，在随机抽取的232篇通过机器学习求解微分方程的论文中，94.8%仅报道积极结果，5.2%同时包含正负结果，未见仅报道负面结果的文献.更值得关注的是，这些宣称成功的论文采用的性能评估指标各异.

综合分析表明，许多算法在特定问题或参数下表现优异^［23-24］，但这种选择性报道（“报喜不报忧”）导致学界对算法性能产生系统性认知偏差，因此，亟需建立包含正负样本的标准化评估体系，尤其需要强化对失效案例与性能边界的理性认知.

本研究选取应用广泛的物理信息内嵌神经网络（Physics⁃Informed Neural Network，PINN）^［25］，针对磁性领域中描述磁矩动力学演化的朗道⁃利夫希兹⁃吉尔伯特方程（Landau⁃Lifshitz⁃Gilbert equation，LLG equation）进行求解.通过调控磁晶各向异性常数

K u

与退磁因子N，可系统调节LLG方程的非线性强度^［26］，进而定量评估PINN求解非线性系统的能力.为了验证PINN解的准确性，以传统数值模拟结果为基准进行对照分析.研究结果表明，在弱非线性场景下（低

K u

值及特定退磁因子

N ⃡

导致的弱非线性构型），PINN能获得与数值解吻合的结果；当

K u

超过临界阈值或在强非线性退磁因子N作用下，PINN出现显著预测失效.这可能源于LLG方程的强非线性特性在反向传播中引发的梯度冲突，导致求解失效或精度急剧衰减.

本研究揭示了PINN在求解非线性微分方程时存在的固有局限性，为客观评估机器学习求解算法的有效性边界提供了实证依据，并对算法适用场景的判定具有指导意义.

1 研究方法

1.1　LLG微分方程

LLG方程是描述磁矩动力学演化^［27-28］的核心微分方程^［29-33］，其理论雏形为朗道（Landau）和利夫希兹（Lifshitz）于1953年提出的朗道⁃利夫希兹方程（Landau⁃Lifshitz equation，LL equation），后由吉尔伯特（Gilbert）在1955年修正阻尼项形式并最终确立.该方程基于经典磁矩动力学原理，从磁矩在磁场中的转矩作用与角动量守恒定律严格推导而来，成为微磁学模拟的理论基石.下面只考虑单个磁矩在外磁场、磁晶各向异性等效场及退磁场共同作用下的动力学过程，LLG方程可表述为：

d M s ⃗ d t = - γ M s ⃗ × H e f f ⃗ + α M s M s ⃗ × d M s ⃗ d t

(1)

H e f f ⃗ = H e x t ⃗ + H a n i s ⃗ + H d e m a g ⃗

(2)

其中，

M s ⃗

是自旋磁矩，

M s

为饱和磁化强度，

H e f f ⃗

为有效场的磁场强度，

γ

为电子的自旋旋磁比，

α

为耗散系数.

H e x t ⃗, H a n i s ⃗, H d e m a g ⃗

分别为外磁场磁场强度、各向异性等效场磁场强度和退磁场磁场强度.

自旋转移矩^［34-36］（Spin⁃Transfer Torque，STT）是1996年Slonczewski^［37］和Berger^［38］独立预言的核心物理效应，并于两年内在实验中成功观测^［39-41］.其微观机制可阐述为：当自旋极化电流流过磁性层时，极化电流的自旋角动量因与磁性层磁矩相互作用而衰减.根据自旋角动量守恒定律，损失的自旋角动量将转移至磁性层系统，导致局域磁矩动力学演化.由于角动量变化率正比于力矩，该传递过程可等效建模为磁性层受到的力矩作用，即自旋转移矩（STT）：

τ S T T ⃗ = j z ℏ 2 M s e d α P r, t 1 + α 2 M s ⃗ × m p ⃗ + j z ℏ 2 M s e d P r, t 1 + α 2 M s ⃗ × M s ⃗ × m p ⃗

(3)

其中，

j z

是电流密度矢量，

ℏ

为普朗克常量，

e

为电荷量，

d

为磁性层的厚度，

P r, t

是极化率，

m p ⃗

是自旋流的极化方向单位矢量.包含STT作用的LLG方程为：

d M s ⃗ d t = - γ M s ⃗ × H e f f ⃗ + α M s M s ⃗ × d M s ⃗ d t + τ S T T ⃗

(4)

为了避免磁矩之间耦合作用导致更加复杂的非线性效应，本文只考虑单磁矩的LLG方程作为检验机器学习求解微分方程能力的任务实例.

1.2　物理信息内嵌神经网络（PINN）算法

传统的深度学习神经网络多为有监督训练过程，“有监督”指的是在训练过程中需要给出一组输入数据

x

和真实的输出数据

y

，将

x

输入神经网络后得到输出结果

y o u t

.为了衡量输出结果

y o u t

和真实输出

y

之间的差距，通常会构造损失函数

f

作为指标.损失函数

f

通常采用均方误差（Mean Square Error，MSE）的形式：

M S E = 1 N ∑ 1 N y i - y o u t i 2

(5)

其中，

i

指的是输出集合中第

i

个数据，

N

是输出数据集的数据个数.当损失函数

M S E

趋近0，

y o u t

和

y

的差距极其小时，即可以将网络视作“学习到了训练集的特点”.在使损失函数

M S E

趋于0的过程中用到了自动梯度法（Auto Gradient）和反向传播算法（Back Propagation）^［42-44］.

PINN是一款弱监督（训练集数据量极小）或无监督（无需训练集）神经网络.对于单个磁矩磁动力学系统，这里对系统满足的LLG方程进行改写：

f ⃗ = - d M s t ⃗ d t - γ m s t ⃗ × H e f f ⃗ + α M s m s t ⃗ × d M s t ⃗ d t + τ s t t ⃗ t ∈ T

(6)

f ⃗ = f x m x t, f y m y t, f z m z t

(7)

m x t 0 = m x 0 (a) m y t 0 = m y 0 (b) m z t 0 = m z 0 (c)

(8)

其中，

f x, f y, f z

为

f ⃗

的

x, y, z

方向的分量，其自变量分别为自旋磁矩

M s ⃗

的

x, y, z

分量.设初始时刻为

t 0

，

m x 0, m y 0, m z 0

为自旋磁矩满足的初始条件（式（8））.PINN的损失函数和式（5）不同，而是在式（7）和式（8）的基础上构建，如下所示：

σ = a · σ I C x + σ I C y + σ I C z + b · σ f x + σ f y + σ f z

(9)

其中，

σ I C x = m^x t 0 - m x t 0 2 σ f x = 1 N ∑ N f x 2 m^x t N

(10)

σ I C y = m^y t 0 - m y t 0 2 σ f y = 1 N ∑ N f y 2 m^y t N

(11)

σ I C z = m^z t 0 - m z t 0 2 σ f z = 1 N ∑ N f z 2 m^z t N

(12)

其中，

N

为

T

空间内的采样点个数，

σ

为总损失函数，其由初始条件分量的损失函数

σ I C x, σ I C y, σ I C z

和微分方程分量的损失函数

σ f x, σ f y, σ f z

两部分构成，

a 和 b

分别为两个部分的损失函数的权重，用以调节神经网络降低损失的优先级.

m x, m y, m z

分别为自旋磁矩

x, y, z

分量的真实解，

m^x, m^y, m^z

分别为神经网络的输出结果.

当损失函数

σ = 0

时，PINN的输出结果既满足LLG方程，也满足初始条件，视为“利用机器学习得到了微分方程的解”.PINN的运算原理如图1所示.设网络有

i

个隐藏层，每层有

j

个神经元，每个神经元的值为

r i j

，当输入值

t

输入网络后乘以权重

ω

并加上偏移量

b

，则有：

r i j = ω i j · ∑ j r i - 1 j + b i j

(13)

最终会得到输出：

m^x t, ω 11, ⋯, ω i j, b 11, ⋯, b i j m^y t, ω 11, ⋯, ω i j, b 11, ⋯, b i j m^z t, ω 11, ⋯, ω i j, b 11, ⋯, b i j

(14)

将输出结果代入损失函数

σ

中便得到

σ t, ω 11, …, ω i j, b 11, …, b i j,

通过对其进行梯度下降迭代，即可通过调节权重

ω

和偏移量

b

，使损失函数趋近0，从而使网络输出结果

m^x, m^y, m^z

逼近真实结果

m x, m y, m z

自2017年PINN提出以来，其已在多种物理场建模中获得广泛应用，例如，Shukla et al^［45］利用PINN模拟双流模型下的等离子体湍流场动力学，Chen et al^［46］将其应用于超材料光散射场模拟，Kovacs et al^［47］探索了其在静磁学微磁模拟中的适用性.

本文选择广受认可的微磁模拟软件MuMax³作为基准参照.该软件于2014年由Vansteenkiste et al^［48］开发，基于GPU加速计算实现网格化数值求解，其求解LLG方程的准确性已被大量研究有效验证^［49-52］.通过复现相同初始边界条件下的LLG方程解，本文以MuMax³的模拟计算结果为基准，对比评估PINN的求解精度.

2 结果与分析

2.1　单轴磁各向异性常数 $K u$ 对PINN求解有效性的影响

采用如图2a~c所示物理模型，其中，

m ⃗

是归一化自旋磁矩，

H e x t ⃗

为外磁场，

H a n i s ⃗

为单轴磁晶各向异性等效场.为了使磁矩进行稳定进动，施加极化电流产生自旋转移矩

τ S T T ⃗

来抵抗磁性材料的本征阻尼力矩.选取

M s ⃗ = 8 × 105 ⋅ 0.707,0.707,0 A ⋅ m - 1

，

α = 0.001

，

P r, t = 0.4

，

u ⃗ = 0,0, 1

，

K u = 1.1 × 105 J ⋅ m - 3

，

m p ⃗ = 0, - 1,0

，

j z = 0.0018 A ⋅ m - 2

，

H ⃗ = 0,0.3,0 T

时，

m ⃗

能稳定进动.在上述系统中引入和外磁场方向垂直的单轴磁各向异性，其大小能改变LLG方程磁矩进动动力学的非线性程度，

H a n i s ⃗

的表达式如下：

H a n i s ⃗ = 2 K u μ 0 M s u ⃗ · M s ⃗ · u ⃗ K u 0

(15)

图2a~c展示了微磁模拟得到的磁矩进动轨迹图，分别对应的

K u 为 1.1 × 105, 1.4 × 105 和

1.5 × 105 J ⋅ m - 3

.三者的xz平面投影为椭圆形，表明存在一定的非线性效应（即出现高阶谐波）.并且，随着

K u

的增大，即z方向的各向异性等效场逐渐增强，将进动轨道在z方向拉长，系统的非线性程度也随之增强.为了进一步分析非线性效应，对上述不同

K u

下的进动磁矩分量

m x t, m y t, m z t

做快速傅里叶变换（Fast Fourier Transformation，FFT），得到了其磁矩分量的频谱特征曲线，如图2d~f所示.随着

K u

值的增大，进动磁矩的高阶谐波的强度也逐渐增大.为了定量描述方程非线性程度增大情况，引入

m x t

的FFT结果中基频强度与其三倍频强度的对数比：

m ⃗ R = l g P F F T f 0 l g P F F T 3 f 0

(16)

其中，

f 0

为

m x t

的FFT结果中的基频频率.R随

K u

的变化情况如图3c中的红线所示，可见随着

K u

的增大，系统的非线性程度R逐渐增强.

将这组特定参数代入式（9），构造适合该系统的PINN损失函数.初始条件对应的损失函数具有磁矩的量纲，而LLG方程对应的损失函数具有力矩量纲，后者包含的自旋旋磁比（如

γ = 1.76 × 1011 r a d ∙ s - 1 ∙ T - 1

）导致这部分损失函数的值远大于前者，使神经网络不能快速获取初始条件.因此，选取两个归一化权重参数

a = 1 和 b = 1 × 10 - 23

，使两部分损失函数的值具有相近的数量级.经过100000次迭代，PINN得出如图3a所示的结果，其中，蓝色实线代表微磁模拟（MuMax³）的模拟结果，红色虚线代表PINN的预测结果.图3a和图3b分别对应磁各向异性常数

K u 为 1.1 × 105 和 1.5 × 105 J ⋅ m - 3

时

m x t,

m y t, m z t

的拟合情况.容易发现

K u = 1.1 × 105 J ⋅ m - 3

时，PINN的预测结果和微磁模拟（MuMax³）的计算结果吻合较好；

K u = 1.5 × 105 J ⋅ m - 3

时，仅在振荡的前四分之一周期内有拟合趋势，在四分之一到二分之一周期内二者结果开始出现偏差，之后二者的结果完全不吻合.为了量化PINN的预测结果和MuMax³的模拟计算结果之间的偏差，引入均方误差作为指标：

M S E = 1 N ∑ i = 1, j = x, y, z N m i, j P I N N - m i, j M u M a x 3 2

(17)

其中，

N

为数据点个数.将磁矩解的

x, y, z

三个分量的所有数据点偏差的平方进行求和，平均的作用是消除数据长度带来的误差累计，得到每个采样点的平均误差.图3c展示了随着磁晶各向异性常数

K u

增大，磁矩

x, y, z

三个分量的PINN预测结果与MuMax³的模拟计算结果之间均方误差的变化情况.经计算，当

K u ≤ 1.3 × 105 J ⋅ m - 3

时，误差值在10^-3量级，当

K u 1.3 × 105 J ⋅ m - 3

时，误差值跃升至10^-1量级，此时可以视作PINN预测失败.MSE的增加与描述系统非线性程度的R同步增大，表明非线性程度是制约PINN求解能力的关键因素.

在该模型下，随着

K u

的增大，PINN求解非线性LLG方程出现了由有效到失效的转变，其临界点为

K u = 1.3 × 105 J ⋅ m - 3

.该结果表明，PINN在求解微分方程方面具有一定的能力，但其能力存在一定的局限性.可能的原因是，与传统的龙格⁃库塔数值求解方法不同，神经网络的自动微分是基于在输入值取值区间内随机选取的点来计算导数的，这种计算方式使神经网络的拟合过程对整个区间内的所有时间点同时进行操作，而各个时间点之间没有明确的“先后顺序”.因此，当非线性效应增强到一定程度时，PINN在进行梯度下降迭代过程中，梯度方向可能会变得不一致，从而引发所谓“梯度冲突”.这种冲突可能导致网络陷入“局部最优解”，无法找到“全局最优解”，最终导致求解过程失效.

2.2　易面磁晶各向异性常数大小对PINN求解有效性的影响

除单轴磁各向异性常数大小对PINN求解有效性影响之外，还研究了易面磁晶各向异性常数大小对PINN求解有效性的影响.易面磁晶各向异性等效场会使磁矩在无外场作用时趋向于在某个平面内，即在易面内磁矩的能量最小.易面磁晶各向异性等效场的表达式如下所示：

H a n i s ⃗ = 2 K u μ 0 M s u ⃗ · M s ⃗ · u ⃗ K u 0

(18)

其中，

u ⃗

为易面法线方向单位矢量.同样采用2.1的模型，区别是易面磁晶各向异性等效场的指向为负z轴方向，与

m z

的方向相反.选取参数

M s ⃗ = 8 × 105 ⋅ 0.707,0.707,0 A ⋅ m - 1

，

α = 0.001

，

P r, t = 0.4

，

u ⃗ = 0,0, 1

，

m p ⃗ = 0, - 1,0

，

j z = 0.0018 A ⋅ m - 2

，

H ⃗ = 0,0.3,0 T

.当

K u

选取

- 1 × 106, - 2 × 106 和- 4 × 106 J ⋅ m - 3

时，得到了如图4a~c所示的MuMax³的模拟进动轨迹图.从进动轨迹图中可以看到，在易面磁晶各向异性的影响下，z方向振荡被压缩，因为易面磁晶各向异性等效场指向xy平面，这与单轴磁各向异性的情况（其等效场指向xy平面外，即z方向振荡被拉伸）截然相反.为了进一步分析非线性效应，对不同

K u

下的进动磁矩分量

m x t, m y t, m z t

做快速傅里叶变换，得到了其磁矩分量的频谱特征曲线，如图4d~f所示.可以看出，

x, z

方向分量基频振幅不断减小，y方向二倍频和x方向分量的三倍频振幅不断增大.采用与2.1中相同的方法来定量描述模型的非线性程度（见式（16））.R随

K u

的变化如图5c中红线所示，随着

K u

的减小，R不断增大，反映系统的非线性程度随着

K u

的减小而增强的特点.

将上述参数代入LLG方程并构造PINN的损失函数，选取参数

a = 1, b = 1 × 10 - 23

，经过100000次迭代，PINN得出如图5a和图5b所示的结果，分别对应

K u = - 1 × 106 J ⋅ m - 3

，

K u = - 5 × 106 J ⋅ m - 3

时PINN对

m x, m y, m z

的拟合情况，其中，蓝色实线代表MuMax³的模拟结果，红色虚线代表PINN的预测结果.可以看出，

K u = - 1 × 106 J ⋅ m - 3

时，PINN解得LLG方程的结果和MuMax³的模拟结果吻合较好，而当

K u = - 5 × 106 J ⋅ m - 3

时，PINN也仅在振动前四分之一周期内有拟合趋势，之后便完全偏离数值模拟结果.同样，采用均方误差（式（17））来衡量PINN的求解结果和MuMax³的模拟求解结果之间的差异，并将其绘成随

K u

变化的关系图，如图5c所示.可以看出，当

K u

小于

- 2 × 106 J ⋅ m - 3

时，均方误差猛然增加，意味着PINN求解LLG方程的能力是突然下降的.随着R的增大，PINN与MuMax³的结果之间的MSE也增大.因此，随着非线性程度R的增强，PINN求解该模型LLG方程的能力存在一个转变，那么转变点

K u = - 2 × 106 J ⋅ m - 3

则为该情况下PINN有效求解非线性LLG方程的边界值.推测其原因和3.1所述一致，即强的非线性效应引发 “梯度冲突”，导致PINN求解失效.

2.3　不退磁因子对PINN求解有效性的影响

当磁体呈开磁路结构（非闭合几何体）时，根据磁荷模型理论，样品表面形成的面磁荷密度将激发退磁场.该场方向与外磁场相反，其强度由几何构型主导.对于均匀单相椭球磁体（磁化均匀条件），退磁场可表征为如下张量方程：

H d e m a g ⃗ = - N ⃡ M s ⃗

(19)

其中，

N ⃡

为二阶张量，称退磁因子.当选取参考系坐标轴与椭球样品主轴重合时

N ⃡

被对角化，有：

N ⃡ = N a 00 0 N b 0 00 N c

(20)

为了进一步研究系统非线性强度对PINN求解LLG方程能力的影响，在2.1所用模型的基础上增加了退磁场，则该模型有效场变为：

H e f f ⃗ = H e x t ⃗ + H a n i s ⃗ - N a · m x, N b · m y, N c · m z

(21)

当样品为特殊形状时可以给出

N ⃡

的理论值：

N a = 1, N b = 0, N c = 0 极薄 圆盘, 法线 沿 x 轴

(22)

采用MATLAB对上述系统LLG方程求解，具体参数为

M s ⃗ = 8 × 105 ⋅ 0.707,0.707,0 A ⋅ m - 1

，

α = 0.001

，

P r, t = 0.4

，

u ⃗ = 0,0, 1

，

K u = 6 × 105 J ⋅ m - 3

，

m p ⃗ = 0, - 1,0

，

j z = 0.0018 A ⋅ m - 2

，

H ⃗ = 0,1.2,0 T

，得到如图6a所示的磁矩进动轨迹.若是令圆盘的法线方向和y轴平行，即选取

N a = 0, N b = 1, N c = 0

，其他参数不变，可以得到图6b所示的进动轨迹.可以看到，图6a所示轨迹在xz平面的投影为椭圆形，在yz平面的投影为圆弧形；图6b所示的轨迹在xz平面的投影为“纺锤”形，但在yz平面投影不是圆弧，这与图6a有较大差别.分别对二者自旋磁矩的

m x t, m y t, m z t

三个分量做快速傅里叶变换后得到图6c和图6d.可以看出，二者

x, y, z

三个方向的基频、倍频的频率和振幅均不相同.经式（16）计算，

N a = 1, N b = 0, N c = 0

时

R = 0.101

，

N a = 0, N b = 1, N c = 0

时

R = 0.109

，可见后者的非线性程度更大.

将相同参数代入LLG方程，用同样的方法构建损失函数，选取参数

a = 1, b = 1 × 10 - 22

，经过100000次迭代，PINN得出如图7a和图7b所示的结果，分别对应圆盘法线方向垂直y轴和平行于y轴时

x, y, z

三个方向PINN的拟合情况.其中，蓝色实线代表MATLAB的计算结果，红色虚线代表PINN的预测结果.

N a = 1, N b = 0, N c = 0

时PINN能较好地拟合LLG方程的解，而

N a = 0,

N b = 1, N c = 0

时，PINN完全不能获取该系统的特点.为了避免偶然性，分别呈现圆盘法线方向和z轴平行、极细圆柱退磁场下

N a = 0, N b = 0,

N c = 1; N a = 0.5, N b = 0.5, N c = 0; N a = 0.5,

N b = 0, N c = 0.5; N a = 0, N b = 0.5, N c = 0.5

的情况，并计算MATLAB的计算结果和PINN预测结果之间的均方误差，结果如下表所示.

由下表可以看出，对于圆盘情形，当圆盘法线方向与y轴平行

N a = 0, N b = 1, N c = 0

时，系统的非线性程度R最大，为0.109，对应的MSE=1.28.其余两种情况

N a = 1, N b = 0, N c = 0;

N a = 0, N b = 0, N c = 1

，系统的非线性程度R偏小，分别为0.101和0.081，对应的MSE分别为9.33×10^-5和1.56×10^-5.MSE=1.28时代表PINN拟合失效，为9.33×10^-5和1.56×10^-5时代表拟合有效.对于圆柱情形，当圆柱的的旋转对称轴与y轴平行时

N a = 0.5, N b = 0, N c = 0.5

，

系统的非线性程度R最小，为0.072，对应的MSE为1×10^-5；其余两种情况

N a = 0.5, N b =

0.5, N c = 0; N a = 0, N b = 0.5, N c = 0.5

，系统的非线性程度R偏大，分别为0.254和0.222，对应的MSE分别为1.06和0.843.MSE为1×10^-5时代表PINN拟合有效，为1.06和0.843代表拟合失效.经分析，圆盘法线方向与y轴平行时，退磁场方向与外磁场方向反平行，若各向异性等效场强度不变，则系统的非线性程度R变相增强，按照2.1所述规律，PINN求解失效；当圆柱旋转对称轴平行于x轴或z轴时，退磁场存在y方向分量，且二者均与外磁场反平行，也会变相增强系统的非线性程度R，导致PINN求解失效.

综上，针对本研究的磁矩动力学模型，PINN在弱非线性场景（低磁晶各向异性常数

K u

及特定退磁因子构型）中能有效求解LLG方程；而在强非线性条件下，PINN则呈现求解失效.说明PINN对微分方程的求解能力存在明确的性能边界，其有效性受限于系统非线性强度.这一实例为机器学习求解器在复杂动力学系统中的适用性提供了临界判据.

3 结论

本文通过调节单轴磁各向异性常数大小、易面磁各向异性常数大小以及椭球形状导致的退磁场这三类计算结果，来调节LLG方程的非线性程度，并系统探究物理信息内嵌神经网络（PINN）对求解朗道⁃利夫希兹⁃吉尔伯特方程（LLG equation）的性能边界.第一，仅调节单轴磁各向异性常数

K u

，在

1.1,1.5 × 105 J ⋅ m - 3

，当

K u ≤ 1.3 × 105 J ⋅ m - 3

时，PINN能够解出LLG方程，当

K u 1.3 × 105 J ⋅ m - 3

时，PINN不能解出LLG方程.从微磁模拟软件MuMax³模拟的磁矩进动轨迹图中可以看到，随着

K u

的增大，系统的非线性程度增大，逐渐超过神经网络学习能力.这可能由于PINN是时间轴内随机取点，且“不分先后”求导的神经网络自动微分算法导致机器学习处理系统非线性的能力下降.第二，调节易面磁各向异性常数，在

- 5, - 1 × 106 J ⋅ m - 3

调节

K u

的值，当

0 K u - 2 × 106 J ⋅ m - 3

时，PINN求解LLG方程结果和MuMax³的模拟结果几乎完全吻合，二者均方误差均在

10 - 2

量级，一旦

K u ≤ - 2 × 106 J ⋅ m - 3

，PINN丧失求解能力.第三，在有单轴磁各向异性的基础上变化退磁场的退磁因子，利用MATLAB得到

N a =

1，

N b =

0，

N c =

0时和

N a =

0，

N b = 1

，

N c =

0时LGG方程的解，前者非线性程度弱，后者非线性程度强.然而，PINN只能求解前者的LLG方程，不能解出后者.再次调节退磁因子，令

N a = 0.5, N b = 0.5, N c = 0

；

N a = 0.5, N b = 0, N c = 0.5; N a = 0, N b = 0.5,

N c = 0.5

，同样发现PINN可以得到非线性程度较弱的

N a = 0.5, N b = 0, N c = 0.5

时的解，而其他两种非线性程度较强的情况下拟合失败.

上述三类计算结果的失效案例共同证明，PINN的求解能力存在严格的性能边界，其有效性与系统非线性强度呈负相关.尽管机器学习求解微分方程的研究已逾30年，且不断涌现成功解决复杂系统的案例，但学界对负面结果的系统性回避（94.8%的文献仅报道积极结果^［15］）导致了对算法能力的过度乐观估计.本研究通过可控计算结果证明了机器学习方法在强非线性场景中存在固有局限，其核心瓶颈在于非线性强度诱导的梯度冲突（如偏微分方程残差与边界条件损失的梯度下降方向的矛盾）.

后续将深入探索梯度冲突消解机制、构建混合求解架构以及非线性不变特征嵌入等方法可能有助于突破此局限.

参考文献

原文顺序 | 出版日期 | 本文引用

[1]	Hairer E， Wanner G. Solving ordinary differential equations II. Heidelberg：Springer，1996：221.

[2]	Gockenbach M S. Partial differential equations：Analytical and numerical methods. Philadelphia：Society for Industrial and Applied Mathematics，2010：53-71.

[3]	Boyce W E， DiPrima R C， Meade D B. Elementary differential equations and boundary value problems. New York：John WileySons，2017：25-31.

[4]	Coddington E A， Levinson N. Theory of ordinary differential equations. New York：McGraw⁃Hill，1955.

[5]	Beck C， Hornung F， Hutzenthaler M，et al. Overcoming the curse of dimensionality in the numerical approximation of Allen⁃Cahn partial differential equations via truncated full⁃history recursive multilevel Picard approximations. Journal of Numerical Mathematics，2020，28(4)：197-222.

[6]	Benamou J D， Froese B D， Oberman A M. Two numerical methods for the ellipticMonge⁃Ampère equation. ESAIM：Mathematical Modelling and Numerical Analysis，2010，44(4)：737-758.

[7]	Ames W F. Numerical methods for partial differential equations. New York：Academic Press，2014：55-81.

[8]	Yao K， Chen X W. A numerical method for solving uncertain differential equations. Journal of Intelligent Fuzzy Systems：Applications in Engineering and Technology，2013，25(3)：825-832.

[9]	Li H T， Li L Y， Xiang R X，et al. Physical reservoir computing and deep neural networks using artificial and natural noncollinear spin textures. Physical Review Applied，2024，22(1)：014027.

[10]	Jiang W C， Chen L N， Zhou K Y，et al. Physical reservoir computing using magnetic skyrmion memristor and spin torque nano⁃oscillator. Applied Physics Letters，2019，115(19)：192403.

[11]	张帅，陈丽娜，刘荣华. 自旋类脑神经形态计算. 四川师范大学学报(自然科学版)，2025，48(2)：176-191.

[12]	Wang P F， Chen M Y， Xie Y Q，et al. Moiré synaptic transistor for homogeneous⁃architecture reservoir computing. Chinese Physics Letters，2023，40(11)：117201.

[13]	Wang S， Wang C Y， Wang P F，et al. Networking retinomorphic sensor with memristive crossbar for brain⁃inspired visual perception. National Science Review，2021，8(2)：nwaa172.

[14]	Song K K， Zhao R， Liu J H，et al. General⁃purpose machine⁃learned potential for 16 elemental metals and their alloys. Nature Communications，2024，15(1)：10208.

[15]	Beck C， Weinan E， Jentzen A. Machine learning approximation algorithms for high⁃dimensional fully nonlinear partial differential equations and second⁃order backward stochastic differential equations. Journal of Nonlinear Science，2019，29：1563-1619.

[16]	Berg J， Nyström K. A unified deep artificial neural network approach to partial differential equations in complex geometries. Neurocomputing，2018，317：28-41.

[17]	Brunton S L， Kutz J N. Promising directions of machine learning for partial differential equations. Nature Computational Science，2024，4(7)：483-494.

[18]	Vinuesa R， Brunton S L. Enhancing computational fluid dynamics with machine learning. Nature Computational Science，2022，2(6)：358-366.

[19]	Dissanayake M W M G， Phan‐Thien N. Neural‐network‐based approximations for solving partial differential equations. Communications in Numerical Methods in Engineering，1994，10(3)：195-201.

[20]	Sun S F， Tian S F， Wang Y D，et al. The data⁃driven discovery of partial differential equations by symbolic genetic algorithm. Nonlinear Dynamics，2024，112(22)：19871-19885.

[21]	Chen X Y， Chue E， Kong J F，et al. Thermal evolution of skyrmion formation mechanism in chiral multilayer films. Physical Review Applied，2022，17(4)：044039.

[22]	McGreivy N， Hakim A. Weak baselines and reporting biases lead to overoptimism in machine learning for fluid⁃related partial differential equations. Nature Machine Intelligence，2024，6(10)：1256-1269.

[23]	Raissi M. Forward⁃backward stochastic neural networks：deep learning of high⁃dimensional partial differential equations∥Jarrow R A，Madan D B. Peter Carr Gedenkschrift：Research Advances in Mathematical Finance. Singapore：World Scientific，2024：637-655.

[24]	Bauckhage C， Sifa R. Training support vector machines by solving differential equations∥Schulz D，Bauckhage C. Informed Machine Learning. Cham：Springer，2025：265-283.

[25]	Raissi M， Perdikaris P， Karniadakis G E. Physics⁃informed neural networks：A deep learning frame⁃work for solving forward and inverse problems involving nonlinear partial differential equations. Journal of Computational Physics，2019，378：686-707.

[26]	Hua L R， Yuan L L， Na C L，et al. Nonlinear dynamics and applications of spin hall nano⁃oscillators. Progress in Physics，2020，40(6)：189-210.

[27]	Yuan Z， Liu Y， Starikov A A，et al. Spin⁃orbit⁃coupling⁃induced domain⁃wall resistance in diffusive ferromagnets. Physical Review Letters，2012，109(26)：267201.

[28]	Yuan Z， Kelly P J. Spin⁃orbit⁃coupling induced torque in ballistic domain walls：Equivalence of charge⁃pumping and nonequilibrium magnetization formalisms. Physical Review B，2016，93(22)：224415.

[29]	Chen L， Li Y Q， Ben T，et al. Research on the simulation accuracy of static hysteresis loops of electrical steels using an improved simplified LLG equation. AIP Advances，2024，14(1)：015225.

[30]	He J Y， Yang L， Zhan J J. Temporal high⁃order accurate numerical scheme for the Landau⁃Lifshitz⁃Gilbert equation. Mathematics，2024，12(8)：1179.

[31]	Zhan J J， Yang L， Du R，et al. Towards preserving geometric properties of Landau⁃Lifshitz⁃Gilbert equation using multistep methods. Communications in Computational Physics，2024，35(5)：1327-1351.

[32]	Gonzalez⁃Chavez D E， Zamudio G P， Sommer R L. Solutions to the Landau⁃Lifshitz⁃Gilbert equation in the frequency space：Discretization schemes for the dynamic⁃matrix approach. Journal of Magnetism and Magnetic Materials，2024，603：172179.

[33]	Li L Y， Chen L N， Liu R H，et al. Recent progress on excitation and manipulation of spin⁃waves in spin hall nano⁃oscillators. Chinese Physics B，2020，29(11)：117102.

[34]	Zeng Z M， Finocchio G， Zhang B S，et al. Ultralow⁃current⁃density and bias⁃field⁃free spin⁃transfer nano⁃oscillator. Scientific Reports，2013，3(1)：1426.

[35]	Zeng Z M， Finocchio G， Jiang H W. Spin transfer nano⁃oscillators. Nanoscale，2013，5(6)：2219-2231.

[36]	Xu Y， Wang S， Xia K. Spin⁃transfer torques in antiferromagnetic metals from first principles. Physical Review Letters，2008，100(22)：226602.

[37]	Slonczewski J C. Current⁃driven excitation of magnetic multilayers. Journal of Magnetism and Magnetic Materials，1996，159(1/2)：L1-L7.

[38]	Berger L. Emission of spin waves by a magnetic multilayer traversed by a current. Physical Review B，1996，54(13)：9353.

[39]	Tsoi M， Jansen A G M， Bass J，et al. Excitation of a magnetic multilayer by an electric current. Physical Review Letters，1998，80(19)：4281-4284.

[40]	Myers E B， Ralph D C， Katine J A，et al. Current⁃induced switching of domains in magnetic multilayer devices. Science，1999，285(5429)：867-870.

[41]	Wegrowe J E， Kelly D， Jaccard Y，et al. Current⁃induced magnetization reversal in magnetic nanowires. Europhysics Letters，1999，45(5)：626.

[42]	Amari S I. Backpropagation and stochastic gradient descent method. Neurocomputing，1993，5(4/5)：185-196.

[43]	Dreyfus S E. Artificial neural networks，back propagation，and the Kelley⁃Bryson gradient procedure. Journal of Guidance Control and Dynamics，1990，13(5)：926-928.

[44]	Johansson E M， Dowla F U， Goodman D M. Backpropagation learning for multilayer feed⁃forward neural networks using the conjugate gradient method. International Journal of Neural Systems，1991，2(4)：291-301.

[45]	Shukla K， Di Leoni P C， Blackshire J，et al. Physics⁃informed neural network for ultrasound non⁃destructive quantification of surface breaking cracks. Journal of Nondestructive Evaluation，2020，39(3)：61.

[46]	Chen Y Y， Lu L， Karniadakis G E，et al. Physics⁃informed neural networks for inverse problems in nano⁃optics and metamaterials. Optics Express，2020，28(8)：11618-11633.

[47]	Kovacs A， Exl L， Kornell A，et al. Magnetostatics and micromagnetics with physics informed neural networks. Journal of Magnetism and Magnetic Materials，2022，548：168951.

[48]	Vansteenkiste A， Leliaert J， Dvornik M，et al. The design and verification of Mumax3. AIP Advances，2014，4(10)：107133.

[49]	Wang Y Q， Zhang Y， Li C Z，et al. Ultrastrong to nearly deep⁃strong magnon⁃magnon coupling with a high degree of freedom in synthetic antiferromagnets. Nature Communications，2024，15(1)：2077.

[50]	Niu H， Yoon H G， Kwon H Y，et al. Magnetic skyrmionic structures with variable topological charges in engineered Dzyaloshinskii⁃Moriya interaction systems. Nature Communications，2025，16(1)：3453.

[51]	Niu H， Kwon H Y， Ma T P，et al. Reducing crystal symmetry to generate out⁃of⁃plane Dzyaloshinskii⁃Moriya interaction. Nature Communications，2024，15(1)：10199.

[52]	朱耿宽，高振宇，陈丽娜，等. 垂直点接触自旋霍尔纳米振荡器中自旋波动力学的微磁学模拟. 南京大学学报(自然科学)，2023，59(2)：213-221.