当前位置:主页 > 玻璃升降器 >

深度学习求解「三体」问题,计算速度提高一亿

发布时间:19-11-05 阅读:702

本文由清华大年夜学姜蔚蔚向雷锋网AI科技评论投稿,未经容许禁止转载。

雷锋网 AI 科技评论按:这篇论文试图经由过程深度神经收集来办理天体力学中闻名的三体问题。早在牛顿的期间,三体问题就已经被提出,即三个可视为质点的天体在互相之间万有引力感化下的运动规律问题,至今无法被正确求解。与之相对的,描述两个天体互相运动的二体问题可以经由过程牛顿力学完美办理。三体问题在海内的有名度部分来自于科幻小说家刘慈欣的小说《三体》,此中就描述了一个生活在三体星系的地外文明,忍受着三颗恒星繁杂多变的运行轨迹带来的变更多真个气象,由此孕育发生了星际移夷易近并试图攻克地球的故事。

从数学上说,每一个天体在别的两个天体的万有引力感化下的运动方程可以表示为3个二阶的常微分方程或6个一阶的常微分方程[1]。在三体问题中,对应了求解18阶方程。然而,物理定律只给了我们10个等式,包孕3个质心方程、3个动量守恒方程、3个角动量守恒方程和1个能量守恒方程。是以从数学上完美求解三体问题是弗成能的。

既然如斯,数学家们弃置了一样平常环境下的三体问题求解,转而探求特定前提下的解,例如法国数学家庞加莱就提出了限定性三体问题,即两体的质量极大年夜,第三体不能对它们造成扰动的环境。在钻研这个问题的历程中,庞加莱提出了混沌理论,并且发清楚明了三体问题中的“蝴蝶效应”:假如初始状态有一个小的扰动,那么后来的状态会有极大年夜的不合。

与数学家们不合,谋略机科学家采取了另一种思路,即经由过程近似和数值技巧来谋略阐发三体之间的关系。到了2015年,钻研职员提出了一个名为Brutus的积分器,基于Bulirsch-Stoer算法可以求解N体问题的随意率性给定精度的近似收敛解。然而这种措施对内存的要求跟着精度的增高和模拟光阴的增长而呈指数级增长。

论文标题:Newton vs the machine:solving the chaotic three-body problem using deep neural networks

下载链接:https://arxiv.org/abs/1910.07291

在这篇论文中,来自爱丁堡大年夜学、剑桥大年夜学、阿威罗大年夜学、莱顿大年夜学的钻研职员试图经由过程深度神经收集来办理三体的谋略问题。神经收集模型取得了跟Brutus异常靠近的谋略结果,然则速率却快了一亿倍。如斯令人震动的速率提升效果激发了数学家和谋略机学家对付这篇论文的关注和大年夜量评论争论。

模型和实验

作者首先简化了三体问题,限定为三个质量相等、初始速率为零的粒子在一个平面上的引力问题。如图1所示:

图1. 三个粒子的初始位置。

粒子1的初始位置x1=(1,0)代表了间隔原点的单位间隔,粒子2的初始位置x2在图1中的绿色区域中随机孕育发生,而因为对称性,粒子3的初始位置x3=-x1-x2。图1中的红点代表粒子2和粒子3重合的特殊环境,此时x2=x3=(-0.5, 0)。

然后作者们使用Brutus模拟求解了10000次它们的三体运动,完成这些模拟花费了10天的光阴。接下来对神经收集模型而言,作者们应用此中的9900次模拟作为练习集,100次模拟作为练习集。这篇论文中应用的深度神经收集模型是一个包孕10个暗藏层、128个节点前馈神经收集,如图2所示:

图2. 牛顿肖像画和神经收集模型。

练习历程采纳了Adam优化器,每个epoch分为5000个batch,激活函数应用了ReLU。练习历程中匀称绝对偏差随epoch变更的环境如图3所示,

图3. 匀称绝对偏差vs epoch。

此中实线代表练习集,虚线代表验证集,3.9、7.8和10分手代表了应用的数据量的大年夜小,特其余,10代表应用了整个10生成成的数据,即整个数据集。

图4. 神经收集和Brutus结果的比较。

在图4中,作者给出了练习好的模型与Brutus谋略结果的比较,左半边为练习集上的比较,右半边为验证集上的比较。三种颜色的曲线代表三个例子的运动轨迹,而因为结果太靠近,实线代表的神经收集的轨迹和虚线代表的Brutus的轨迹险些无法分辨,代表颠末练习的神经收集令人知足地再现了粒子之间的互相感化。而神经收集的谋略光阴(大年夜约是10的负三次方秒)比Brutus快了十万倍(无意偶尔候以致是一亿倍)。进一步,作者们也比较了神经收集模型对付初始位置扰动的敏感性。经由过程在x2的初始位置上加入一个很小的扰动,神经收集模型依旧取得了跟Brutus邻近的结果,如图5所示。

图5. 初始位置的敏感依附。

着末,作者们也考试测验使用神经收集来猜测粒子的速率信息,然则神经收集在求解问题的时刻彷佛没有遵照能量守恒定律,作者们在工资加入一个能量投影层之后,才使得猜测偏差从10-2低落到了10-5,如图6所示。

图6. 相对能量偏差。

结 论

这篇论文成功验证了神经收集在混沌系统仿真中的利用,能够以更快的速率完成传统的措施(例如Brutus)的仿真事情,从而展示了在办理类似的繁杂性问题上的利用潜力。

这篇论文的不够也是很显着的。很多人觉得这篇论文只是一种观点上的验证,由于论文中的神经收集模型只能办理二维平面内并且初速率为0的三体问题。“深度进修”近年来的火爆使得它的利用早于越过了传统的谋略机领域。在物理领域,曾经就有钻研将神经收集利用于模拟中子星碰撞[3]。然而这种广泛的利用也引起了钻研职员的担忧和质疑,例如Nature上一篇使用深度进修猜测地震余震[4]的论文就被质疑为深度进修措施的“滥用”。今朝来看深度神经收集还无法完全替代Brutus这样的对象。正如作者所说的,未来他们会斟酌构建一个混杂系统,当谋略包袱过重时引着迷经收集,直到可以继承应用Brutus措施谋略,从而能够更快地模拟星体之间的运动。

参考:

[1] 浅谈三体问题, 甘庆雨, 2014. http://hpc.seu.edu.cn/dong/class/2014-Ganqingyu.pdf

[2] Boekholt T, Zwart S P. On the reliability of N-bodysimulations[J]. Computational Astrophysics and Cosmology, 2015, 2(1): 2.

[3] Adamczewski-Musch J, Arnold O, Behnke C, et al. Probing densebaryon-rich matter with virtual photons[J]. Nature Physics, 2019, 15:1040-1045.

[4] DeVries P M R, Viégas F, Wattenberg M, et al. Deep learning ofaftershock patterns following large earthquakes[J]. Nature, 2018, 560(7720):632.

雷锋网报道。



上一篇:吉林省纪委原副书记邱大明一审获刑14年
下一篇:◤上海进博会◢ 中国是一个守信的国家 习近平: