新智元报导
来历:arXiv等
修改:向学、大明
【新智元导读】Facebook AI的研究人员将数学视为自然言语,并将数学简写拆分为基本单位,去练习神经网络,然后秒解微积分表达式,远超现在的商业软件(如Maple、Matlab、Mathematica)!详细的精妙思维跟操作是怎么样的呢?戳右边链接上新智元小程序了解更多!
Facebook的神经网络也可以核算积分和求解微分方程啦!虽然其他的神经网络还没有逾越简略的加减法和乘除法。这是怎么回事呢?让我们来一探终究!
近来,Facebook AI Research的研究人员Guillaume Lample 和 Fran ois Charton 开发了一套新算法,只需一点考虑的时刻就可以解出一阶微分方程。他们练习了一个神经网络来履行必要的符号推理,初次完成了对数学表达式的微分和积分。这项效果是迈向更强壮的数学推理的重要一步,也是运用神经网络逾越传统形式辨认使命的新办法。
在形式辨认使命(如面部和物体辨认,某些自然言语处理,乃至是玩象棋、围棋和太空侵略者这样的游戏)上,神经网络现已取得了巨大的成果。可是,虽然付出了很大尽力但仍没人可以练习神经网络完成像数学那样的符号推理使命,神经网络所取得的最好成果是整数的加法和乘法。神经网络和人类相似,剖析高档数学表达式的难点之一是它们所依靠的简写。例如,表达式是x乘以x乘以x的简写办法。要让神经网络 “把握” 这种逻辑十分困难。假如它们不明白简写代表什么,那么就简直学不会怎么运用简写。实际上,人类也有相似的问题,但处理办法一般是从小就开端灌注。
从本质上来讲,微分和积分的运算进程仍涉及到形式辨认,虽然被数学简写所遮盖。
将数学式标明为自然言语
Lample和Charton 提出了一种高雅的解决办法:他们先将数学简写拆分为基本单位;然后教神经网络去辨认积分和微分中包括的数学运算形式;最终他们再用全新的表达式去测验神经网络,并将成果与传统运算器(如Mathematica和Matlab)进行比照。
这样的一个进程的第一步,是把数学表达式分解成它们的组成部分,Lample和Charton经过将表达式标明为树状结构来完成:这些树上的叶子是数字、常量和变量,如x;内部节点是运算符,如加法、乘法、微分等。
如:表达式
可别离标明为:
假如不同树的数学运算成果相同,那么就以为这些树是相同的,如:2 + 3 = 5 = 12 - 7 = 1 x 5是相同的。这样以来,表达式简化相当于找到一个更短的等价树标明。这些树也可以写成每个节点接连组成的序列,现在正好可以被一种名为Seq2Seq的神经网络来处理。这种办法也被用于机器翻译:其间一种言语的单词序列有必要翻译成另一种言语的单词序列。而他们的办法本质上是将数学视为一种自然言语。
下一步便是练习进程,这需求许多的数据来学习。Lample 和 Charton 经过从二元运算符库(如加法、乘法等)、一元运算符库(如cos、sin和exp)以及一组变量、整数和常数(如π和e)中随机组合数学表达式来创立新的数据库。他们还约束了树的内部节点数量,避免方程变得过于巨大。即便节点和数学组件的数量相对较少,或许的表达式也是许多的。然后运用核算机代数体系对每个随机方程进行积分和微分;任何无法积分的表达式都会被丢掉。
经过这种办法,研究人员生成了一个巨大的练习数据集,其间包括8000万个一阶和二阶微分方程示例、2000万个分部积分表达式示例。神经网络运用这些数据集进行练习,学习怎么对给定的数学表达式求导或积分。
最终,Lample和Charton在神经网络中输入了5000个曾经从未见过的表达式,并将500个比如的成果与商业软件(如Maple、Matlab和Mathematica)等的成果进行了比较。
成果显现,在所有的使命中,都观察到神经网络显着优于Mathematica;在函数积分方面,神经网络的准确性挨近100%,而Mathematica牵强到达85%;Maple和Matlab软件包的均匀功能不如Mathematica。
在许多情况下,传统的运算器在30秒的时刻内底子找不到解;而神经网络需求大约1秒钟就能找到解。
论文简介:求解器的未来是数学结构+神经网络
论文链接:https://arxiv.org/pdf/1912.01412.pdf
本文证明了规范seq2seq模型可以应用于比如函数积分或求解微分方程之类的困难使命。本文提出了一种生成恣意大的方程式数据集及其相关解的办法,并证明了在这些数据集上练习的简略转换器模型在核算函数积分和求解微分方程方面都体现出色,其体现优于依靠许多算法和启发式办法的最新数学结构(如Matlab或Mathematica) ,以及杂乱的其他完成办法。
试验成果还标明,该模型可以以彻底不同的办法编写相同的表达式。鉴于神经模型难以履行更简略的使命(例如整数加法或乘法),因而这些成果令人惊奇。可是,提出的假定有时是不正确的,而且一般需求细心考虑多个波束假定才干取得有用的解决计划。模型自身并未供给解决计划自身的有用性,而是由外部符号结构供给的。这些成果标明,将来,规范数学结构或许会将神经网络组件集成到求解器中,然后进步功能。
图1 不同运算符和表达式下的树和叶子的不同数量
图2 本文seq2seq模型求解微分方程/积分方程精度与其他求解计划的比照
图3 本文seq2seq模型求解测验集500个方程的精度与Mathematica, Maple和Matlab求解成果的比照
该论文一出,各学术研究者都纷繁加入了剧烈的评论之中!
关于这个新的研究效果,您怎么看?