数学大神陶哲轩用AI工具发现论文中的错误

新知榜官方账号

2023-10-31 06:04:32

数学大神陶哲轩用AI工具发现论文中的错误

近期,热衷于用GPT-4、Copilot做研究的数学大神陶哲轩,再次利用AI工具发现了自己论文中的一处隐藏bug。他表示,未来AI将成为数学研究的合著者,这已经愈发逼近了。

陶哲轩在用Lean4形式化第6页论点的过程中发现,表达式在n=3,k=2时,实际上是发散的。这个不太容易看出的bug能被及时捉住,多亏了Lean4。原因是,Lean要求他构建0<n−3,但陶哲轩只假设了n>2。由此,Lean无法基于负的0<n−3得到反证。好在,这只是一个小bug,只存在于n值很小的情况。此时,只需修改论文中的一些常数就可以了。

一些数学爱好者粉丝在此帖中惊呼:这太惊人了,很高兴看到AI证明助手的传播,为数学研究的未来奠定了更坚实的基础。而陶哲轩表示,这是完全有可能的事。或许在不久的将来,我们就可以在Lean之上构建一个AI层。只要把证明中的各步描述给AI,AI就可以利用Lean来执行证明了,过程中还能各种调用计算机代数软件包。

今年6月,陶哲轩就曾在GPT-4试用体验的博客中预言——2026年,AI将与搜索和符号数学工具相结合,成为数学研究中值得信赖的合著者。这期间,不断有人证明着这一点。比如加州理工、英伟达、MIT等机构的学者,就构建出一个基于开源LLM的定理证明器。而陶哲轩也身体力行,新论文已经开始用GPT-4写了,并屡屡惊呼——GitHubCopilot的惊人能力,让我感到不安!

AI加持大神数学研究

最近这个月,陶哲轩是彻底「入坑」AI了。在GPT-4的帮助下,他开始学习用Lean4写论文、做数学研究。这个过程无疑令他十分激动,因此隔三岔五(甚至每隔几个小时)就会在mastodon上发帖,记录自己的学习感悟和经验总结。

在写一篇关于麦克劳林不等式研究的论文中,陶哲轩就大量用到了GPT-4、Copilot、Lean4等AI工具。现在的进度是,陶哲轩已经在Lean4中完成对论文第2节论点的修复了。只不过这个过程这比他预想的要繁琐得多,每一行证明都要花费大约一个小时来形式化。在项目的第一周,他的瓶颈在于不熟悉Lean语法和工具;但目前的瓶颈在于工具本身——不如计算机代数软件包中的工具先进。

陶哲轩表示自己需要粗略地模拟Lean4的重写策略,通过剪切、粘贴等操作,对从一行到下一行的冗长表达式进行有针对性的编辑。这会导致错别字在文档中一连传播多行。而Lean4就能以自动和验证的方式,完成这种重写。当然,Lean4目前还不是万能的,也存在一些局限。比如重写涉及约束变量的表达式,并不总能轻易完成。

Copilot竟能猜出后续步骤

在这篇麦克劳林不等式研究的论文中,陶哲轩就惊诧地发现,Copilot竟然能够预测出自己下一步想要做什么!它不仅能正确预测出用于各种例行验证的多行代码,还能根据陶哲轩提供定理的名称,推断出他想要往哪个方向做研究。这让陶哲轩连连惊呼:太不可思议了!

在证明论文定理1.3的过程中,陶哲轩用Lean4完成了定理证明的形式化。在论文中,证明过程中只有一页纸,不过形式化证明却使用了200行Lean4。在这个过程中,GitHubCopilot表现出了种种神预测,神奇地推测出了陶哲轩的研究接下来的方向。而Lean的重写策略,让他能通过有针对性的替换,来修改冗长的假设或目标。这个功能极为重要,它可以让人们自由操纵这些表达式,而不必总是完整地输入它们。相对来说,在LaTex中,这种操作就麻烦多了。

陶哲轩表示自己很期待,什么时候很简单地用自然语言,来要求LLM进行这样的转换。

本页网址:https://www.xinzhibang.net/article_detail-18410.html

寻求报道,请 点击这里 微信扫码咨询

关键词

陶哲轩 AI工具 数学论文 Lean4 Copilot bug

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯