数学大神陶哲轩用AI工具发现论文中的错误

新知榜官方账号

2023-10-31 06:04:32

数学大神陶哲轩用AI工具发现论文中的错误

近期，热衷于用GPT-4、Copilot做研究的数学大神陶哲轩，再次利用AI工具发现了自己论文中的一处隐藏bug。他表示，未来AI将成为数学研究的合著者，这已经愈发逼近了。

陶哲轩在用Lean4形式化第6页论点的过程中发现，表达式在n=3,k=2时，实际上是发散的。这个不太容易看出的bug能被及时捉住，多亏了Lean4。原因是，Lean要求他构建0<n−3，但陶哲轩只假设了n>2。由此，Lean无法基于负的0<n−3得到反证。好在，这只是一个小bug，只存在于n值很小的情况。此时，只需修改论文中的一些常数就可以了。

一些数学爱好者粉丝在此帖中惊呼：这太惊人了，很高兴看到AI证明助手的传播，为数学研究的未来奠定了更坚实的基础。而陶哲轩表示，这是完全有可能的事。或许在不久的将来，我们就可以在Lean之上构建一个AI层。只要把证明中的各步描述给AI，AI就可以利用Lean来执行证明了，过程中还能各种调用计算机代数软件包。

今年6月，陶哲轩就曾在GPT-4试用体验的博客中预言——2026年，AI将与搜索和符号数学工具相结合，成为数学研究中值得信赖的合著者。这期间，不断有人证明着这一点。比如加州理工、英伟达、MIT等机构的学者，就构建出一个基于开源LLM的定理证明器。而陶哲轩也身体力行，新论文已经开始用GPT-4写了，并屡屡惊呼——GitHubCopilot的惊人能力，让我感到不安！

AI加持大神数学研究

最近这个月，陶哲轩是彻底「入坑」AI了。在GPT-4的帮助下，他开始学习用Lean4写论文、做数学研究。这个过程无疑令他十分激动，因此隔三岔五（甚至每隔几个小时）就会在mastodon上发帖，记录自己的学习感悟和经验总结。

在写一篇关于麦克劳林不等式研究的论文中，陶哲轩就大量用到了GPT-4、Copilot、Lean4等AI工具。现在的进度是，陶哲轩已经在Lean4中完成对论文第2节论点的修复了。只不过这个过程这比他预想的要繁琐得多，每一行证明都要花费大约一个小时来形式化。在项目的第一周，他的瓶颈在于不熟悉Lean语法和工具；但目前的瓶颈在于工具本身——不如计算机代数软件包中的工具先进。

陶哲轩表示自己需要粗略地模拟Lean4的重写策略，通过剪切、粘贴等操作，对从一行到下一行的冗长表达式进行有针对性的编辑。这会导致错别字在文档中一连传播多行。而Lean4就能以自动和验证的方式，完成这种重写。当然，Lean4目前还不是万能的，也存在一些局限。比如重写涉及约束变量的表达式，并不总能轻易完成。

Copilot竟能猜出后续步骤

在这篇麦克劳林不等式研究的论文中，陶哲轩就惊诧地发现，Copilot竟然能够预测出自己下一步想要做什么！它不仅能正确预测出用于各种例行验证的多行代码，还能根据陶哲轩提供定理的名称，推断出他想要往哪个方向做研究。这让陶哲轩连连惊呼：太不可思议了！

在证明论文定理1.3的过程中，陶哲轩用Lean4完成了定理证明的形式化。在论文中，证明过程中只有一页纸，不过形式化证明却使用了200行Lean4。在这个过程中，GitHubCopilot表现出了种种神预测，神奇地推测出了陶哲轩的研究接下来的方向。而Lean的重写策略，让他能通过有针对性的替换，来修改冗长的假设或目标。这个功能极为重要，它可以让人们自由操纵这些表达式，而不必总是完整地输入它们。相对来说，在LaTex中，这种操作就麻烦多了。

陶哲轩表示自己很期待，什么时候很简单地用自然语言，来要求LLM进行这样的转换。

本页网址：https://www.xinzhibang.net/article_detail-18410.html

寻求报道，请

关键词

陶哲轩 AI工具数学论文 Lean4 Copilot bug

分享至微信：

相关工具

创客贴推出的AI艺术画生成工具

言之画

AI图像内容创作平台，由出门问问推出

天工巧绘SkyPaint

免费的AI插画绘制工具，由昆仑万维与奇点智源合作推出

remove.bg

强大的AI背景移除工具

DreamUp

DeviantArt推出的AI插画生成工具

Stockimg AI

AI生成各种类型的图像和插画

聊天机器人与多模态语言模型：ChatGPT和GPT-4.0

聊天机器人与多模态语言模型：ChatGPT和GPT-4.0人工智能（AI）是指能够模拟人类智能的计算机系统或软件。AI的发展已经影响了我们的生活的方方面面，从教育、娱乐、医疗、商业到社交等等。在这篇文章中，我们将介绍两个最新最热门的AI项目：ChatGPT和GPT-4.0，它们分别是OpenAI开发

分类标签人工智能聊天机器人多模态语言模型

12-08 22:03

抖音AI扩图逆天，一对恩爱情侣的照片被神操作后画风大反转

抖音AI扩图真的是太逆天了，让人看完之后会意想不到、一肚子气。例如一对恩爱情侣的照片在AI扩图前是非常有信仰感的：但在AI扩图一通神操作之下，画风简直是180度大反转：网友们在看过之后哭笑不得，打趣称“更虔诚”、“太励志”了。作为一个专业产品经理，我认为AI扩图技术的发展虽然有很多潜力，但也需要注意

分类标签抖音AI扩图恩爱情侣

12-06 06:04

大模型商业化：困境与尝试

背景虽然大模型商业化的路径较为清晰，目前国内厂商也都在积极探索，但大模型的商业化之路，不能仅限于商业模式的探索尝试，更在于解决大模型发展的底层问题。困境大模型商业化面临着一系列的困境，如资金投入、伦理道德、安全性、市场接受度等问题。资金投入：庞大的模型训练需要巨额的资金来支持，投入了巨额资金之后，企

分类标签大模型商业化困境尝试MaaS开源Agent

12-06 06:02

欧洲金融独角兽Klarna冻结招聘，CEO称未来大部分工作可由人工智能完成

自人工智能去年末大火以来，“AI会不会抢走人类的工作”就成为全世界讨论的热门话题，不少机构还为此给出了预测报告，分析哪些工作最有可能被AI“抢”走。而如今，这个打工人们的担忧已经开始变成现实：AI已经开始抢工作了。据外媒报道，“欧洲版花呗”Klarna最近已经冻结招聘，并计划缩减员工规模。其CEO认

分类标签 Klarna人工智能减少人力需求

12-06 06:01

2024年，AI行业将会进化成什么样？HuggingFace CEO的6条预测

2024年，AI行业将会进化成什么样？HuggingFace CEO的6条预测2024年，AI行业将会迎来更大的突破和进化。HuggingFace CEO Clement Delangue对未来的发展做出了6条具体的预测，包括AI公司倒闭、开源LLM能力达到闭源水平、AI在生物、化学、时间序列等领域

分类标签 AI行业预测HuggingFace开源生物领域时间序列

11-29 06:09

AI绘画：冲击还是机遇？

AI绘画：冲击还是机遇？随着AI绘画技术的发展，AI绘画已经成为了一种新生的艺术门类。AI作画可以在几秒钟内生成画面优美的高清图片，其画面之精细，想象力之超绝令人惊叹。然而，AI绘画是否能取代艺术家，以及它带来的冲击和机遇，仍然是一个备受争议的话题。AI绘画工具易于上手，效率高，也具备匠气，但灵气不

分类标签 AI绘画艺术家创作人工智能技术算法

11-29 02:13

每日必看的AI前沿

每日必看的AI前沿近日，百度文心一言推出了会员模式，提供文心大模型4.0等升级能力，而工信部则发布了《人形机器人创新发展指导意见》，提出以大模型等AI技术突破为引领，在人形机器人“大脑”和“小脑”、“肢体”关键技术、技术创新体系等领域取得突破。此外，高德云图发布了自主研发的产业大模型“云睿”，该模型

分类标签百度文心一言大模型工信部人形机器人高德云图时空信息

11-29 02:12

百度文心一言推出会员模式，开通可解锁文心大模型4.0

百度文心一言推出会员模式，开通可解锁文心大模型4.0据IT之家网友反馈，百度大模型文心一言现已推出会员模式，开通后可解锁文心大模型4.0。据介绍，文心一言会员单月购买价格为59.9元，连续包月价格为49.9元（次月以49.9元/月自动续费，可随时取消）。此外，百度还推出了文心一言+文心一格（白银）的

分类标签百度文心一言文心大模型4.0会员模式

11-29 02:11

文心一言正式上线会员服务，连续包月费用为49.9元，单月购买为59.9元

文心一言正式上线会员服务，连续包月费用为49.9元，单月购买为59.9元11月1日，文心一言官网显示，会员连续包月费用为49.9元，而单月购买为59.9元。此次会员服务对应的是文心大模型4.0，而文心大模型3.5仍可免费使用。除此之外，文心一言还上线了99元/月的联合会员，包括文心一言会员和文心一格

分类标签文心一言会员服务大模型

11-29 02:06

AI画图工具推荐

AI画图工具推荐AI画图网站虽然在功能和易用性方面也表现的相当出色了，但与绘画软件相比，兼容性上仍存在明显不足，通常需要特定的浏览器和设备才能访问，某种程度上会限制用户的使用灵活性和自由度。为了实现更好的AI画图体验，各类工具软件都需要熟练运用，软件和网站可以说是缺一不可，取长补短才能帮助更好地进行

分类标签 AI抠图AI绘画AI创作改图鸭

11-29 02:04