首页站长资讯Google DeepMind 使用大型语言模型解决纯数学中的著名未解问题

Google DeepMind 使用大型语言模型解决纯数学中的著名未解问题

站长网2023-12-15 10:35:130阅

Google DeepMind 最近利用一种大型语言模型成功破解了纯数学中一个著名的未解问题。该团队在《自然》杂志上发表的论文中宣称，这是首次使用大型语言模型发现长期科学难题的解决方案，产生了之前不存在的可验证且有价值的新信息。Google DeepMind 研究副总裁 Pushmeet Kohli 表示：「这不在训练数据中——甚至以前是未知的。」

大型语言模型通常以编造事实而闻名，而不是提供新事实。Google DeepMind 的新工具 FunSearch 可能改变这一点。它表明，只要适当引导，并且舍弃它们提出的大部分内容，这些模型确实可以做出发现。

FunSearch（之所以这样命名，是因为它搜索数学函数，而不是因为它有趣）延续了 DeepMind 使用 AI 在基础数学和计算机科学领域取得的一系列发现。首先是 AlphaTensor 找到了一种加快多种不同类型代码核心计算的方法，打破了 50 年来的记录。然后是 AlphaDev 找到了加快每天使用数万亿次的关键算法的方法。

然而，这些工具并没有使用大型语言模型。它们都建立在 DeepMind 的游戏 AI AlphaZero 之上，通过将数学问题视为围棋或国际象棋中的难题来解决。问题是它们局限于自己的领域，如同公司研究员 Bernardino Romera-Paredes 所说：「AlphaTensor 擅长矩阵乘法，但基本上没有别的。」

FunSearch 采用了不同的方法。它结合了一个称为 Codey 的大型语言模型（一种在计算机代码上微调的 Google PaLM 2 版本）和其他系统，后者可以排除不正确或无意义的答案，并将好的答案重新输入。

Fawzi，Google DeepMind 的研究科学家说：「说实话，我们有假设，但我们不确切知道为什么这有效。项目开始时，我们不知道这是否会奏效。」

研究人员首先用 Python（一种流行的编程语言）勾勒出他们想要解决的问题，但省略了指定如何解决问题的程序行。这就是 FunSearch 介入的地方。它让 Codey 填补空白——实际上，提出解决问题的代码建议。

然后，第二个算法检查并评分 Codey 提出的内容。最佳建议——即使还不正确——被保存并反馈给 Codey，后者再次尝试完成程序。「许多将是无意义的，一些将是合理的，少数将是真正有启发性的，」Kohli 说。「你拿着这些真正有启发性的内容，然后说，『好的，拿着这些重复一遍。』」

经过几百万次建议和几十次整体过程的重复（历时几天），FunSearch 终于提出了一个正确且之前未知的解决 cap set 问题的代码，该问题涉及寻找某种类型集合的最大尺寸。可以想象在图表纸上绘制点。cap set 问题类似于尝试确定可以放置多少个点，而不会让其中任何三个点形成一条直线。

这个问题非常细致，但很重要。数学家们甚至不同意如何解决它，更不用说解决方案是什么了。（它还与 AlphaTensor 加速的计算——矩阵乘法——有关。）加州大学洛杉矶分校的 Terence Tao，曾获得多个数学顶级奖项，包括菲尔兹奖，他在 2007 年的博客文章中称 cap set 问题为「我最喜欢的开放性问题」。

Tao 对 FunSearch 能做的事情感到好奇。他说：「这是一个有前途的范例。这是利用大型语言模型的力量的一种有趣方式。」

与 AlphaTensor 相比，FunSearch 的一个主要优势是，理论上它可以用来找到一系列问题的解决方案。这是因为它产生代码——生成解决方案的方法，而不是解决方案本身。不同的代码将解决不同的问题。FunSearch 的结果也更容易理解。Fawzi 说，方法通常比它产生的奇怪数学解决方案更清晰。

为了测试其多功能性，研究人员使用 FunSearch 来解决另一个数学难题：bin packing 问题，该问题涉及尝试将物品尽可能少地装入箱子中。这对计算机科学的一系列应用很重要，从数据中心管理到电子商务。FunSearch 提出了一种比人类设计的方法更快的解决方案。

Tao 表示，数学家们「仍在努力弄清楚如何最好地将大型语言模型纳入我们的研究工作流程，以利用它们的力量同时减轻它们的缺点。」他说：「这当然表明了一种可能的前进方向。」

GoogleDeepMind使用大型语言模型解决纯数学中的著名未解问题

0000

评论列表

共(0)条

相关推荐

站长资讯
研究人员使用AI技术鉴别eBay上的艺术品发现多达40件赝品
划重点:-研究人员通过使用AI技术在eBay上鉴别艺术品，发现多达40件假作品，其中包括一幅被标榜为莫奈的作品和一幅被标榜为雷诺阿的作品。-AI算法将所有作品都识别为假作品，有95%的负概率。专家表示这只是冰山一角，eBay需要严肃对待这个问题。-eBay表示不允许销售假冒商品，但研究人员多次致信该平台表达担忧，至今未得到回复。
站长网2024-05-13 11:39:44
0000
站长资讯
OpenAI在中国申请GPT-6和GPT-7商标
**划重点:**1.🚀OpenAI积极在中国申请GPT-6和GPT-7商标，尽管目前未在中国提供服务。2.💡GPT-4参数超过1万亿，预计GPT-6和GPT-7将引领创新，目前商标申请仍在审查中。3.👥OpenAI首席执行官SamAltman强调推动GPT-5研发，寻求微软额外资金，并关注AI创新中的伦理问题。
站长网2023-12-04 14:38:41
0000
站长资讯
GitHub仓库WebAI开源：允许开发者直接在浏览器中运行现代深度学习模型
web-ai是一个开源的TypeScript库，使开发者可以直接在浏览器或Node.js中运行现代深度学习模型。它提供了一种无需复杂服务器端基础设施或依赖第三方API的方式，将AI能力集成到Web应用程序中。项目地址:https://github.com/visheratin/web-ai
站长网2023-09-12 10:32:48
0001
站长资讯
Meta CEO 扎克伯格称苹果 Vision Pro 没有「神奇的解决方案」
马克·扎克伯格在今天与员工举行的全公司范围内会议上回应了苹果发布的VisionPro。据TheVerge的AlexHeath报道，扎克伯格表示，VisionPro没有Meta没有想到的「神奇解决方案」，而且「比他们最近发布的Quest3头显贵七倍」。
站长网2023-06-09 20:57:13
0000
站长资讯
谷歌浏览器新增3个重磅生成式AI！自动生成文本、壁纸等
1月24日，谷歌在官网宣布，在谷歌浏览器（Chrome最新版本M121）中新增自动生成文本、壁纸以及自动管理标签3个全新生成式AI功能，这也是为数不多支持生成式AI的浏览器。需要注意的是，由于这三项功能处于预览测试阶段，企业和教育账户无法使用。此外，谷歌还将大语言模型Gemini融合到，核心业务之一的在线广告搜索平台GoogleAds中，以提供更好的搜索体验。在Web中起草文本内容
站长网2024-01-24 09:06:45
0000