麻省理工学院研究:辩论让AI机器人更加聪明

站长网2023-09-21 11:01:280阅

文章概要:

1. MIT研究发现，多智能体辩论可以提高AI模型的准确性和推理能力。

2. 辩论方法减少了幻觉，帮助模型增强响应能力。

3. 研究团队发现，让多个AI系统辩论问题的答案比仅使用单个AI系统可以提高响应的准确性。

麻省理工学院（MIT）的研究人员发现，相较于仅使用单个AI系统，让多个AI系统辩论问题的答案可以显著提高响应的准确性和推理能力。这一研究成果出现在题为《通过多智能体辩论提高语言模型的真实性和推理能力》的论文中。该研究还得到了Google DeepMind研究员Igor Mordatch的合作。

研究人员将这一方法命名为“多智能体社会（Multiagent Society）”，并发现它可以减少生成输出中的幻觉。最令人兴奋的是，这一方法甚至可以应用于像OpenAI的ChatGPT这样的现有黑盒模型。

这一方法的实施包括多轮回的响应生成和评论。模型首先生成对给定问题的答案，然后整合来自其他智能体的反馈，以更新自己的响应。研究人员发现，这一过程可以改善最终的输出，因为它类似于团队讨论的结果，各个智能体共同贡献答案以达成统一的结论。

此外，这一方法还可以用于结合不同的语言模型，比如将ChatGPT与Google Bard进行对比。虽然这两个模型在示例提示下都生成了不正确的答案，但它们之间可以生成正确的最终答案。

通过多智能体社会方法，MIT团队能够在自然语言处理、数学和解谜等各种基准测试中取得卓越的成绩。例如，在流行的MMLU基准测试中，使用多个智能体的模型准确度得分为71，而仅使用单个智能体的得分为64。

主要研究人员之一，MIT博士生Yilun Du表示:“我们的方法使用了多个AI模型，每个模型都带来了独特的见解来解决问题。尽管它们的初始响应可能会显得缩短或包含错误，但这些模型可以通过审查其同行提供的响应来提炼和改进自己的答案。”

这一研究成果为AI领域的进一步发展提供了新的思路和方法，有望改进现有的语言模型，并提高其真实性和推理能力。

麻省理工学院研究辩论让AI机器人更加聪明

0000

评论列表

共(0)条

相关推荐

柜哥柜姐，AI的新工作
在《哈利·波特》的魔法世界里，飞来咒，能够召唤巫师所需的任何物品。作为一个实用性强、使用频率高的咒语，“飞来咒”没少在书中出现。主角哈利·波特曾使用“飞来咒”召唤火弩箭，成功在三强争霸赛的第一个项目中穿越火龙的看守;也曾使用“飞来咒”召唤飞天扫帚，赶往霍格沃兹参与救援。而回到真实的世界，有一批电商平台、AI初创公司，正试图让“飞来咒”成为帮助商家迅速匹配货源、或是帮助用户便捷购物的现实工具。
站长网站长资讯2024-12-12 09:07:38
0000
站长资讯
「编辑器之神Vim」之父去世，网友：他改变了很多人的一生
编辑器之神Vim之父，BramMoolenaar逝世，享年62岁。（程序员圈子内广为流传的一句话:世界上只有三种程序员，用Vim的，用Emacs，和用其他的。）在Bram家人发布的讣告中写到:我们必须怀着沉重的心情通知您，由于在过去几周里病情迅速恶化，BramMoolenaar于8月3日去世。
站长网2023-08-07 14:33:38
0000
站长资讯
PyTorch团队重写Meta“分割一切”模型性能提速8倍
要点:PyTorch团队通过对Meta的「分割一切」（SAM）模型进行重写，使其在原始实现的基础上提速8倍，同时保持准确率。优化方法包括采用PyTorch原生特性如Torch.compile、GPU量化、SDPA等，以及使用半精度（bfloat16）、自定义Triton内核、NestedTensor、量化、半结构化稀疏性等操作。
站长网2023-11-22 11:56:36
0001
站长资讯
「深呼吸」让大模型表现更佳！谷歌DeepMind利用大语言模型生成Prompt，还是AI更懂AI
【新智元导读】谷歌DeepMind提出了一个全新的优化框架OPRO，仅通过自然语言描述就可指导大语言模型逐步改进解决方案，实现各类优化任务。「深呼吸，一步一步地解决这个问题。」这句像你在冥想时会听到的话，其实是大语言模型的Prompt提示词!只是多了「深呼吸」的命令，模型在GSM8K的得分就从「thinkstepbystep」的71.8上升至80.2，成为表现最佳的Prompt。
站长网2023-09-20 14:09:20
0000
站长资讯
iPhone安卓手机可互发5G消息了：已在美国开放该功能
站长之家（ChinaZ.com）6月26日消息:6月25日，苹果公司发布了iOS18Beta2更新，其中一项引人注目的新功能是RCS（富通信服务）相关的设置选项。然而，根据最新的用户反馈，虽然该选项已经在更新中呈现，但尚未全面生效。不过，值得欣喜的是，这一功能已经在美国地区率先开放。
站长网2024-06-26 16:05:06
0000