新加坡国立大学发布Goat 算数能力超过GPT-4

站长网2023-06-07 19:12:160阅

尽管大规模语言模型在各种自然语言处理任务中展现出卓越的性能，但算术类问题仍然是一个难题，即使是目前最强大的GPT-4也很难解决基本的运算问题。

最近，来自新加坡国立大学的研究人员提出了一个专门用于算术问题的模型，名为Goat。在对LLaMA模型进行微调后，Goat在算术上实现了比GPT-4更出色的性能。

通过微调合成的算术数据集，Goat在BIG-bench算术子任务上实现了最先进的性能。通过监督微调，Goat在大数加减运算中实现了准确率近乎完美，超越了之前所有的预训练语言模型，例如Bloom、OPT、GPT-NeoX等。其中，零样本的Goat-7B所达到的精度甚至超过了少样本学习后的PaLM-540。

论文地址:https://arxiv.org/pdf/2305.14201.pdf

研究人员将Goat的卓越性能归功于LLaMA的数字一致性分词技术。

为了解决更具挑战性的任务，例如大数乘法和除法，研究人员提出了一种方法，将任务根据算术的可学习性进行分类，然后利用基本算术原理将不可学习的任务（例如多位数乘法和除法）分解为一系列可学习的任务。通过全面实验验证后，文中提出的分解步骤可以有效地提高算术性能。

此外，Goat-7B可以在24GB VRAM GPU上使用LoRA进行高效训练。而其他研究人员也可以很容易地重复这个实验，因为该模型、数据集和生成数据集的Python脚本即将开源。

新加坡国立大学发布Goat算数能力超过GPT4

0000

评论列表

共(0)条

相关推荐

站长资讯
重拳出击！抖音2024年封禁110万个水军账号协助抓捕90名犯罪嫌疑人
快科技1月26日消息，今日，抖音发布2024年平台治理报告，抖音表示，在创新规则、打击违规行为、强化用网安全保障等方面推出了一系列举措。其中包括，发布AI虚拟人物治理规范，建立热点事件核实机制，推出剧情演绎标注工具，溯源打击伪成功学”、网络水军等违规内容。据抖音介绍，无底线博流量”虚假摆拍”不当利用AI生成内容”是用户反馈较为集中的问题领域。
站长网2025-01-27 10:36:04
0000
站长资讯
马斯克的保镖团队扩充至20人，出行时卫生间都不离视线!
最近，特斯拉的CEO埃隆・马斯克的安全措施引发了广泛关注。随着他的财富和名声不断攀升，所面临的安全威胁也愈加严峻，这让他不得不提升个人安保的等级。据美国安全专家透露，马斯克的安保团队如今就像一个小型的特勤局，保镖人数也从以往的两人增加到了现在的20人。他的出行时总是环绕着这些全副武装的专业安保人员，连卫生间也不离开视线。图源备注：图片由AI生成，图片授权服务商Midjourney
站长网2024-09-17 10:01:53
0000
月活近14亿！一季度微信月活比QQ多了8亿背后：越来越多人离不开
快科技5月14日消息，今日，腾讯发布2024年第一季度财报，其中数据显示，微信月活已经逼近14亿。按照腾讯的财报，微信月活达13.59亿，同比增长3%，QQ月活5.53亿，同比下降7%。在一个季度的时间，微信月活比QQ多了8亿，这也反应了当下用户对于微信的依赖程度（国民App绝非浪得虚名）。对此有用户表示，QQ今年升级成了QQ9版本之后，交互和界面都真的非常难看、难用。
站长网站长资讯2024-05-14 21:53:03
0000
站长资讯
360智脑API平台正式开放首先为20个行业提供解决方案
6月28日，360集团创始人周鸿祎在GPT产业联盟成立大会上发布了360企业级AI大模型战略，并宣布360智脑API平台正式开放，将首先为20个行业提供解决方案。据了解，360智脑行业解决方案将率先在安全、传媒、文旅、政务、能源等近20个行业落地，为企业级用户构建包括“办公写作大脑、决策分析大脑、知识管理大脑、客户服务大脑、文旅招商大脑”在内的“五个智慧大脑”。
站长网2023-06-29 11:39:58
0000
2023年最后一个工作日打车需求翻倍：滴滴上线免佣卡
滴滴出行在2023年的最后一个工作日发出提醒，预计今晚（12月29日）的晚高峰将提前至16点开始。根据滴滴的数据，元旦假期的打车需求预计将比去年同期上涨100%，而顺风车跨城出行的订单预计将上涨近220%。前往机场和火车站的需求也将比上周增加50%。
站长网站长资讯2023-12-29 13:58:07
0000