微软Orca 2完胜！推理能力与5-10倍大小的模型相当

站长网2023-11-23 14:44:453阅

要点:

1、Orca2是一个13亿参数的语言模型，通过增强的训练信号提高了小型语言模型的推理能力，与5-10倍于其大小的模型相比具有相当甚至更好的性能。

2、Orca2旨在教导小型语言模型利用一系列推理技巧，并帮助其确定适合特定任务的最有效推理策略。

3、Orca2通过采用谨慎推理技术，即 Prompt Erasure，不仅可以执行具体的推理步骤，还可以在更高层面上制定任务处理策略。

微软研究团队推出的13亿参数模型 Orca2在近期发布的一篇论文中探索了如何提升小型语言模型的推理能力。通过增强的训练信号，Orca2能够在与其大小相似的模型中取得与5-10倍更大的模型相媲美甚至更好的性能。

Orca2的目标是教导小型语言模型采用一系列推理技巧，并帮助其确定对于特定任务最有效的推理策略。与其前身 Orca1类似，研究团队借鉴了更强大的大型语言模型的推理策略，并根据小型模型的能力进行了细致调整。

Orca2采用了一种谨慎推理技术，即 Prompt Erasure，使其成为一种谨慎的推理者。这种技术使模型不仅能够执行具体的推理步骤，还能够在更高层面上制定任务处理策略。与盲目模仿强大的大型语言模型不同，研究团队将其视为行为库，从中精心选择适合当前任务的行为。

在实证研究中，研究人员对 Orca2在15个基准测试中进行了全面评估，涵盖了约100个任务和超过36，000个独特提示。结果显示，Orca2在与其大小相似的模型上明显优于它们，甚至在需要高级推理的任务上与5-10倍更大的模型相媲美甚至超过。

这项工作标志着推动小型语言模型推理能力的重要一步。研究团队相信，提升小型模型的能力将为不同的应用部署场景开辟新的可能，并在效率和功能之间找到平衡。

微软Orca2完胜推理能力与510倍大小的模型相当

0003

评论列表

共(0)条

相关推荐

站长资讯
年入千亿、逼急腾讯，丁磊赚麻了？
过去，在人们给互联网公司排座次时，总是将目光集中在那些王者和挑战者身上。比如，腾讯与阿里巴巴，美团与拼多多。网易这家公司，好像被“遗忘”已久，因为它老了，且太过稳定。这家成立于1997年的公司，曾让丁磊登上首富宝座，还生长出两家上市公司——网易有道和网易云音乐。但这家公司的各项业务总是处在行业老二的位置，游戏业务和音乐业务都排在腾讯后面，市值也通常排在第六或第七。
站长网2024-03-01 09:26:34
0000
用活人脑细胞构建AI系统，语音识别准确率提升至78%
要点:1、用活人脑细胞构建AI系统，语音识别准确率大幅提升;2、新型系统可以进行无监督学习，并具有类似神经网络的功能;3、系统的学习能力取决于脑类器官中神经细胞之间的连接。
站长网站长资讯2023-12-12 17:07:08
0000
站长资讯
今年以来，抖音直播处置户外低俗直播行为帐号27W+个
今日，抖音直播发布了关于整治户外直播乱象的处置公示第四期内容。2023年1月至今共处罚涉及户外低俗直播行为的帐号271，919个。
站长网2023-04-16 08:06:44
0000
站长资讯
联想浏览器推出小乐 AI 助手：集成百度文心一言大模型
站长之家(ChinaZ.com)8月7日消息:联想浏览器微博消息，联想浏览器今日发布了9.0.2.7311正式版本，并新增了小乐AI助手的测试版。根了解，这款AI助手集成了百度的文心一言大模型。经过实际测试，用户可以向小乐AI助手测试版询问「你是文心一言吗」，并会得到肯定的回答。助手介绍自己能够与人对话互动，回答问题，协助创作，帮助人们获取信息、知识和灵感。
站长网2023-08-07 17:37:39
0000
月销破亿，被嘲“美丽刑具”，光腿神器是怎样炼成的？
如果提名今年热度最高的时尚单品，除了精准拿捏大学生的军大衣，让无数女孩疯狂下单的光腿神器一定榜上有名。随着天气逐渐转冷，淘宝、抖音、快手等各平台直播间纷纷上架不同款式、不同价位的光腿神器，吸引无数消费者下单。以抖音为例，据新榜旗下抖音数据工具新抖统计，光腿神器品牌小野和子近30天累计销售额破亿，觅橘、茉寻、她琳talin等品牌的月销售额也均在千万以上。
站长网站长资讯2023-12-11 14:08:13
0000