北京大学发布EAGLE 大模型推理效率无损提升3倍

站长网2023-12-14 16:39:570阅

要点:

EAGLE由滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布，将大模型推理效率提升3倍。

EAGLE采用外推大语言模型的第二顶层特征向量的方法，相较于普通自回归解码，其推理速度提升明显，比普通自回归解码快3倍，比Lookahead解码快2倍，比Medusa解码快1.6倍。

EAGLE使用投机采样方法，通过轻量级的自回归头和冻结的分类头相结合，利用大语言模型提取的上下文特征进行外推，从而更高效地生成文本。

近年来，大语言模型在各领域应用广泛，但其文本生成过程昂贵且缓慢。为解决这一问题，滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布了EAGLE。EAGLE的目标是提升大语言模型的推理速度，同时确保输出文本的分布一致性。通过外推大语言模型的第二顶层特征向量，EAGLE成功实现了大模型推理效率的无损提升，比普通自回归解码快3倍，比Lookahead解码快2倍，比Medusa解码快1.6倍。

代码地址:https://github.com/SafeAILab/EAGLE

为了加速自回归解码，EAGLE采用了投机采样方法，使用一个轻量级的自回归头和冻结的分类头相结合。与传统投机采样方法不同，EAGLE的输入包括了抽样结果的词嵌入，使得输入和输出之间更具一致性。这种创新的方法有效地处理了抽样过程中的随机性，提高了生成文本的准确性。

EAGLE的工作原理基于特征向量的可压缩性，通过训练一个轻量级插件，即自回归头，从原始模型的第二顶层预测下一个特征，然后使用原始LLM的冻结分类头预测下一个词。这种外推特征向量的方法使得EAGLE在生成文本的同时保持了与普通解码一致的分布。

总体而言，EAGLE的发布标志着大语言模型推理效率的重大突破，为大规模文本生成任务提供了更加高效的解决方案，将在各领域推动语言模型的应用和发展。

北京大学发布EAGLE大模型推理效率无损提升3倍

0000

评论列表

共(0)条

相关推荐

站长资讯
Canalys预测:2024年全球个人电脑市场将增长8% 具备AI功能个人电脑将占约19%市场份额
划重点:1.🌐全球个人电脑市场连续七个季度下跌后预计将迎来5%的复苏，2024年全年出货量预计将增长8%。2.🔄复苏得益于节日旺季、宏观经济改善以及Windows更新周期，同时具备AI功能和采用Arm架构电脑的兴起也是增长的主要因素。
站长网2023-12-05 09:30:19
0000
ComfyUI时间节点系统TimeUi:可快捷添加、删除或重新排列内容
划重点:⭐️可简单理解为ComfyUI视频剪辑界面，类似于视频编辑工具的时间线界⭐️用户可以直接上传图片至节点或附加其他“上传图片”节点，简化工作流程。⭐️每行时间线都包含各种自定义设置，如切换图像蒙版可见性，轻松微调输出。TimeUi是一个ComfyUI时间节点系统，类似于视频编辑工具的时间线界面，可以快捷添加、删除或重新排列内容，提供流畅的用户体验。
站长网站长资讯2024-06-05 16:45:05
0000
站长资讯
滴滴发布2023年五一假期出行安全公告成立大安全委员会
滴滴出行发布2023年五一假期出行安全公告，宣布升级成立大安全委员会，下设交通与生产安全、信息与数据安全、活动运营安全、合规发展安全、组织建设与员工发展安全、国际发展安全等六个专项安委会。按照大安委部署要求，五一假期及前后，各专项安委会负责人将协同业务负责人、区域负责人、客服团队、应急处置团队，实行24小时轮岗值班制度，全时待命，确保遇到各类紧急情况时切实做到高效响应、妥善解决。
站长网2023-05-12 20:26:55
0001
站长资讯
京东成为2024年总台春晚独家互动合作平台
站长之家（ChinaZ.com）1月24日消息:京东宣布成为2024年总台春晚独家互动合作平台，携手为观众带来一场别开生面的新春盛宴。作为此次合作的亮点，京东不仅提供了多重福利，还将在除夕之夜与观众们共度佳节。观众只需下载并打开京东APP，便有机会以一分钱的价格抢购到1亿份实物好礼，甚至还有机会获得汽车使用权等大奖。
站长网2024-01-24 14:25:41
0000
站长资讯
Khoj：一个开源的个人化AI助手轻松连接本地与在线文档
Khoj是一个功能丰富、开源的个人化AI助手，旨在帮助用户管理和检索各种信息源，同时提供多种智能功能以提升工作效率。以下是Khoj的主要特点、功能及应用场景:主要特点多源信息获取:能够连接本地和在线文档，包括PDF、Markdown文件、GitHub仓库和Notion文件，整合在线和本地信息。
站长网2024-05-29 18:24:27
0000