微软开源“傻瓜式”类ChatGPT模型训练工具，提速省钱15倍

站长网2023-04-14 09:38:461阅

在利用 OpenAI 的 GPT-4为 Bing Chat、 Bing Image Creator、Microsoft365Copilot、Azure OpenAI Service 和 GitHub Copilot X 引入了类似 ChatGPT 的功能后。微软现又宣布推出 DeepSpeed-Chat，一种用于 RLHF 训练的低成本开源解决方案，基于微软开源的深度学习优化库DeepSpeed;声称即使是使用单个 GPU，任何人也都可以创建高质量的 ChatGPT 式模型。

该公司表示，尽管开源社区付出了巨大的努力，但目前仍缺乏一个支持端到端的基于人工反馈机制的强化学习（RLHF）的规模化系统，这使得训练强大的类 ChatGPT 模型十分困难。ChatGPT 模型的训练是基于 InstructGPT 论文中的 RLHF 方式，与常见的大语言模型的预训练和微调截然不同，使得现有深度学习系统在训练类 ChatGPT 模型时存在种种局限。因此，为了让 ChatGPT 类型的模型更容易被普通数据科学家和研究者使用，并使 RLHF 训练真正普及到 AI 社区，他们发布了 DeepSpeed-Chat。

DeepSpeed-Chat 具有以下三大核心功能:

简化 ChatGPT 类型模型的训练和强化推理体验:只需一个脚本即可实现多个训练步骤，包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤、甚至生成你自己的类 ChatGPT 模型。此外，还提供了一个易于使用的推理 API，用于用户在模型训练后测试对话式交互。

DeepSpeed-RLHF 模块:DeepSpeed-RLHF 复刻了 InstructGPT 论文中的训练模式，并确保包括 a）监督微调（SFT)，b) 奖励模型微调和 c) 基于人类反馈的强化学习(RLHF)在内的三个步骤与其一一对应。此外，还提供了数据抽象和混合功能，以支持用户使用多个不同来源的数据源进行训练。

DeepSpeed-RLHF 系统:其将 DeepSpeed 的训练（training engine）和推理能力(inference engine) 整合到一个统一的混合引擎(DeepSpeed Hybrid Engine or DeepSpeed-HE)中用于 RLHF 训练。DeepSpeed-HE 能够在 RLHF 中无缝地在推理和训练模式之间切换，使其能够利用来自 DeepSpeed-Inference 的各种优化，如张量并行计算和高性能 CUDA 算子进行语言生成，同时对训练部分还能从 ZeRO- 和 LoRA-based 内存优化策略中受益。DeepSpeed-HE 还能够自动在 RLHF 的不同阶段进行智能的内存管理和数据缓存。

文档内容指出，DeepSpeed Chat 与其他先进方案相比的优势在于:效率和经济性方面比现有系统快15倍以上，在 Azure 云上只需9小时即可训练一个 OPT-13B 模型，只需18小时既可训练 OPT-30B 模型，分别花费不到300美元和600美元。

在速度和可扩展性方面，即使是13B 的模型也可以在1.25小时内训练，庞大的175B 模型可以在不到一天的时间内使用64个 GPU 集群进行训练。在 RLHF 的可访问性和普及化方面，则可以在单个 GPU 上训练超过130亿参数的模型。此外还支持在相同的硬件上分别运行6.5B 和50B 的模型，实现高达7.5倍的提升。

尽管近期关于对ChatGPT 类大语言模型发展的反对和担忧之声不断，但微软似乎仍在全力推进其 AI 开发。对于微软的此次发布，前 Meta AI 专家 Elvis 也激动地表示，DeepSpeed Chat 提供了 Alpaca 和 Vicuna 等所缺少的、一个端到端的 RLHF 管道来训练类似 ChatGPT 的模型，解决的是成本和效率方面的挑战。这是 “微软令人印象深刻的开源努力...... 是一件大事”。

更多详情可查看官方文档:

https://github.com/microsoft/DeepSpeed/blob/master/blogs/deepspeed-chat/chinese/README.md

微软开源傻瓜式类ChatGPT模型训练工具提速省钱15倍

0001

评论列表

共(0)条

相关推荐

高通独占期结束！微软Win11回顾等AI功能扩展到Intel/AMD设备
快科技12月8日消息，微软面向Dev频道发布了Windows11系统的KB5048780更新，将Recall回顾等AI功能扩展至搭载AMD和Intel处理器的设备，结束高通骁龙芯片的独占期。Recall功能通过定时截屏并利用AI分析生成时间线，使用户能够快速检索特定内容，如几天前打开的文档等。
站长网站长资讯2024-12-09 09:48:03
0000
特斯拉FSD V13.2版发布：原生Al4输入实现点对点自动驾驶
特斯拉公司在自动驾驶技术领域取得了新的进展，其最新发布的FSD（全自动驾驶）V13.2版本在实测中展现了卓越的性能。这一版本被众多资深用户评价为特斯拉历史上最强大的FSD版本，其“点对点”自动驾驶能力标志着特斯拉在自动驾驶技术上的一大飞跃。
站长网站长资讯2024-12-02 12:04:44
0000
站长资讯
互联网医院医联推出AI医生medGPT 计划5月份发布
互联网医院医联Medlinker于今日正式发布国内首款大模型驱动的AI医生——medGPT，该产品目前已进入内部测试阶段，并计划于今年5月份正式发布。医联medGPT目前已经拥有近3000种疾病的首诊能力，覆盖80%以上的成年人疾病和90%以上的0-12岁儿科疾病。
站长网2023-05-12 20:31:20
0000
站长资讯
思科宣布推出用于 AI 超级计算机的 SiliconOne 系列网络芯片
站长之家(ChinaZ.com)6月21日消息:思科于周二推出了用于人工智能超级计算机的网络芯片，这将与博通（Broadcom）和Marvell的产品竞争。
站长网2023-06-21 16:57:53
0003
站长资讯
谷歌推数学几何模型Alpha Geometry 解题能力接近奥数金牌选手
谷歌推出了新的面向数学几何领域的模型AlphaGeometry，数学几何能力已接近人类奥林匹克金牌选手的水平。特别值得一提的是:它的训练是基于合成数据而不是现有的数据。它训练的方式很有特别:先初始生成了十亿个随机几何图形，并全面分析了每个图形中点和线的所有关系。AlphaGeometry找出了每个图形中所有的证明，并反向追溯出为得到这些证明所需添加的额外几何元素（如果有的话）。
站长网2024-01-18 14:39:42
0001