登陆注册
714

OpenAssistant发布其开源ChatGPT竞争对手

站长网2023-04-17 09:58:221

在 OpenAI 发布之后 ChatGPT,去年12月份开源项目 OpenAssistant 也发布了其第一个模型、训练数据和代码,功能类似于 OpenAI 的 ChatGPT。

为什么重要:

人工智能研究的民主化,特别是在大规模语言模型及其对齐领域,仅限于少数具有训练和收集数据资源的研究实验室。OpenAssistant 发布模型和数据旨在使这项研究民主化,并提供包容性和多样化的研究工作。

根据一项与志愿者的比较研究,OpenAssistant 的模型接近 ChatGPT 的 gpt-3.5-turbo 模型生成的结果。

该项目试图反对 OpenAI 使自己的语言模型和数据来源的开发变得越来越不透明,并与一小群选定的专家研究的方法。

评析:

OpenAssistant 旨在创建一个开源 AI 助手,其功能与 OpenAI 的 ChatGPT 相同。在13,500多名志愿者的帮助下,花了数月时间收集了“人工生成、人工注释的助理式对话语料库”。收集到的数据用于改进多种语言模型,包括 Meta 的 LLaMA 模型和 EleutherAI 的 Pyhtia 模型的变体。

最大的变体基于具有300亿个参数的 LLaMA 模型。Pythia 模型已经可用,LLaMA 模型将很快发布。

该团队还采取措施检测并删除数据集中的有害消息,但并非万无一失。

OpenAssistant 的模型表现出“幻觉”等大型语言模型普遍存在的问题,并且收集的训练数据主要由男性贡献,年龄中位数为26岁。

0001
评论列表
共(0)条