元象开源多语言大模型XVERSE-13B 可免费商用

站长网2023-08-07 09:37:450阅

元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B，可免费商用。

据介绍，XVERSE-13B 是由深圳元象科技自主研发的支持多语言的大语言模型（Large Language Model），基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。

主要特点如下:

模型结构:XVERSE-13B 使用主流 Decoder-only 的标准 Transformer 网络结构，支持8K 的上下文长度（Context Length），为同尺寸模型中最长，能满足更长的多轮对话、知识问答与摘要等需求，模型应用场景更广泛。

训练数据:构建了1.4万亿 token 的高质量、多样化的数据对模型进行充分训练，包含中、英、俄、西等40多种语言，通过精细化设置不同类型数据的采样比例，使得中英两种语言表现优异，也能兼顾其他语言效果。

分词:基于 BPE（Byte-Pair Encoding）算法，使用上百 GB 语料训练了一个词表大小为100，278的分词器，能够同时支持多语言，而无需额外扩展词表。

训练框架:经过对算子、通信、并行策略及调度等的优化，千卡集群上的峰值算力利用率达到58.5%，达到业界前列。

项目地址：https://github.com/xverse-ai/XVERSE-13B

元象开源多语言大模型XVERSE13B可免费商用

0000

评论列表

共(0)条

相关推荐

站长资讯
隐私浏览器Brave发布“匿名且安全”AI聊天机器人Leo 承诺不用户数据训练AI
划重点:-Brave推出Leo，声称提供无比安全的聊天机器人服务。-Leo可免费用于Brave桌面用户，计划未来几个月内在Android和iOS上推出。-Brave强调Leo的隐私保护，与其他聊天机器人相比，对话不被记录或用于训练AI模型，无需登录信息。隐私导向的浏览器Brave最近推出了名为Leo的本地AI助手，该公司声称相比其他AI聊天机器人服务，Leo提供了“无与伦比的隐私”。
站长网2023-11-03 10:32:23
0000
站长资讯
店群再见！小红书清退无货源电商
今天标题中提到了“店群”和“无货源”两个新词，对于博主们来说可能稍微有点陌生，但对于一些做电商的朋友，那是熟到家了。“无货源”你可能没听过，但是一件代发，可能就不陌生了，举个简单的例子更容易理解，你在小红书上开个店，自己没货还不想囤货咋办呢?
站长网2023-08-31 09:12:42
0000
站长资讯
GitHub Copilot主创离职创业，抱怨项目奖金仅2万刀，自立门户打造日常生活AI助手
官网已开启排队申请GitHubCopilot彻底改变了编程，背后的最大功臣获得了多少报酬呢?从开始到最终正式发布，只有2万美元奖金和一个头衔提升。他是AlexGraveley，Copilot团队的首席工程师和主架构师。更离谱的是，他不光没有得到应得的报酬，上头的副总裁后来还对他说“你不配得到晋升”。钱没给到位，委屈也受了。Alex老哥干脆离职，自己创业。
站长网2023-07-15 16:26:33
0001
站长资讯
微软发布AI工具 Recall，帮助你找到那些找不到的文件
划重点:🔍Microsoft推出RecallAI，为你的电脑提供了“照片记忆”功能。🔍只有CopilotPC系列才能使用这一功能，目前限定在特定型号电脑上。🔍RecallAI允许用户使用语音查询文件、网站或电子邮件，并通过AI进行索引和搜索。
站长网2024-05-22 01:00:49
0000
站长资讯
全面开放UGC入口，支付宝内容化想好了吗？
支付宝在内容化这条路上又向前一步。在众多“超级APP”如美团、微信等纷纷引入短视频和直播带货，投向内容化的当下，作为支付工具的支付宝也没有落下。11月7日，支付宝生活号宣布开放UGC入口，现在支持个人用户发布内容和参与话题。
站长网2023-11-22 17:50:53
0000