vivo开源蓝心大模型BlueLM-7B系列 后续还将开源13B以及多模态7B-vl模型
站长网2023-11-09 14:11:272阅
近日,vivo AI正式开源了BlueLM-7B 基础 (base) 模型和7B 对话 (chat) 模型,同时开源了支持32K 的长文本基础 (base) 模型和对话 (chat) 模型。

具体特性如下:
更大量的优质数据:高质量语料库进行训练,规模达到了2.6万亿 的 token 数,该语料库包含中文、英文以及少量日韩数据;
更优的效果:其中 BlueLM-7B-Chat 在 C-Eval 和 CMMLU 上均取得领先结果,对比同尺寸开源模型中具有较强的竞争力;
长文本支持:BlueLM-7B-Base-32K 和 BlueLM-7B-Chat-32K 均支持32K 长文本,在保持基础能力相当情况下,能够支持更长上下文理解;
协议说明:BlueLM 系列欢迎开发者进行学术研究和商业应用;
vivo表示,后续还将开源13B 模型和支持多模态的7B-vl 模型。
2023年11月1日,vivo开发者大会上,vivo正式发布vivo自研大模型矩阵“蓝心大模型”。蓝心大模型包含十亿、百亿、千亿等不同参数规模五款大模型,vivo自研操作系统OriginOS4将首发搭载,vivo称其大模型矩阵将全面开源。
开源地址:https://github.com/vivo-ai-lab/BlueLM
BlueLM蓝心大模型官网导航:https://top.aibase.com/tool/bluelmlanxindamoxing
0002
相关推荐
“3 天删了 5 万行代码后,我的 Web 程序活得更好了!”
站在一名技术工程师的角度来看,「一款完美的应用程序,并不是指所有功能一应俱全,已经没有什么新功能能够添加进来,而是指所有功能版块都非常重要且活跃度很高,已经没有什么可以删除了」。0000百度地图车道级地图数据全面开放合作
今日,百度地图宣布,自2024年5月1日起,百度地图面向高级辅助驾驶行业,全面开放合作车道级地图数据(简称LD地图)。百度地图LD轻图已覆盖全国360个地级市、360万公里的高速和城市道路,已完成相关车企的高级辅助驾驶验证和完全无人驾驶验证。基于LD地图全新发布的车道级导航产品也已上线百度地图APP。站长网2024-05-01 14:26:500000被误解的「中文版Sora」背后,字节跳动有哪些技术?
2024开年,OpenAI就在生成式AI领域扔下了重磅炸弹:Sora。这几年,视频生成领域的技术迭代持续加速,很多科技公司也公布了相关技术进展和落地成果。在此之前,Pika、Runway都曾推出过类似产品,但Sora放出的Demo,显然以一己之力抬高了视频生成领域的标准。在今后的这场竞争中,哪家公司将率先打造出超越Sora的产品,仍是未知数。站长网2024-03-13 18:16:290000欧盟要求Facebook、TikTok和谷歌开始标记AI内容,以打击深度造假
欧盟方面正致力于监管人工智能,并要求科技巨头帮助人们判断越来越多的假图像、视频和音频是否是由人工智能创建的。包括谷歌、Facebook和TikTok在内的主要科技公司必须在8月25日之前开始识别哪些图像、视频或音频包含深度造假,否则可能面临欧盟数百万美元的罚款。站长网2023-06-08 07:06:160001FastGen:在不降低LLM质量的情况下降低GPU内存成本
划重点:-⭐FastGen一种高效的技术,可以提高LLM的推理效率,而不会降低可见质量。-⭐FastGen轻量级模型分析和自适应键值缓存来实现。-⭐FastGen通过自适应的键值缓存构造来少生成推理过程中的GPU内存使用量。站长网2024-05-13 11:04:000000