vivo副总裁:AI大模型投入无上限,人才成本平均税后100万元
站长网2023-11-01 18:05:270阅
据界面新闻报道,vivo副总裁周围表示,vivo大模型现在每年20-30亿的投入成本,人才和设备各占一半,人才成本平均税后100万元。公司对大模型投入定义为高规格投入,目前没有设置上限。
在今日的vivo开发者大会上,vivo正式发布自研通用大模型矩阵蓝心大模型。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围介绍,5款自研大模型分别是:1B、7B、70B、130B、175B。蓝心大模型包含十亿、百亿、千亿三个参数量级,全面覆盖核心场景,模型能力行业领先。
其中,蓝心大模型7B是面向手机打造的端云两用模型,具备对话、知识问答、意图理解等能力。70B是面向云端服务的主力模型,具备角色扮演、知识问答、自然对话等能力,也能兼顾成本和性能。
0000
评论列表
共(0)条相关推荐
DeepMind提出语言模型训练新方法DiLoCo 通信量减少500倍
要点:DeepMind的研究团队提出了分布式低通信(DiLoCo)训练语言模型的方法,采用分布式优化算法,使语言模型在连接性较差的设备集群上训练,性能超过完全同步模型,通信开销减少500倍。DiLoCo借鉴联邦学习文献,采用一种变体的联邦平均(FedAvg)算法,结合动量优化器,通过将内部优化器替换为AdamW和外部优化器替换为NesterovMomentum,有效应对传统训练方法的挑战。站长网2023-11-28 15:56:000000谷歌研究团队宣布 AudioPaLM:一个能说能听的大型语言模型
大型语言模型(LLMs)近几个月一直备受关注。作为人工智能领域最重要的进展之一,这些模型正在改变人机交互的方式。随着各行各业纷纷采用这些模型,它们成为人工智能在全球蔓延的最佳例证。站长网2023-06-25 23:41:100001联发科发布AI处理器天玑8300 Redmi K70E 将全球首发
联发科在11月21日举行了天玑8300处理器的发布会。天玑8300采用了台积电第二代4nm制程,搭载了4个Cortex-A715性能核心和4个Cortex-A510能效核心的八核CPU,性能提升了20%,峰值功耗降低了30%。在游戏体验方面,天玑8300搭载了6核GPUMali-G615,并配备了新一代的“星速引擎”,能够实时进行资源调度,提供高帧稳帧、低功耗长续航的游戏体验。站长网2023-11-21 15:56:200001开源LLM部署框架FlexFlow:低延迟、高性能
FlexFlow是一个分布式深度学习框架,提供低延迟、高性能的LLM(LargeLanguageModel)模型服务。它通过使用推测性推理和树状并行解码技术,显著提高了LLM模型的服务速度。项目地址:https://github.com/flexflow/FlexFlow站长网2023-08-23 16:26:520001详解Sora,为什么是AGI的又一个里程碑时刻?
2024年伊始,OpenAI再向世界扔了一枚AI炸弹——视频生成模型Sora。一如一年前的ChatGPT,Sora被认为是AGI(通用人工智能)的又一个里程碑时刻。“Sora意味着AGI实现将从10年缩短到1年”,360董事长周鸿祎作出预判。站长网2024-02-19 14:15:050000