12086

vivo副总裁：AI大模型投入无上限，人才成本平均税后100万元

站长网2023-11-01 18:05:270阅

据界面新闻报道，vivo副总裁周围表示，vivo大模型现在每年20-30亿的投入成本，人才和设备各占一半，人才成本平均税后100万元。公司对大模型投入定义为高规格投入，目前没有设置上限。

在今日的vivo开发者大会上，vivo正式发布自研通用大模型矩阵蓝心大模型。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围介绍，5款自研大模型分别是:1B、7B、70B、130B、175B。蓝心大模型包含十亿、百亿、千亿三个参数量级，全面覆盖核心场景，模型能力行业领先。

其中，蓝心大模型7B是面向手机打造的端云两用模型，具备对话、知识问答、意图理解等能力。70B是面向云端服务的主力模型，具备角色扮演、知识问答、自然对话等能力，也能兼顾成本和性能。

vivo副总裁AI大模型投入无上限人才成本平均税后100万元

0000

评论列表

共(0)条

相关推荐

站长资讯
DeepMind提出语言模型训练新方法DiLoCo 通信量减少500倍
要点:DeepMind的研究团队提出了分布式低通信（DiLoCo）训练语言模型的方法，采用分布式优化算法，使语言模型在连接性较差的设备集群上训练，性能超过完全同步模型，通信开销减少500倍。DiLoCo借鉴联邦学习文献，采用一种变体的联邦平均（FedAvg）算法，结合动量优化器，通过将内部优化器替换为AdamW和外部优化器替换为NesterovMomentum，有效应对传统训练方法的挑战。
站长网2023-11-28 15:56:00
0000
站长资讯
谷歌研究团队宣布 AudioPaLM：一个能说能听的大型语言模型
大型语言模型（LLMs）近几个月一直备受关注。作为人工智能领域最重要的进展之一，这些模型正在改变人机交互的方式。随着各行各业纷纷采用这些模型，它们成为人工智能在全球蔓延的最佳例证。
站长网2023-06-25 23:41:10
0001
站长资讯
联发科发布AI处理器天玑8300 Redmi K70E 将全球首发
联发科在11月21日举行了天玑8300处理器的发布会。天玑8300采用了台积电第二代4nm制程，搭载了4个Cortex-A715性能核心和4个Cortex-A510能效核心的八核CPU，性能提升了20%，峰值功耗降低了30%。在游戏体验方面，天玑8300搭载了6核GPUMali-G615，并配备了新一代的“星速引擎”，能够实时进行资源调度，提供高帧稳帧、低功耗长续航的游戏体验。
站长网2023-11-21 15:56:20
0001
站长资讯
开源LLM部署框架FlexFlow：低延迟、高性能
FlexFlow是一个分布式深度学习框架，提供低延迟、高性能的LLM（LargeLanguageModel）模型服务。它通过使用推测性推理和树状并行解码技术，显著提高了LLM模型的服务速度。项目地址:https://github.com/flexflow/FlexFlow
站长网2023-08-23 16:26:52
0001
站长资讯
详解Sora，为什么是AGI的又一个里程碑时刻？
2024年伊始，OpenAI再向世界扔了一枚AI炸弹——视频生成模型Sora。一如一年前的ChatGPT，Sora被认为是AGI（通用人工智能）的又一个里程碑时刻。“Sora意味着AGI实现将从10年缩短到1年”，360董事长周鸿祎作出预判。
站长网2024-02-19 14:15:05
0000