商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4
快科技6月21日消息,在AI大模型领域,OpenAI的ChatGPT成为当前最火的大模型,也是标杆性的,多个国产大模型都要对标它,今天商汤科技公布了自己的大模型测试结果,三个测试项目中都超越了ChatGPT。
商汤科技自研中文语言大模型名为商量SenseChat 2.0”,日前公布的测试显示,MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。
根据评测结果,商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT,部分已十分接近GPT4的水平,实现了我国语言大模型研究的重要突破。
这三个测试分别如下:
由美国加州大学伯克利分校等高校构建的多任务考试评测集MMLU;
微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等);
由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval;
在MMLU测试中,商量SenseChat 2.0”综合得分为68.6,远超GLM-130B(45.7分)的得分,同时还超过了ChatGPT(67.3分)、LLaMA-65B(63.5分)仅落后GPT-4(86.4分),位居第二。
在AGIEval测试中,商量SenseChat 2.0”测出49.91的分数,遥遥领先GLM-130B(34.2分)、LLaMMA-65B(34.0分),并再次超越ChatGPT(42.9分),仅次于GPT-4的56.4分。
在其中的AGIEval(GK)评测子集中,商量SenseChat 2.0”以58.5分全面领先,仅微弱差距落后GPT-4(58.8分)。
在C-Eval测试中,商量SenseChat 2.0”拿到了66.1的分数,在参评的18个大模型中,仅次于GPT-4(68.7分),全面领先ChatGPT、Claude、Bloom、GLM-130B、LLaMA-65B等一众海内外大模型。
截至目前,已有近千家企业客户通过申请,应用和体验商量SenseChat 2.0”超强的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力,并且商量SenseChat 2.0”还在服务客户过程中,持续实现着快速迭代和提升,以及知识的实时更新。
高通和微软合作构建 Snapdragon 计算平台上的生成式人工智能
在MicrosoftBuild2023活动中,高通技术公司展示了其在设备上人工智能方面的最新创新,包括在Snapdragon计算平台上运行生成式人工智能,并为在搭载Snapdragon的Windows11PC上构建应用程序的开发者提供新的路径。站长网2023-05-24 15:55:580000李彦宏:百度文心大模型3.5版推理速度提升17倍
今天上午,在世界互联网大会数字文明尼山对话中,百度创始人、董事长兼首席执行官李彦宏表示,大模型在数字世界中的重要性不容忽视。他指出,新的国际竞争战略的关键不在于一个国家有多少个大模型,而在于这些大模型上有多少原生的AI应用,以及这些应用在多大程度上提高了生产效率。如果我们能进入这个竞赛,中国将拥有更加强大的数字化产业,数字经济规模将会获得巨大增长。站长网2023-06-27 16:03:5700002023年11月中国手游发行商全球收入排行榜:腾讯位居第一
划重点:1.🚀37家中国手游发行商进入全球TOP100,总收入18.7亿美元,占比38.3%。2.📈全球手游市场在2023年下半年呈现同比增长,11月录得317亿美元收入,为行业回暖预示。3.🌐发行商悠星网络、点点互动、心动网络等因独特游戏表现在榜单中崭露头角。站长网2023-12-07 11:12:070000抖音、瑞幸宣布启动鸿蒙相关岗位招聘
站长之家(ChinaZ.com)11月27日消息:近日,抖音与瑞幸咖啡宣布已经启动鸿蒙相关职位的招聘,为推动技术创新和发展迎来新一波高端人才。站长网2023-11-27 10:48:320002软银正在洽谈收购受益 AI 概念上涨的 VF1 持有的 Arm 25% 股份
站长之家(ChinaZ.com)8月14日消息:据知情人士透露,软银集团正在与愿景基金1号(VF1)就收购Arm有限公司未直接拥有的25%股份进行谈判。愿景基金1号是2017年筹集的1000亿美元投资基金。此举可能会给等待多年的投资者带来丰厚的回报。站长网2023-08-14 10:35:030000