通义千问72B模型荣登大模型评测平台OpenCompass榜首

站长网2023-12-13 11:57:481阅

中国权威的大型模型评估平台OpenCompass最近更新其排名，通义千问72B模型以67.1的高分荣登榜首。

OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台，其评估范围涵盖学科、语言、知识、理解和推理五个维度，能够全面评估大型模型的能力。

在OpenCompass的中文数据集评测中，Qwen-72B基础大型模型和对话大型模型（Qwen-72B-Chat）分别占据了前两名，显著优于其他模型。

在12月初，阿里云宣布开源其拥有720亿参数的大型语言模型通义千问Qwen-72B。Qwen-72B在十个权威基准测评中创下了开源模型的最佳成绩，从而成为业界最强大的开源大型模型。其性能超越了开源的标杆模型Llama2-70B以及大部分商业的非开源模型，适合于企业级和科研级的高性能应用。

据了解，通义千问-72B可以处理最长为32k的文本输入，并且在长文本理解测试集LEval上的表现超过了ChatGPT-3.5-16k。

通义千问72B模型荣登大模型评测平台OpenCompass榜首

0001

评论列表

共(0)条

相关推荐

站长资讯
嘉楠科技Canaan开源通用大语言模型Toucan
近日，嘉楠科技（Canaan）发布了参数量为70亿的通用大语言模型Toucan-7B及INT4量化版本Toucan-7B-4bit。
站长网2023-08-31 08:45:34
0000
跟长辈沟通不了，年轻人选择和AI掏心窝子。
文章开头，世超来个暴论。预计不久后，越来越多的年轻人会成为电影《Her》里的主角，和AI当朋友，谈恋爱。当然原因并不是AI变强了，而是——当代年轻人正饱受沟通之苦。最近世超刷到个帖子说:ChatGPT这个本来提高工作效率的工具，现在被一堆年轻人当成了心理咨询师。平时大伙儿不敢问的，不敢说的，都要找和它唠唠。帖子非常火，18000点赞，2700条评论。
站长网站长资讯2024-12-24 09:15:41
0000
站长资讯
从零复现Llama3代码库爆火 Karpathy大神称赞作者是个有品的人
最近，一个教你从头开始实现Llama3的代码库在网上爆火，吸引了无数开发者的关注。知名AI专家AndrejKarpathy一键三连（点赞、转发、评论），这个项目在社交媒体X上的转赞收藏量超过6.8k，GitHub上更是收获了超过2k的星标。
站长网2024-05-22 00:48:49
0000
站长资讯
选好出海目的地，开发者就成功了一半
来自中国的移动应用，正在全球新兴市场“攻城略地”。随着智能手机的兴起和移动通信网络的发展，移动应用已经成为全球用户必不可少的生活娱乐工具。尤其在新兴市场，这种表现更为明显。而近年来，随着国内移动应用的用户增量明显放缓，中国企业开发的移动应用也加快了出海步伐，这其中不乏Temu、《GarenaFreeFire》等优秀移动应用成为海外市场的KILLERAPP（杀手级应用）。
站长网2023-11-14 17:53:11
0000
站长资讯
小红书带货二姐|GMV500万+的背后是什么
你敢信吗，从3月31日到5月22日，短短2个月时间不到，小红书已经培育了2位直播大佬，董洁和章小蕙分别登场小红书直播带货，吸引了大批用户的疯狂购买，同时也带动了小众品牌以及高单价产品在小红书销量增长。章小蕙的直播首秀让平台带货热度达到了6亿，冲向销量榜一，而董洁则在连续8小时的高强度直播中傲视榜单，两位女性分别交出了令人瞩目的带货成绩，为小红书直播电商创造了迄今为止最好的成绩。—1—
站长网2023-05-29 13:51:14
0000