SuperClue：百度文心一言总分超GPT-3.5-Turbo

站长网2023-07-26 09:59:250阅

中文通用大模型综合性基准SuperClue发布了最新中文大语言模型排行榜。榜单结果显示，百度文心一言总分超GPT-3.5-Turbo，领跑国内大模型。

此次SuperCLUE从基础能力、专业能力、中文特性能力三个维度70余项子能力，选取国内外20个有代表性的可用大模型进行测评，兼具综合能力考量与中文特定任务理解积累的考察，并通过自动化测评以相对客观形式进行效果测评。

评测基准中，基础能力包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色扮演、代码、生成与创作等10项能力;专业能力包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等50多项能力;中文特性能力包括了中文成语、诗歌、文学、字形等10项多种能力。

百度表示，文心一言v2.2.0版背后搭载的是文心大模型3.5，文心大模型自2019年3月发布1.0版后，现已升级到3.5版。新版本模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

SuperClue百度文心一言总分超GPT3 5 Turbo

0000

评论列表

共(0)条

相关推荐

站长资讯
阿里钉钉与华为达成合作启动“钉钉鸿蒙版”开发
11月23日消息，钉钉与华为举办鸿蒙原生应用开发启动仪式，双方将在产业创新、技术应用、商业发展等领域全面合作，并正式启动“钉钉鸿蒙版”的开发。鸿蒙最新数据显示，截至今年8月份，鸿蒙生态设备数已超过7亿，开发者突破220万人。目前，钉钉上有超过6亿用户、2300万企业组织。钉钉自2023年4月以来，通过接入大模型已完成17个产品线、60多个场景的AI改造，目前有50多万家企业在使用钉钉AI。
站长网2023-11-23 16:01:07
0000
站长资讯
苹果推送iOS 17.1.2正式版修复安全等问题
苹果公司今日发布公告，宣布推出iOS17.1.2更新，尽管此次更新仅为小幅升级，但苹果仍强烈要求所有符合条件的iPhone用户进行升级。根据说明，iOS17.1.2更新主要包含一个重要的安全修复。具体来说，这个更新解决了在iOS早期版本中可能被利用的一个漏洞。处理网页内容时可能会泄露敏感信息，导致任意代码被执行。
站长网2023-12-01 09:01:49
0000
站长资讯
6·18前淘宝店铺迎来大改版，所有商家都可以“抢”的流量
这一次的改版，可能给了所有商家站在同一起跑线的机会。针对所有店铺的新机细心的人已经发现，在商家店铺里出现了“作品”一栏，里面的两个子菜单收录了店铺商品的笔记、买家秀和卖家秀。这些短视频会出现在淘宝的“猜你喜欢”中，消费者观看后，点击发布者头像，会直接跳转到店铺的“作品”板块，即内容首页。如果仅从用户在搜索和浏览上的习惯看，这个改动很聪明。
站长网2023-05-22 20:14:29
0000
站长资讯
元象XVERSE多模态数字人上线
元象XVERSE宣布推出多模态数字人，其多模态数字人方案具有以下特点:形象逼真、能听会道、灵活生动和情智兼备。在形象逼真方面，元象通过自研的渲染引擎和制作模块，实现了高品质的皮肤渲染、逼真的头发和眼球效果，以及真实的布料光照。在能听会道方面，元象提供了语音识别、全双工语音交互和语音合成等一站式服务，实现了准确快速的语音识别和自然流畅的语音交互。
站长网2023-11-23 12:05:05
0002
站长资讯
小米澎湃 OS 小爱同学大模型上线“文章摘要”功能
小米澎湃OS宣布，小爱同学的大模型已经上线了“文章摘要”功能。这项功能具有系统级入口，支持多种应用，可以帮助用户节省阅读时间。如果用户需要阅读英文文章，这项功能还可以直接生成中文摘要，使得阅读过程更加迅速。用户只需要对小爱同学说出“总结这篇文章”，就可以触发这个功能。
站长网2023-11-23 08:49:43
0000