天津大学大模型评测报告：GPT-4和百度文心一言显著领先

站长网2023-08-15 08:42:201阅

8月12日，天津大学和信创海河实验室举办了一次大模型技术与评测研讨会，会上发布了首份大模型评测报告。

该报告对国内外14个大语言模型进行了中文综合能力评测，结果显示，GPT-4和百度文心一言相对于其他模型综合性能领先。

在此次评测中，GPT-4对参评模型的主观题回答进行了打分，结果显示，GPT-4认为文心一言生成的中文内容质量更高。相比人工评价，在基于 GPT-4的自动评测中，文心一言的总得分超过了 GPT-4，位居榜首。

天津大学表示，大模型有望重塑人工智能的发展模式，国产大模型正在迎头赶上国际类似模型，并在某些指标上实现了超越。百度文心一言在评测中展现了强大的实力，具备了在相关行业落地的技术基础。

百度表示，百度在大模型生态的构建上具备先发优势，目前已经有15万家企业申请接入文心一言测试。

天津大学大模型评测报告GPT4和百度文心一言显著领先

0001

评论列表

共(0)条

相关推荐

站长资讯
OpenAI泄密者，投奔马斯克
刚被OpenAI开除的泄密者，光速投奔马斯克。当事人PavelIzmailov（以下简称小P），正是Ilya盟友之一，在Ilya领导的超级对齐团队干过。半个月前，小P被指疑似泄露Q*相关机密而被开除。虽然不清楚他泄密了个啥，但当时闹得沸沸扬扬。说时迟那时快，现在，他的推特个人简介上，已经大张旗鼓写着:研究员@xai要不说老马招人下手快呢，除了小P，不少优秀人才近期都被马斯克揽入麾下。
站长网2024-05-07 17:41:27
0000
站长资讯
马斯克称有必要开展AI业务抗衡微软谷歌
马斯克在伦敦参加《华尔街日报》CEO理事会峰会时表示，他认为开展AI业务与谷歌和微软竞争是必要的。他还暗示，推特可能会成为他创建AI业务的一部分。马斯克表示，特斯拉一直在使用AI技术来改善其先进的辅助驾驶功能。马斯克提出，推特和特斯拉可以携手成为一家AI公司的合作伙伴，类似于微软和OpenAI的关系。据悉，马斯克已经创建了一家名为X.AI的AI公司。
站长网2023-05-24 14:01:40
0000
站长资讯
AIGC生成图像加速度，百亿赛道将开启
随着AIGC爆火，消沉已久的美图踩上AIGC的风口意外刷爆了存在感，业务增量也有了新的看头。2018-2021年间，美图分别亏损12.55亿元、3.97亿元、0.4亿元、0.44亿元，业绩状况一直处于红灯状态。
站长网2023-04-23 17:04:29
0000
站长资讯
AI原型“Make It Real”震惊开发者，将草图转化为可运行软件
##划重点:1.🚀**创新功能:**协作白板应用"tldraw"发布了名为"MakeItReal"的功能原型，利用AI将用户绘制的软件图像转化为可运行的代码，使用了OpenAI的GPT-4VAPI。2.🎨**功能展示:**设计师们通过该功能绘制了旋转屏幕上物体的滑块、更改物体颜色的界面，以及井字棋游戏等，展示了其强大的功能。
站长网2023-11-17 15:13:23
0001
站长资讯
魅族21系列5款机型曝光最低1599元起
魅族公司于10月4日最新曝光了5款新机型号，包括魅族21和魅族21Pro两款。其中3款为国行系列，2款尚未确认其是否为海外版本或其他型号。据此前消息，“数码闲聊站”透露，魅族21系列将采用高通最新移动平台骁龙8Gen3，并延续前代的极简设计。预计该系列将搭配直屏设计，而Pro版本有望首次采用潜望式长焦摄像头。
站长网2023-10-04 15:39:45
0000