登陆注册
7590

天津大学大模型评测报告:GPT-4和百度文心一言显著领先

站长网2023-08-15 08:42:201

8月12日,天津大学和信创海河实验室举办了一次大模型技术与评测研讨会,会上发布了首份大模型评测报告。

该报告对国内外14个大语言模型进行了中文综合能力评测,结果显示,GPT-4和百度文心一言相对于其他模型综合性能领先。

在此次评测中,GPT-4对参评模型的主观题回答进行了打分,结果显示,GPT-4认为文心一言生成的中文内容质量更高。相比人工评价,在基于 GPT-4的自动评测中,文心一言的总得分超过了 GPT-4,位居榜首。

天津大学表示,大模型有望重塑人工智能的发展模式,国产大模型正在迎头赶上国际类似模型,并在某些指标上实现了超越。百度文心一言在评测中展现了强大的实力,具备了在相关行业落地的技术基础。

百度表示,百度在大模型生态的构建上具备先发优势,目前已经有15万家企业申请接入文心一言测试。

0001
评论列表
共(0)条