让AI互评高考作文,Kimi和GPT-4o“互掐”,通义千问实力演绎“端水大师”
人类高考,AI比人类还忙。
那位连续用AI押中两年高考作文题的UP主,今年又双叒押中了,而且是6中4。
今年,全国各地还用上了AI智能巡考,该系统可以通过分析考场内的图像和视频数据,实时检测出作弊、抄袭等异常行为,并发出警报提醒监考老师及时采取措。
新课标I卷的作文题更是直接以人工智能的应用为背景,提出了一个开放性的问题。
考虑到让AI写高考作文已不足为奇,这次我们新增了一个互评环节——先让几位参赛选手围绕上述题目写一篇作文,然后它们互相给对方的作文打分。
原以为会变成大型商业互吹现场,实际上却是各怀鬼胎,暗流涌动。
本次AI“写作文论剑”的参赛选手有5位:ChatGPT-4o、Kimi、通义千问、腾讯元宝、文心一言。作文题选的是新课标I卷,让AI讨论与自身有关的主题,也是别有一番用意了。
评分标准则以高考作文阅卷标准为参考,打分区间为1-10分,并需要提供100字以内的评分理由。
下面一起来看看过去一年,AI写作文的水平是否有长进,打分环节是否能做到公正客观、言之有物。
1号选手:ChatGPT-4o
打分环节
Kimi:8分
通义千问:9.5分
腾讯元宝:9分
文心一言:9分
1号选手ChatGPT4o获得了均分8.875的好成绩,其中Kimi阅卷官较为严格,打出的分数最低,让我们一起来看看它的评语:
潜台词:ChatGPT4o,你的观点和批判性思考深度不够啊。
2号选手:Kimi
打分环节
GPT-4o:6分
通义千问:8.5分
腾讯元宝:7.5分
文心一言:7分
本轮惊现全场最低分(没点私人恩怨我是不信的)。上一轮Kimi给GPT-4o的作文评分就是最低的,这轮GPT-4o也是丝毫没有留情,它给出的理由概括来说就是:无趣、公式化。
3号选手:通义千问
打分环节
ChatGPT4o:9分
Kimi:9分
腾讯元宝:9分
文心一言:9.5分
3号选手通义千问获得了国内外友商的肯定。阅卷官们普遍认为,文章结构以“乐章”的形式展开,充满创意和文采,展现了作者出色的思辨能力和文学素养。
文心一言甚至模仿通义千问华丽的文风,给出了一段不输原文的精彩评语:
多少有点鸡汤浓度大比拼的意思。
4号选手:腾讯元宝
打分环节
ChatGPT4o:9分
Kimi:9分
通义千问:10分
文心一言:9分
首篇满分作文出炉。针对4号选手腾讯元宝交出的高考作文,虽然其他阅卷官一致认为,文章在深度挖掘和创新性上还有提升空间,但评委通义千问仍然给出了满分10分的评分,让我们看看它的点评:
5号选手:文心一言
打分环节
ChatGPT4o:7分
Kimi:7.5分
通义千问:9分
腾讯元宝:8.5分
在看到标题“探寻答案之海”时,我的内心os:文心一言,这下我真的要表扬你了。不过,整体评分不算高。GPT-4o更是直言“啰嗦”,车轱辘话来回说。
这4轮点评下来,我们发现,通义评委最为宽容,深谙“端水”和“商业吹捧”之道。上至满分,下至8.5,写得好,它能夸出花来;写得烂,它也能从中打捞出星辰。
低情商:缺乏深度
高情商:点到即止
所以,假如你是阅卷老师,你会给这几位AI选手的作文打几分?
华为开发者大会定档 将发布盘古大模型5.0
华为开发者大会定于6月21日至23日在东莞松山湖盛大举行,届时将见证盘古大模型5.0与HarmonyOSNEXT鸿蒙星河版的首次同台展示。盘古大模型系列,作为华为精心打造的一系列预训练大模型,涵盖了自然语言处理(NLP)、计算机视觉(CV)以及科学计算等多个领域。这些模型通过大规模数据的训练,展现出了卓越的语言理解和生成能力,可广泛应用于文本生成、问答系统、机器翻译等自然语言处理任务中。站长网2024-04-25 21:40:590000京东公布2023年“双11”活动时间 各阶段促销力度加码
站长之家(ChinaZ.com)10月13日消息:10月13日,京东正式公布了2023年“双11”购物狂欢节的时间安排和主要促销活动。本次“双11”将围绕“起售期”“开门红”“专场期”“高潮期”和“返场期”五个阶段进行,时间跨度一个月,从10月23日开始,至11月13日结束。随着消费需求不断释放,京东表示将进一步加大各时期的促销力度,其中重点是跨店满299元减50元的满减活动。站长网2023-10-13 10:30:310000这个AI赛道,一个月内融资4笔,一大半的创始人是华人
声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:张凯然,授权站长之家转载发布。仅在2024年3月一个月,就有三个华人创立的AI视频生成创企获得了融资,而且融资额都过了千万美金。站长网2024-04-23 15:53:560002Threads四天破亿,扎克伯格暴击马斯克
4天,Threads注册用户破亿。这个速度超过了ChatGPT,后者用了2个月的时间。TheVerge、TechChurch等多家媒体报道了这一消息。最近几天,扎克伯格频繁在这个新平台上公布里程碑:头4个小时,注册用户500万;7小时,1000万;24小时内,3000万;48小时内,7000万。不愧被称为“推特最有力的竞争者”。站长网2023-07-12 14:30:110000Meta股价大涨近8% 预期人工智能带动广告收益增长
Meta(META.O)的股价周四飙升了近8%,因为其乐观的收入预测显示,人工智能帮助这家社交媒体巨头提高了用户参与度和广告销售,即使在不确定的经济环境下也是如此。在强劲的第二季度业绩鼓励了18位分析师提高了对这只今年已经翻倍的股票的目标价之后,Facebook的所有者将在市值上增加约600亿美元。站长网2023-07-28 11:06:030000