GPT-4懒癌爆发!代码比较任务中完成率降低近1/4
划重点:
1. 😟 网友实测发现,GPT-4在代码比较任务中表现下滑,完成率降低了近四分之一。
2. 🔄 有网友指出,新版本的ChatGPT回复虽然长度增加,但很多内容都是车轱辘话,干正事仍然摆烂。
3. 💡 尽管奥特曼表示GPT-4在新的一年应该改进,但网友对其变懒的原因及采用的优化策略仍感困惑。
近期,GPT-4的“懒惰”现象再度成为热议话题。网友们通过实际测试发现,GPT-4在代码比较任务中的表现下降显著,完成率降低了近四分之一。一些用户反馈称,完成度不仅不高,而且生成的文本还会被分割成小块,使用时需要逐一复制,给用户带来不便。
尽管有博主表示在尝试给一年级孩子做学习用的小游戏时效果不错,但仍有人质疑ChatGPT的实际应用价值。有网友指出,尽管回复长度增加,但很多内容都是车轱辘话,干正事依旧摆烂。有用户甚至让ChatGPT进行文本翻译测试,结果却叽里呱啦说了一堆却不翻译。
针对这一发现,有人使用GitHub上开源的“lazy benchmark”对比了GPT-4的新旧版本,结果显示新版的完成率较旧版降低了近四分之一。具体而言,在代码比较任务中,旧版能完成的比例为57%,而新版仅为44%。
对于GPT-4变懒的原因,奥特曼并未做进一步说明,仅表示新的一年应该有所改进。之前的研究表明,GPT-4的惰性可能与时间相关,但这并不能完全解释表现不升反降的现象。
不过,网友们总结了一些“土办法”以降低ChatGPT的惰性。例如,告诉它“我没有手指”就能得到相对完整的代码,而不是一段段碎片。另外,告诉ChatGPT自己会“给小费”也能激发其工作动力,其中10美元的小费金额被发现是最能提高性价比的。
GPT-4的“懒惰”问题引起了广泛关注。虽然奥特曼表态在新的一年应该有所改进,但网友们仍对其实际表现及优化策略感到困扰。这一现象或许会在新年伊始有所缓解,但具体的改进措施仍有待进一步揭示。
阿里巴巴普惠体推出三款全新字体 永久免费支持正版商用
近日,阿里巴巴普惠体(alibabafonts.com/#/more)推出了三款全新的字体,分别是阿里妈妈方圆体、阿里妈妈灵动体和阿里妈妈刀隶体,全部永久免费支持正版商用。阿里妈妈方圆体是一款双轴可变字体,包括简体中文、英文大小写以及常用标点符号等共计7042个字符。这款字体通过智能AI的方式完成,为商家和用户提供了更多的选择和多样化的视觉体验。站长网2023-07-05 19:13:340002一场10分钟的灯光秀耗电量434千瓦时,1430平方米的光伏板日发电量约482千瓦时!光伏零碳灯光秀落地未来科技城
来源:【看余杭】以光影为笔,以楼宇作轴,五彩斑斓的灯光相互交织,组成流光溢彩的图案和文字,好似把天上的银河搬到了人间。如此大规模的灯光秀背后,到底耗费了多少电能?以某城市中央商务区的灯光秀为例,43栋楼宇环型U屏约有118万个点光源,集体点亮总功率约3725千瓦,按照能发挥70%的能效来算,平均运行功率约2607千瓦,一场灯光秀时长10分钟,每场表演需耗电量434千瓦时。0001人工智能写作助手Flot.ai:使用最新GPT-4 模型 支持200多种语言
Flot.ai是一款人工智能写作助手,能够帮助用户在任何应用或网站上获得AI的帮助,无需复制粘贴就可以使用ChatGPT。Flot.ai使用OpenAI最新的GPT-4模型,支持200多种语言,真正做到一键使用AI。体验地址:https://flot.ai/站长网2023-09-11 18:01:100000智能手机厂商依赖人工智能和 5G 整合寻求新的增长机会
据Canalys报告,消费者需求不振是智能手机行业面临的最大挑战,导致全球智能手机出货量在2022年跌至12亿部以下。这一现象的原因包括宏观经济的影响和新款手机更新幅度较小导致消费者决定继续使用旧手机,从而延长智能手机的换机周期。站长网2023-04-12 20:59:450001研究人员发现ChatGPT生成代码大部分不安全 但它不会主动告诉你
加拿大魁北克大学的四名研究人员近日发现,聊天机器人ChatGPT能生成C、C、Python和Java等各种编程语言代码,但该机器人生成的代码存在严重的安全漏洞,而且不会主动提醒用户。研究人员在一篇论文中介绍了他们的发现。论文中,研究人员让ChatGPT生成了21个程序和脚本,结果发现,在第一次尝试时,ChatGPT只有5个程序是安全的。站长网2023-04-23 10:27:570001