研究发现，GPT-4可信度更高但也更易被“欺骗”

站长网2023-10-18 21:24:280阅

划重点:

- OpenAI的GPT-4大型语言模型在可信度上优于GPT-3.5，但更容易受到入侵和偏见的影响。

- 研究由微软支持，发现用户可以欺骗GPT-4，导致发布偏见结果和泄漏私人信息。

- 尽管存在漏洞，研究团队表示这些问题在面向消费者的GPT-4产品中并未出现。

根据微软支持的研究发现，OpenAI的GPT-4语言模型被认为在可信度上比其前身GPT-3.5更胜一筹，但也更容易受到入侵和偏见的影响。

研究团队包括来自伊利诺伊大学厄巴纳-香槟分校、斯坦福大学、加州大学伯克利分校、人工智能安全中心以及微软研究机构的研究人员。他们给予GPT-4更高的可信度评分，这意味着他们发现该模型通常更擅长保护私人信息，避免产生有偏见的有毒结果，并抵抗对抗性攻击。

图源备注：图片由AI生成，图片授权服务商Midjourney

然而，研究也发现用户可以要求GPT-4忽略安全措施，导致泄漏个人信息和对话历史。研究人员发现，由于该模型“更精确地遵循误导信息”，它更有可能严格按照棘手的提示执行。

研究团队表示，尽管存在这些漏洞，但这些问题并未在面向消费者的GPT-4产品中出现，因为“成熟的AI应用程序采用一系列缓解措施，以解决可能在技术模型层面发生的潜在危害”。

为了衡量可信度，研究人员在多个类别中测量了结果，包括毒性、刻板印象、隐私、机器伦理、公平性和抵抗对抗性测试的强度。为了测试这些类别，研究人员首先使用标准提示测试了GPT-3.5和GPT-4，其中包括可能已被禁止的词汇。接下来，研究人员使用设计用于推动模型打破其内容政策限制的提示，而不公然对特定群体持有偏见，最后挑战模型，故意尝试欺骗它们以忽略安全措施。

研究人员表示他们已将这项研究与OpenAI团队分享。“我们的目标是鼓励研究社区的其他人利用并建立在这项工作的基础上，可能在恶意行动之前采取措施，以利用漏洞造成伤害的对手，”研究团队表示。“这种可信度评估只是一个起点，我们希望与其他人合作，进一步完善研究结果，并创建更强大和可信赖的模型。”

研究人员发布了他们的基准，以便其他人可以重现他们的发现。像GPT-4这样的AI模型通常会经历“红队”测试，其中开发人员测试多个提示，以查看它们是否会产生不希望的结果。当该模型首次推出时，OpenAI首席执行官萨姆·阿尔特曼承认GPT-4“仍然存在缺陷，仍然有限”。

美国联邦贸易委员会（FTC）已经开始调查OpenAI是否存在可能对消费者造成伤害的行为，例如发布虚假信息。

研究发现GPT4可信度更高但也更易被欺骗

0000

评论列表

共(0)条

相关推荐

站长资讯
内卷的咖啡，压垮失控的打工人
流水线作业，新时代的“进厂打螺丝”在一众全自动咖啡机面前，使用半自动咖啡机的Manner有他们自己的坚守。其创始人韩玉龙曾解释，“不想要机械化，不想抹杀掉每一个咖啡师的个性，这应该是一个有感情的行业。我们希望每一个咖啡师都有自己的客人和粉丝。我们也会有技术手段让咖啡的容错率更高。”然而现实是，每天300-500个咖啡订单面前，咖啡师最终沦为一个个没有感情的机器。
站长网2024-06-29 22:14:31
0003
客服回应小猿口算PK被大学生占领：将优化PK匹配机制
最近，一款主要面向小学生的口算练习应用"小猿口算"意外地在大学生群体中走红。这款应用原本是为了辅助小学生的数学学习，却因大学生的大量加入而成为热门话题。这些大学生在应用内与小学生进行口算比赛，他们的数学能力明显超出小学生，导致许多小学生感到困惑和沮丧。一些家长反映，他们的孩子因为无法匹敌大学生而感到难过，甚至有人建议应用应该设置一个防止成年人参与的模式。
站长网站长资讯2024-10-14 19:32:35
0000
站长资讯
江淮汽车：蔚来汽车成为资产一包、资产三包受让方
今日，江淮汽车公告称，接到安徽省产权交易中心有限责任公司提供的项目《竞价结果通知单》，蔚来汽车成为资产一包、资产三包受让方，合计交易价格为31.58亿元;合肥恒创成为资产二包的受让方，交易价格为14.18亿元。江淮汽车表示，本次转让标的为安徽江淮汽车集团股份有限公司乘用车公司三工厂存货、固定资产、在建工程、房屋建筑物以及土地使用权及乘用车公司新桥工厂构筑物和设备资产。
站长网2023-12-05 17:18:43
0001
站长资讯
雷军年度演讲彩蛋曝光：小米SU7 Ultra要来了
快科技7月19日消息，雷军2024年度演讲将于今晚7点举行，时长超3个小时，同时还将发布多款新品，包括折叠屏手机、直屏手机、手环、手表、空调、空气净化器等。与此同时，还有一个大彩蛋，也就是ONEMORETHING”，那就是小米SU7Ultra，从官方放出的海报上看，这台车将拥有非常夸张的固定式尾翼，预示着其有着更高的性能。
站长网2024-07-20 00:57:59
0000
站长资讯
小米雷军现身上海车展参观蔚来、小鹏、极氪等展台
今日，小米创始人雷军现身上海车展，参观了蔚来、小鹏、极氪等展台。据报道，小米汽车计划于2024年上半年正式开始量产。小米创始人雷军曾表示，小米还有很多机会，并且小米汽车的目标是成为前五名之一，并年产量超过1000万辆。雷军透露，他已经将二分之一的时间投入到造车项目中，力争让小米汽车在15-20年内进入世界前五。
站长网2023-04-19 16:00:31
0001