AI打败AI！谷歌科学家用GPT-4 击败AI防篡改系统

站长网2023-08-01 17:07:430阅

Google 科学家进行一项实验研究，他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。这项实验证明了聊天机器人作为研究助手的价值。

具体来说，谷歌 Deep Mind 的研究科学家 Nicholas Carlini在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中，探讨了如何通过指导 GPT-4设计攻击方法并撰写攻击原理的文本，以欺骗 AI-Guardian 的防御机制。AI-Guardian 是一种防御对模型的攻击的系统，旨在检测可能被篡改的图像以欺骗分类器。

GPT-4会发出用于调整图像的脚本（和解释）来欺骗分类器——例如，让它认为某人拿着枪的照片是某人拿着无害苹果的照片——而不会引发 AI-Guardian 的怀疑。AI-Guardian 旨在检测图像何时可能被操纵以欺骗分类器，而 GPT-4的任务是逃避该检测。

通过 GPT-4的帮助，攻击者能够成功地破解 AI-Guardian 的防御，使其从98% 的稳健性降低到仅8%。然而，AI-Guardian 的开发者指出，这种攻击方法可能在改进的版本中失效。

据了解，GPT-4作为研究助手的价值在于它能够快速生成代码，并且不会分心或疲劳，始终可用于完成指定的任务。然而，依赖 GPT-4并不完全解除人类合作者的责任，因为它仍然需要人类提供正确的提示并修复生成的代码中的错误。

虽然 GPT-4还存在一些限制，但随着大型语言模型的改进，它们将为计算机科学家提供更多时间来开展有趣的研究问题。

论文地址:https://arxiv.org/abs/2307.15008

AI打败AI谷歌科学家用GPT4 击败AI防篡改系统

0000

评论列表

共(0)条

相关推荐

站长资讯
爆火的AI陪伴玩具，到底行不行？
当电影《泰迪熊》成为现实，一只只会说话、能互动，甚至可以感知主人情绪的毛绒玩具，正在逐渐取代传统玩具，成为大人和小孩的新宠。近年来，AI成为各行各业最新的“流量密码”，品牌们纷纷为自家产品贴上AI标签，以换取更高的市场竞争力和关注度。
站长网2025-01-14 21:12:01
0000
美妆占领短剧，抖音淘宝必有一战
去年年初，喜欢看短剧的90后女生芊芊留意到，除了向用户收费，短剧同时在赚品牌们的钱:短剧中的品牌植入越来越多了。美妆护肤品牌，更成了短剧植入的常客。随着剧情推进，霸总的宠妻礼物是韩束红蛮腰礼盒，小姨送给初入职场的女主，第一份礼就是珀莱雅双抗精华，女主的设定成了丸美集团千金……韩束、丸美、珀莱雅、谷雨等越来越多国产美妆品牌开始试水短剧营销。
站长网站长资讯2024-03-14 14:20:34
0000
站长资讯
一年实现月销千万，谁在小红书“闷声赚钱”？
每个电商平台都有自己的气味。淘宝划时代地闯出了货架电商，建立起从搜索到下单的路径;抖音则依托短视频，基于用户兴趣去发现、找到你的潜在购物需求;快手则通过与老铁累积而成的信任，构建起一套信任社交，并转换为熟人圈经营之路。而小红书基于社区属性，在琳琅满目的双瀑布流“街区”中，“逛”出了属于自己的生活方式电商。
站长网2024-07-30 14:30:04
0000
站长资讯
人工智能根据大脑活动记录解码再现 Pink Floyd 歌曲片段
站长之家(ChinaZ.com)8月16日消息:科学家们通过窃听人脑的脑电波重建了平克·弗洛伊德(PinkFloyd)的歌曲《AnotherBrickintheWall》——这是第一次从大脑电活动记录中解码出一首可识别的歌曲。希望这样做最终可以帮助那些因中风或肌萎缩侧索硬化症而难以交流的患者恢复在自然语音中的音乐性。肌萎缩侧索硬化症是史蒂芬·霍金被诊断出患有的神经退行性疾病。
站长网2023-08-16 09:41:20
0000
站长资讯
生成式人工智能在动画市场的价值预计将达到约177亿美元
**划重点:**1.📈到2032年，生成式人工智能在动画市场的复合年增长率（CAGR）将达到35.7%，市值预计将达到177亿美元。2.💡生成式人工智能在动画领域的重要应用，包括背景生成、角色创作和动作合成，得到了动画工作室和特效公司的广泛采用。3.🌐随着全球市场的崛起，亚太地区成为生成式人工智能在动画领域显著增长的重要地区。
站长网2024-03-06 09:47:22
0000