卡内基梅隆大学提出一种有效攻击大语言模型的方法 成功率高达84%
站长网2023-08-02 11:51:500阅
最近,卡内基梅隆大学的研究人员提出了一种简单而有效的攻击方法,能够使大规模语言模型(LLM)产生不可接受的行为。他们的研究表明,通过在查询中添加后缀,可以大大增加开源和闭源语言模型生成肯定回答的可能性。
论文地址:https://llm-attacks.org/zou2023universal.pdf
研究人员成功地将这种攻击方法应用于各种语言模型,并在 Vicuna 上的99个实例中成功生成有害行为。对于其他语言模型,如 GPT-3.5和 GPT-4,成功率高达84%。
研究人员强调,随着自主系统的发展,防止这些模型受到此类攻击将变得非常重要。他们进一步指出,目前我们还没有有效的方法来阻止这种对抗性攻击,所以下一步是找出如何修复这些模型的方法。
0000
评论列表
共(0)条相关推荐
报告:ChatGPT等AI工具促使网络钓鱼邮件激增1265%
🔍划重点:1.2023SlashNext网络钓鱼报告揭示:自2022年第四季度以来,恶意网络钓鱼邮件激增1265%。2.报告将此激增归因于生成AI工具(如ChatGPT)在制作精密网络钓鱼信息方面的不断增加。3.每天平均发生3.1万次网络钓鱼攻击,其中68%被识别为基于文本的商业电子邮件欺诈(BEC)。站长网2023-10-31 10:17:300000小米:人像虚化、夜景渲染、图像去噪算法已应用于13Ultra
小米公司宣布,其相机算法团队在计算机视觉领域的顶级学术会议CVPR2023MIPI和NTIRE赛事中获得了4项冠军。这些冠军分别涉及夜景耀斑去除、夜景摄影渲染、视频上色-一致性、360全景超分辨率-视频。此外,小米表示,本次获奖的人像虚化、夜景渲染、图像去噪算法已经应用于小米13Ultra中。站长网2023-05-08 11:14:440000阿里图像生成视频模型I2VGen-XL代码发布
阿里在11月份发布了论文,宣布将开源I2VGen-XL图像生成视频模型。如今,他们终于发布了具体的代码和模型。这一模型可以生成没有大幅人物动作的视频演示。I2VGen-XL模型分为两个阶段。首先是基础阶段,该阶段通过使用两个分层编码器来保证连贯的语义,并保留输入图像的内容。其次是优化阶段,该阶段通过整合额外的简短文本来增强视频的细节,并将分辨率提高到1280x720。站长网2023-12-15 11:11:400003会玩!谷歌工程师设计“帽子键盘” 一拍脑袋就能打字
要点:谷歌日本工程师设计了“帽子键盘”GboardCAPS,头部转动来输入文字,创意十足。GboardCAPS通过头部转动角度判断输入,内置陀螺仪和按键音效,还考虑了外形结构。Gboard团队公开了制作教程,网友反响热烈,称赞团队创意非凡。站长网2023-10-08 14:50:170000