研究发现,GPT-4可信度更高但也更易被“欺骗”
划重点:
- OpenAI的GPT-4大型语言模型在可信度上优于GPT-3.5,但更容易受到入侵和偏见的影响。
- 研究由微软支持,发现用户可以欺骗GPT-4,导致发布偏见结果和泄漏私人信息。
- 尽管存在漏洞,研究团队表示这些问题在面向消费者的GPT-4产品中并未出现。
根据微软支持的研究发现,OpenAI的GPT-4语言模型被认为在可信度上比其前身GPT-3.5更胜一筹,但也更容易受到入侵和偏见的影响。
研究团队包括来自伊利诺伊大学厄巴纳-香槟分校、斯坦福大学、加州大学伯克利分校、人工智能安全中心以及微软研究机构的研究人员。他们给予GPT-4更高的可信度评分,这意味着他们发现该模型通常更擅长保护私人信息,避免产生有偏见的有毒结果,并抵抗对抗性攻击。
图源备注:图片由AI生成,图片授权服务商Midjourney
然而,研究也发现用户可以要求GPT-4忽略安全措施,导致泄漏个人信息和对话历史。研究人员发现,由于该模型“更精确地遵循误导信息”,它更有可能严格按照棘手的提示执行。
研究团队表示,尽管存在这些漏洞,但这些问题并未在面向消费者的GPT-4产品中出现,因为“成熟的AI应用程序采用一系列缓解措施,以解决可能在技术模型层面发生的潜在危害”。
为了衡量可信度,研究人员在多个类别中测量了结果,包括毒性、刻板印象、隐私、机器伦理、公平性和抵抗对抗性测试的强度。为了测试这些类别,研究人员首先使用标准提示测试了GPT-3.5和GPT-4,其中包括可能已被禁止的词汇。接下来,研究人员使用设计用于推动模型打破其内容政策限制的提示,而不公然对特定群体持有偏见,最后挑战模型,故意尝试欺骗它们以忽略安全措施。
研究人员表示他们已将这项研究与OpenAI团队分享。“我们的目标是鼓励研究社区的其他人利用并建立在这项工作的基础上,可能在恶意行动之前采取措施,以利用漏洞造成伤害的对手,”研究团队表示。“这种可信度评估只是一个起点,我们希望与其他人合作,进一步完善研究结果,并创建更强大和可信赖的模型。”
研究人员发布了他们的基准,以便其他人可以重现他们的发现。像GPT-4这样的AI模型通常会经历“红队”测试,其中开发人员测试多个提示,以查看它们是否会产生不希望的结果。当该模型首次推出时,OpenAI首席执行官萨姆·阿尔特曼承认GPT-4“仍然存在缺陷,仍然有限”。
美国联邦贸易委员会(FTC)已经开始调查OpenAI是否存在可能对消费者造成伤害的行为,例如发布虚假信息。
小米小爱同学推出「小爱输入助手」功能 暂仅支持小米14系列机型
小米小爱同学推出了「小爱输入助手」功能,该功能为用户提供了更便捷、实用的输入体验。需要注意的是,目前小爱输入助手仅支持百度/讯飞输入法,且需在小米社区获得“XiaomiHyperOSAI内测”资格后使用,内测期间仅支持Xiaomi14系列机型。站长网2023-10-27 08:46:050000ChatGPT高三考试仅物理得零分 网友:原来AI也会偏科
ChatGPT自发布以来就风靡全球,有着广阔的前景和良好的发展前景。最近,在搜狐的创作者大会上,与会者讨论了ChatGPT对知识直播领域的影响。同济大学物理教授吴於人指出:“有人用高三的卷子考验了ChatGPT,英语、历史和文字性的内容做得非常好,成功率非常高,但只有物理得了零分。”站长网2023-06-02 00:11:2300016财报里的猫狗拼:拼多多怎样反超阿里
国内电商圈,很久没有这么受关注了。11月28日晚,中国两大电商巨头阿里和拼多多,成为人们热议的焦点。事件的源头是,拼多多公布了一份不错的季度财报,随即股价上涨18%,市值达1847亿美元,与阿里的美股市值只差百亿美元左右。11月29日美股开盘,拼多多股价再涨,市值短暂超越阿里巴巴,成为美股市值最大中概股。截至收盘,阿里市值1902亿美元,拼多多市值回落至1883亿美元。站长网2023-11-30 09:02:010000OpenAI 同意从首席执行官 Sam Altman 个人投资的初创公司 Rain 购买 5100 万美元的 AI 芯片
尽管SamAltman在上月被解雇后不久便重新被任命为OpenAI的首席执行官,但即使在他离开期间,该公司继续开发ChatGPT,他仍有望获得收益。据报道,在Altman担任首席执行官期间,OpenAI签署了一份意向书,计划向一家名为RainAI的初创公司投资5100万美元购买AI芯片,而Altman本人也对该公司进行了个人投资。站长网2023-12-04 09:51:390000GPU推理提速4倍!FlashDecoding++技术加速大模型推理
要点:1.FlashDecoding是一种用于加速大模型(LLM)推理任务的新方法,可以将GPU推理提速2-4倍,同时支持NVIDIA和AMD的GPU。2.FlashDecoding的核心思想包括异步方法实现注意力计算的真正并行以及优化"矮胖"矩阵乘计算,以降低LLM的推理成本并提高推理速度。站长网2023-11-06 14:12:230000