OpenAI预警系统探索 GPT-4 在制造生物武器方面的优势
划重点:
1. 📡 OpenAI通过研发早期预警系统,评估GPT-4是否能提高获取生物威胁信息的效率。
2. 🤖 对100名参与者进行的研究表明,使用GPT-4与互联网相结合,在生物危害任务的准确性和完整性上略有改善,但效果并不显著。
3. 🌐 文章强调研究限制,仅评估了信息获取而非实际应用,未探讨GPT-4在新型生物武器开发中的潜在贡献,且使用的GPT-4模型缺乏互联网研究和高级数据分析工具。
OpenAI最近着手研发GPT-4的早期预警系统,以探讨大型语言模型是否能够提高获取关于生物威胁信息的效率,相较于互联网。该系统旨在作为一种“触发器”,提示潜在存在生物武器的可能性,需要进一步调查,同时纳入OpenAI的预防框架。
研究采用了100名参与者,包括50名具有湿实验经验的博士生物学家和50名至少在大学修过一门生物学课程的本科生。实验中,参与者被随机分配到两组:一个只能访问互联网的对照组,另一个除了互联网外还可以使用GPT-4的处理组。处理组的专家可以访问GPT-4的研究版本,该版本不会拒绝有关高风险生物制剂的直接问题。
每个参与者都被要求完成一系列涵盖生物危害生成过程各个方面的任务。OpenAI根据五个结果指标评估了参与者的表现:准确性、完整性、创新性、用时和自评难度。其中,专家评估了准确性、完整性和创新性,而用时则直接来源于参与者的回答,任务难度由参与者在1到10的评分标尺上自评。
研究结果显示,相较于只使用互联网的基准,处理组的参与者在准确性和完整性方面都略有改善。在准确性评分的10分制度上,专家组平均提高了0.88,学生组提高了0.25。对于完整性的改善也类似,专家组为0.82,学生组为0.41。然而,OpenAI指出,这些效果并不足以在统计学上具有显著性。
OpenAI表示,对于LLM用户而言,在完整性方面的优势可能是由于模型生成和人类生成的输出记录习惯不同。语言模型倾向于生成更长的输出,其中可能包含更多相关信息,而使用互联网的人并不总是记录每个相关细节,即使他们已经找到并认为这是重要的。
然而,研究存在一些限制,仅评估了对信息的获取而非实际应用,未探讨LLM在新型生物武器开发中的潜在贡献。此外,所使用的GPT-4模型缺乏互联网研究和高级数据分析工具,因此结果只能被视为初步的。
这个双十一,淘宝商家不再困在流量里
把家族企业做了十几年的线下数控五金生意搬到线上,是“厂二代”赶时髦的突发奇想,还是当前中小企业寻找客户、扭转销售困局,不得不做的转型?站长网2023-11-07 12:01:090002一张图500元是目前AIGC最高“回报”?小冰李笛:调用API的商业模式不适用于未来 | MEET 2024
AIGC在商业界中,最大的一笔回报是多少?答案可能是:一张图片,500元。而且这就是发生在最近、号称人工智能著作权第一案的真实案例:A利用人工智能技术生成了一张图片,B盗用了这张图片,并在自己的文章中使用。法院最终判定,B侵犯了A的知识产权,并且需要向A支付500元的赔偿。0000直播战争2023:被重塑的,被围猎的
互联网时代发展至今,直播早已不是一个新鲜词语。但作为符号的直播,却经历了多次文本内涵的嬗变。一开始,它是一种社交方式,是千亿级风口和新平台的想象空间。然后,它是一种互联网平台的必备工具,是一种人人可做的简单产品。现在,它和电商深度绑定,直播电商也因此完成了对直播的子吞母式概念合并。0000海底捞平价子品牌“嗨捞火锅”如何成为排队王?
“广东人看完都沉默了,痛失广东市场”“海底捞有自己的穷鬼套餐”“不是海底捞吃不起,而是嗨捞更有性价比”海底捞最近刚推出的全新子品牌平价火锅“嗨捞火锅”变成了新的打卡排队王。“嗨捞火锅”目前仅在北京开设两家门店,品牌首店位于北京北苑龙湖天街,在9月26日正式开店。19.8元的锅底,22元一盘肉,平均客单价低至80元,海底捞子品牌的名气加上陌生的价格让“嗨捞火锅”门店持续火热。站长网2023-11-04 09:36:490000独立开发变现周刊(第127期):失败了三次,25岁开发月入5万美元的Shopify插件
分享独立开发、产品变现相关内容,每周五发布。目录1、Moaijobs:在AI领域找工作2、葫芦AI:一站式AI对话,AI写作和AI绘画3、Dracula:一个开源的代码配色解决方案4、失败了三次,25岁时建立了一个月入5万美元的Shopify插件1、Moaijobs:在AI领域找工作目标是让它成为寻找所有前沿AI公司职位的首选求职网站。专注于搜索引擎优化(SEO)来实现这一点。站长网2024-03-22 16:37:570000