人工智能模型透明度评估:Llama 2位列第一,GPT-4透明度不佳
站长网2023-10-21 10:26:111阅
要点:
1. 十大主流AI模型的透明度正在受到关注,其中Llama2在透明度评估中位列第一,而GPT-4等模型的透明度不佳。
2. 斯坦福大学、MIT、普林斯顿大学等团队提出了“基础模型透明度指数”,对十个主流模型的透明度进行评估,结果显示透明度普遍不高。
3. 尽管有开源模型如Llama2等获得较高评分,但整体而言,AI行业的透明度不足,对模型构建过程、数据来源和劳动力等关键方面缺乏透明。
近年来,人工智能领域的主流模型透明度成为焦点,斯坦福大学、MIT、普林斯顿大学等机构合作提出了“基础模型透明度指数”来评估十大主流AI模型的透明度。结果显示,Llama2位列第一,而GPT-4等模型的透明度较低。
尽管AI模型的社会影响日益增大,人们对于这些模型的构建、训练和使用方式仍有诸多疑问,包括数据来源、劳动力待遇等。然而,该评估系统也引发了一些争议,一些开发者认为要求公司公开商业机密过于幼稚。
论文地址:https://arxiv.org/pdf/2310.12941.pdf
尽管如此,透明度对于AI模型的发展和应用至关重要,尤其是在生成式AI领域,因为模型既有提高生产力的潜力,也可能被用来伤害他人。透明度的不足可能导致模型被滥用,因此开发者需要更加注重透明度,包括对模型的构建、功能、风险等方面的公开。
然而,目前大多数主要基础模型开发者都未能提供足够的透明度,这凸显了人工智能行业亟需改进透明度的问题。同时,开源基础模型如Llama2、BLOOMZ等获得较高评分,但仍有改进空间,因为只有极少数开发者透明地展示了模型的局限性和其他关键信息。
在当前的政策争论中,是否应该将人工智能模型开源成为一个争议焦点,但无论开源还是闭源,透明度都是关键因素,以确保AI模型的负面影响得到控制。
0001
评论列表
共(0)条相关推荐
新游近百万美金月流水,合成出海,「柠檬微趣」不再孤单
自去年8月8日上线以来,「GossipHarbor」收入稳中有升,根据点点数据统计2023年4月,该游戏双端流水达到396.5万美元。已经超过了同样采用“合成家装/剧情”玩法,上线时间更早的该赛道主要产品「Love&Pies」(4月流水约158万美元),踩中合成游戏细分玩法竖屏Merge-2,再做一款爆品,也体现了柠檬微趣对于合成赛道的深度理解。站长网2023-06-08 07:23:230000向日葵远程崩了上热搜 官方回应:已在紧急修复中
就在刚刚“向日葵远程”登上热搜。有网友反馈称,远程控制软件“向日葵”出现了宕机的情况,页面显示“登录连接异常”。对此,向日葵官方回应称,由于机房线路故障,导致向日葵部分用户无法正常使用,已在紧急修复中,请耐心等待,保持客户端尝试登录状态,恢复后自动登录。站长网2023-09-18 10:53:160000苹果发布 iOS 16.5 系统更新:修复一长串安全漏洞及增强功能
今天,苹果公司发布了iOS16.5,这是iOS16操作系统的第五个主要更新。虽然iOS16.5不像我们之前看到的某些更新那样引人注目,但其中有一些重要的错误修复和功能增加。以下是iOS16.5更新中所有新功能的详细介绍。AppleNews中的「Sports」选项卡站长网2023-05-19 10:16:460001人工智能初创公司 SambaNova 推出专为更高质量 AI 设计的新芯片:可运行比 OpenAI 的 ChatGPT 高级版大两倍以上的模型
站长之家(ChinaZ.com)9月20日消息:人工智能芯片初创公司SambaNovaSystems在周二推出了一款新的半导体芯片,旨在让其客户以更低的总成本使用更高质量的人工智能模型。这家位于加利福尼亚州帕洛阿尔托的公司表示,SN40L芯片旨在运行比OpenAI的ChatGPT高级版使用的大两倍以上的模型。站长网2023-09-20 09:33:500000让浏览器3D性能提升的WebGPU,到底有什么用
不久前,我们三易生活曾为大家介绍了谷歌Chrome浏览器113版本中,首次加入的新图形API——WebGPU。站长网2023-04-15 09:22:400000