Anthropic宣布关键突破,解析人工神经网络行为
划重点:
🧠 重要突破:Anthropic宣布了一项关键研究成果,能更好地理解支撑其人工智能算法的神经网络的行为。
🌐 影响广泛:这一研究有望提高下一代人工智能的安全性和可靠性,使研究人员和开发者能够更好地控制其模型的行为。
🤖 神经网络解析:研究人员通过解析神经网络内部的特征,取得了重要进展,有望解决神经网络行为的难题。
人工智能初创公司Anthropic PBC近日宣布了一项重大突破,他们表示已找到一种更好地理解支撑其人工智能算法的神经网络行为的方法。这一研究成果有望在提高下一代人工智能的安全性和可靠性方面产生深远影响,使研究人员和开发者能够更好地控制其模型的行为。
Anthropic的研究聚焦在神经网络的不可预测性上,这些网络受到启发于人脑的神经元工作方式,模仿生物神经元之间的信号传递。神经网络是通过数据训练的,而不是按照特定规则编程的,因此它们可以呈现多种不同的行为,这就是为什么研究人员很难控制人工智能模型,以及如何防止其生成虚假答案,也就是所谓的“幻觉”。
图源备注:图片由AI生成,图片授权服务商Midjourney
Anthropic指出,神经科学家在试图理解人类行为的生物基础时面临类似的挑战。他们知道人脑中的神经元必须以某种方式实施思维、情感和决策,但他们无法确定其工作原理。
为了更好地理解神经网络的工作方式,Anthropic的研究人员深入研究了单个神经元,并确定了每个神经元内部的小单元,被称为特征,这些特征更好地对应于神经元激活的模式。通过研究这些特征,研究人员相信他们最终可以更好地理解神经网络的行为。
在一项实验中,Anthropic研究了一个小型变压器语言模型,将512个人工神经元分解成代表DNA序列、法律文本、HTTP请求、希伯来文本、营养说明等上下文的4000多个特征。他们发现,单个特征的行为比神经元的行为更具解释性。
Anthropic验证了他们的研究成果,他们创建了一个盲目的人工评估者来比较单个特征和神经元的可解释性。结果显示,特征(红色)比神经元(蓝绿色)得分要高得多。
Anthropic表示,这为以特征作为神经网络理解的基础提供了有力证据。通过放大并查看4000多个特征的整个集合,Anthropic发现这些特征在不同人工智能模型之间具有广泛的普适性。因此,通过研究一个模型中的特征所学到的经验可以应用于其他模型。
尽管人工神经网络是使人工智能在过去几年中变得如此强大的关键发展,但没有人真正完全理解它们的工作原理,因此无法预测它们将如何回答或响应任何给定的提示。研究人员迄今大多集中在“机械互操作性”的研究上,即逆向工程神经网络的研究。
Anthropic的研究方法为解决这一混乱提供了一个有趣的途径,通过更清晰地理解神经网络的内部工作方式,他们已经展示出了预测神经网络结果的能力。尽管这一方法尚未扩展到更大的模型,但在小型模型上已经显示出了令人印象深刻的潜力,有望在“机械互操作性”的研究中取得良好进展。
Anthropic相信,通过进一步研究,他们可能能够操控所描述的特征,以更可预测的方式控制神经网络的行为。最终,这可能对克服理解语言模型行为的挑战至关重要。
马云取代软银成为阿里巴巴最大股东
阿里巴巴近日发生了股权变动,马云和蔡崇信通过增持阿里股票,合计持股比例已超过软银,成为阿里巴巴的最大股东。据国内媒体报道,马云和蔡崇信在过去的一段时间里持续购买阿里巴巴的股票,但具体的增持数额尚未透露。这一增持行为使得两人的合计持股比例超过了软银,让马云成为了阿里巴巴的最大股东。站长网2024-01-24 16:44:120000Transformer一作公司Adept发布多模态大模型Fuyu-8B 80亿参数,100毫秒极速响应
要点:1.Transformer一作AshishVaswani所在的AI公司Adept发布了Fuyu-8B,一个多模态大模型,拥有80亿参数,能够理解各种图像类型,包括照片、图表、PDF和界面UI。2.Fuyu-8B采用了一种纯解码器Transformer架构,不使用图像编码器,支持任意图像分辨率,表现在多项任务中优于其他大型模型。站长网2023-10-19 15:01:420000著名物理学家将人工智能聊天机器人称为「美化的录音机」
著名理论物理学家MichioKaku表示,公众对新的人工智能技术的焦虑是错误的。在周日接受CNN的FareedZakaria采访时,这位未来学家表示,OpenAI的ChatGPT等聊天机器人将有益于社会,并提高生产力。但恐惧驱使人们主要关注这些程序的负面影响,他称其为「被美化的录音机」。站长网2023-08-14 09:47:520000今年以来,抖音直播处置户外低俗直播行为帐号27W+个
今日,抖音直播发布了关于整治户外直播乱象的处置公示第四期内容。2023年1月至今共处罚涉及户外低俗直播行为的帐号271,919个。站长网2023-04-16 08:06:440000知乎发布最新大模型应用“搜索聚合” 已开启内测
昨日,知乎合伙人、首席技术官李大海在“2023中国国际大数据产业博览会”(以下简称“数博会”)上宣布,知乎模型应用“搜索聚合”即日开启内测,面壁智能研发的中文基座大模型CPM-Bee10b全面开源,并发布了对话类模型产品“面壁露卡”。“搜索聚合”的功能是将大模型能力应用到了知乎搜索上,每当用户触发搜索时,系统就会从大量提问和回答中聚合观点,提高用户获取信息、形成决策的效率。站长网2023-05-28 11:01:190000