小红书提出创新框架:充分利用负样本提升大语言模型推理能力
要点:
小红书搜索算法团队在AAAI2024上提出了一种创新框架,利用负样本知识来提升大语言模型(LLMs)的推理能力。
他们设计了一个模型专业化框架,包括负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,全面利用负样本在知识蒸馏中的关键作用。
该框架通过在训练和推理过程中充分利用负样本,使得小模型能够更好地处理复杂的数学推理问题,避免大模型的黑盒属性和庞大参数量的限制。
在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型(LLMs)在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本,而这项工作强调了负样本在知识蒸馏中的价值。通过负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,他们构建了一个全方位利用负样本的模型专业化框架。
论文地址:https://arxiv.org/pdf/2312.12832.pdf
首先,他们提出了负向协助训练(NAT)方法,通过设计dual-LoRA结构,从正向和负向两方面获取知识。这一步骤在训练中动态地集成正、负LoRA模块的知识,以构建更全面的推理能力。其次,他们设计了负向校准增强(NCE),利用负知识来帮助自我增强过程,通过KL散度来度量正、负推理链路之间的不一致性,以选择性地学习和增强嵌入的知识。
除了训练阶段,他们还在推理过程中利用负向信息,提出了动态自洽性(ASC)方法,通过排序模型在正、负样本上进行训练,为正确答案的推理链路分配更高的权重。整体来说,这一框架通过充分挖掘负样本的宝贵信息,使得小模型能够更有效地进行复杂的算术推理,从而在实际应用中更广泛地部署大语言模型的推理能力。
这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。
麻省理工推出AI工具PhotoGuard 对抗生成式AI模型
近年来,大型扩散模型,如DALL-E2和StableDiffusion,因其生成高质量、逼真的图像以及执行各种图像合成和编辑任务的能力而受到认可。但是,人们对用户友好的生成式AI模型的潜在滥用也越来越担忧,这些模型可能会导致不适当或有害的数字内容的创建。例如,恶意行为者可能利用公开分享的个人照片,通过使用现成的扩散模型,出于恶意目的对其进行编辑。站长网2023-08-01 16:32:310000微信神秘更新 网友发现全新功能:周杰伦VIP音乐免费听
快科技4月20日消息,腾讯微信今天同时更新了安卓版及iOS版,但是腾讯对更新内容保持神秘,都只轻飘飘说了一句修复了一些已知问题”。网友实测体验之后,才发现这次的更新内容还真不少,一些新变化很使用。首先是微信跟QQ音乐推出了现时活动,可以把喜欢的音乐人分享到朋友圈,同时微信里还能免费听VIP歌曲,包括大热的周杰伦全专辑都可以在微信听了,截至6月30日。站长网2023-04-20 22:10:220000中兴:今年将发布自研AI大模型以及首款AI旗舰终端
中兴手机宣布,将在今年发布自研AI大模型以及中兴首款AI旗舰终端。此次中兴终端的AI大模型应用架构全面而深入,涵盖了智能场景、交互技术、业务应用大模型以及大模型基础设施等多个方面。在智能场景方面,中兴的AI大模型将深入应用于商务出行、影音娱乐、家庭教育、运动健康以及智能驾驶等多个领域,为用户提供更加智能化的生活体验。站长网2024-02-26 09:39:060000李彦宏:AI应用才是衡量大模型成功的标准
今日,百度创始人李彦宏在世界互联网大会上指出,人类进入AI时代的标志是出现大量AI原生应用,而不是大模型本身。他认为,只有当AI应用拥有数百万用户时,对应的大模型才能被证明是成功的。这需要企业既重构现有产品,也开发全新的应用。最近几个月,百度加速对各类产品进行AI改造,给用户带来更好体验。0000直播电商换挡,谁来领路?
自去年双十一不再公布总成交额过后,今年的双十一似乎还要宁静一些。各大电商平台依旧非常努力:淘天集团把“全网最低价”定为了核心KPI,京东主打“真便宜”,拼多多喊出了“天天真低价”。但这些努力并没能激发用户群体足够的消费欲望,这个每年最大的促销节点已然诱发了观众的“审美疲劳”。站长网2023-11-23 15:51:080000