英伟达推文生图模型 ConsiStory:免训练、可生成连贯图片
站长网2024-02-21 09:11:311阅
划重点:
⭐️ 英伟达和特拉维夫大学研究人员共同开发了一种免训练、可生成连贯图片的文生图模型 ConsiStory。
⭐️ ConsiStory 通过主体驱动自注意力(SDSA)和特征注入等核心模块,在不需要任何训练或调优的情况下实现图像主体的一致性。
⭐️ 该模型还包含锚图像和可重用主体功能,提供主题一致性的参考,避免了传统训练方法中针对每个主题进行训练的难题。
英伟达与特拉维夫大学的研究人员联手开发了一款名为 ConsiStory 的文生图模型(目前尚未开源),旨在解决目前文生图模型在生成内容一致性方面的挑战。
ConsiStory 采用了一种全新的方法,通过主体驱动自注意力(SDSA)和特征注入等核心模块,实现了图像主体的一致性,无需任何训练或调优。

SDSA 模块是 ConsiStory 的核心之一,扩大了扩散模型中自注意力层,允许不同图像中的主体保持一致的外观。通过主体蒙版遮蔽背景区域的敏感信息,不同图像中的主体可以相互 "对齐",保持一致性。而特征注入则建立在扩散特征空间的密集对应图上,确保主体相关的纹理、颜色等细节特征在整个批次中互相 "对齐",进一步增强了主体间的一致性。

此外,ConsiStory 还提供了锚图像和可重用主体功能,锚图像作为主题信息的参考,引导图像生成过程以保持一致性。可重用主体则通过共享预训练模型的内部激活,避免了传统方法中针对每个主题进行训练的难题,实现了0训练成本。这些功能共同助力 ConsiStory 成为一款无需训练即可生成连贯图片的文生图模型,为 AI 图像生成领域带来了新的可能性。
论文地址:https://arxiv.org/abs/2402.03286
0001
相关推荐
英特尔为 Arrow Lake-S 和 Lunar Lake CPU 添加人工智能和机器学习指令集
英特尔对下一代ArrowLake-S和LunarLake系列的指令支持进行了更新,验证了对几个新指令的支持。根据英特尔发布的《架构指令集扩展和未来特性》文档,即将推出的ArrowLake和LunarLakeCPU系列将提供对指令的广泛支持。该文档揭示了专注于人工智能任务的AVX-VNNI-INT16.SHA512.SM3和SM4指令。站长网2023-07-05 09:17:190001Tromzo获得800万美元融资,引领AI应用程序安全态势管理
本文概要:1.美国网络安全初创公司Tromzo获得800万美元种子轮融资。2.Tromzo的平台利用人工智能和智能图谱来提供终端到终端的可见性,减少噪音,消除手动工作,提高安全拥有度。3.Tromzo的独特方法结合了人工智能和应用安全态势管理(ASPM)。站长网2023-08-04 14:47:030000Nvidia发布GeForce RTX增强版,为AI PC数字助手提供支持
划重点:⭐️Nvidia推出新的RTX技术,为新的GeForceRTXAI笔记本电脑提供动力⭐️ProjectG-Assist技术演示为PC游戏和应用提供上下文感知的帮助⭐️NvidiaACE数字人物平台首个PCNIM首次亮相,为数字人物提供支持站长网2024-06-03 13:11:010000微软和谷歌的AI领域投资经验:花钱才能赚钱
微软和谷歌表示,人工智能将为它们带来巨大回报,但在实现盈利之前,它们需要更深入的投资。微软表示,随着建设新的数据中心以支持人工智能,成本大幅上升,资本支出将继续增加,因为它购买来自英伟达等公司的芯片来为这些数据中心提供动力。站长网2023-07-26 14:30:340000辞职体验100种职业,”池早“要好好活
如果你现在辞职,你会选择干什么?或许你会考虑继续在本行业找份工作,或者去那个你一直感兴趣的职业,又或者迷茫无措后继续生活。@池早是我选择了辞职去体验100种职业,然后制作成短视频。3月11日,池早在抖音平台发布第一条视频,截至目前,池早已经体验了23种不同职业。半年时间,这个女孩全网获得了600w粉丝。站长网2023-09-21 09:13:580000