20626

MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合

站长网2024-04-22 09:59:320阅

划重点:

🔍 引入了一种新的架构，名为注意力混合模式（MoA），用于个性化文本到图像扩散模型。

🎨 MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。

🖼 MoA 能够生成高质量、个性化的图像，使得主题和背景的控制更加分离。

在最新的研究中，提出了一种名为注意力混合模式（MoA）的新架构，旨在个性化文本到图像扩散模型，可以实现风格参考和人物融合的效果。

受大型语言模型（LLMs）中使用的专家混合机制的启发，MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。具体来说，MoA 保留了原始模型的先验知识，通过固定先验分支中的注意力层，同时通过个性化分支最小干预生成过程，学习将主题嵌入由先验分支生成的布局和背景中。

一种新颖的路由机制管理着每个层中像素在这些分支之间的分布，以优化个性化和通用内容创建的混合。经过训练，MoA 能够轻松生成高质量的个性化图像，其主题和背景的组合和交互与原始模型生成的一样丰富多样。最重要的是，MoA 增强了模型的现有能力与新增个性化干预之间的区别，从而提供了一种之前无法实现的更为分离的主题 - 背景控制。

此外，研究还探讨了 MoA 在现实应用中的潜力。例如，结合 MoA 和 DDIM 反演技术，可以实现对真实图像中主体的替换;结合 MoA 和 ControlNet，可以实现带有姿势控制的个性化生成;MoA 甚至能够在面部和身体形状完全不同的情况下进行主体交换，以及轻松地在主体之间进行形态变换。这些应用展示了 MoA 在个性化图像生成领域的潜在价值和广泛适用性。

产品入口:https://top.aibase.com/tool/mixture-of-attention-moa-

MoA用于图片合成的混合注意力架构可实现风格参考和人物融合

0000

评论列表

共(0)条

相关推荐

站长资讯
“AI教父”承认担忧:AI可能接管人类
划重点:1.🤯著名AI研究者GeoffreyHinton担忧他的创造可能接管人类世界。2.🌐他表示AI可能会变得比人类更聪明，而无法预测是否能阻止它们接管。3.🤨Hinton还担忧AI被滥用，包括自主AI武器、取代人类工作和传播虚假信息。
站长网2023-10-12 11:33:07
0000
站长资讯
Artisse AI融资670万美元，打造更逼真的AI摄影应用
##划重点:1.🚀**融资动向**:ArtisseAI成功融资670万美元，该公司专注于开发更逼真的AI摄影应用。2.📸**应用特色**:与竞争对手不同，Artisse致力于生成可替代专业摄影的照片，其AI模型注重细致的人物因素，使生成的图片更具真实感。
站长网2024-01-24 10:44:41
0000
站长资讯
英伟达发布 CALM 人工智能模型：能够生成 500 亿个身体动作
现在有了英伟达的新型AI语言模型CALM（ConditionalAdversarialLatentModels），理论上你可以借助它来创建自己的视频游戏角色。CALM是一种用于训练可控虚拟角色（也就是视频游戏角色）的AI语言模型。英伟达与以色列理工学院、巴伊兰大学和西蒙弗雷泽大学合作撰写了一篇详细介绍该模型结构和训练方法的论文。
站长网2023-08-11 15:04:18
0000
站长资讯
OpenAI急于为“GPT”注册商标，但美国专利局并不买账
OpenAI大热的ChatGPT是基于“GenerativePre-trainedTransformer”技术的聊天机器人，简称“GPT”。该技术被称为“GPT”。随着AI竞争的不断升温，OpenAI近日向美国专利商标局（USPTO）提交了“GPT”的商标申请，但被驳回。
站长网2023-04-26 16:24:52
0000
站长资讯
侵害用户权益！工信部通报56款App：羊了个羊上榜
5月7日消息，据工信微报”公众号介绍，工信部依据《个人信息保护法》《网络安全法》《电信条例》《电信和互联网用户个人信息保护规定》等法律法规，持续开展App侵害用户权益专项整治行动。近期，工信部组织第三方检测机构对群众关注的实用工具、休闲娱乐及短视频等移动互联网应用程序及第三方软件开发工具包（SDK）进行检查，发现56款App（SDK）存在侵害用户权益行为。
站长网2023-05-07 08:53:09
0000