DeepMind发布自监督扩散模型SODA

站长网2023-12-01 12:16:310阅

Google DeepMind昨天发布的一项研究展示了一项引人注目的技术，尽管其中的技术细节可能需要深入理解，但总体来说，通过一系列操作，可以以无监督的方式精准控制扩散模型，从而实现风格和内容的分离，以及合成物品的3D视图等功能。

论文地址:https://soda-diffusion.github.io/

这项研究介绍了一种名为SODA的自监督扩散模型，专门用于表示学习。该模型包括一个图像编码器，通过将源视图提炼成紧凑的表示，来引导生成相关的新颖视图。通过在编码器和去噪解码器之间施加严格的瓶颈，并以新颖的视图合成作为自监督目标，这项技术将扩散模型转变为强大的表示学习器，能够以无监督的方式捕获视觉语义。

该模型由一个图像编码器和一个去噪解码器组成，编码器将输入视图转换为低维潜在表示，然后引导去噪解码器进行生成。论文详细描述了编码器的架构设计、新视角生成的机制，以及为了培养强大有意义的表示而开发的优化技术。

通过一系列定量和定性实验，作者展示了SODA在多个数据集上的强大表示和生成能力。这些实验涉及线性探测分类、图像重建、新视角合成，以及解混杂和可控性的评估。

SODA不仅在图像生成方面表现出色，而且能够学习强大的语义表示。未来，这种方法或许可以应用到动态组合场景中。这项研究为深度学习领域的发展提供了新的思路和可能性。

DeepMind发布自监督扩散模型SODA

0000

评论列表

共(0)条

相关推荐

IPv6更便宜了中国互联网络信息中心CNNIC宣布再降资费
快科技4月29日消息，为降低中小企业基础网络升级门槛，中国互联网络信息中心（CNNIC）不断降低IPv6地址的启用成本。在2020年统一降低IPv6地址使用年费50%的基础上，于今年启动互联网基础资源赋能百万中小企业数字化行动”，再次推出一项降低IPv6地址使用费用的新政策。
站长网站长资讯2023-04-29 10:50:05
0000
站长资讯
零一万物开放笛卡尔向量数据库搜索内核 Binary下载免费商用
零一万物宣布决定全面开放笛卡尔向量数据库搜索内核，并免费商用。零一万物的笛卡尔向量数据库定位专注于大模型场景，能够执行超高精度、超快速度的检索，辅助大模型在RAG、Agent等方面达到更佳的性能从而提升整体效果，可说是为大模型而生的内存向量数据库，后续也有持续性增强的系列工作。
站长网2024-03-18 10:04:19
0000
站长资讯
广电总局：互联网电视应用启动时间应不大于5秒
今日，国家广播电视总局组织审查了《有线电视业务技术要求》《IPTV业务技术要求》《互联网电视业务技术要求》等三项标准文件，现批准为中华人民共和国广播电视和网络视听推荐性行业标准，予以发布。其中，《互联网电视业务技术要求》表示，互联网电视应用启动时间宜小于3s，应不大于5s。
站长网2023-11-27 13:56:37
0000
站长资讯
ChatGPT 等生成式 AI 推出后欧洲对人工智能法规保护就业的呼声不断高涨
站长之家(ChinaZ.com)10月12日消息:据西班牙IE大学的一项重大新研究显示，大多数欧洲人希望政府限制人工智能，以减轻该技术对就业安全的影响。该研究显示，在对3000名欧洲人的样本调查中，68%的人希望他们的政府制定规则，保护工作不受人工智能带来的自动化水平的上升的影响。
站长网2023-10-12 11:54:43
0000
AI前哨｜AI能毁灭人类？这是不是危言耸听？
AI能毁灭人类?凤凰网科技讯《AI前哨》北京时间6月11日消息，最近一段时间，一些研究人员和行业领袖不断警告称，人工智能（AI）可能会对人类的生存构成威胁。但是，对于AI究竟如何摧毁人类，他们并未详谈。
站长网站长资讯2023-06-12 03:42:41
0000