DeepMind发布自监督扩散模型SODA
站长网2023-12-01 12:16:310阅
Google DeepMind昨天发布的一项研究展示了一项引人注目的技术,尽管其中的技术细节可能需要深入理解,但总体来说,通过一系列操作,可以以无监督的方式精准控制扩散模型,从而实现风格和内容的分离,以及合成物品的3D视图等功能。
论文地址:https://soda-diffusion.github.io/
这项研究介绍了一种名为SODA的自监督扩散模型,专门用于表示学习。该模型包括一个图像编码器,通过将源视图提炼成紧凑的表示,来引导生成相关的新颖视图。通过在编码器和去噪解码器之间施加严格的瓶颈,并以新颖的视图合成作为自监督目标,这项技术将扩散模型转变为强大的表示学习器,能够以无监督的方式捕获视觉语义。
该模型由一个图像编码器和一个去噪解码器组成,编码器将输入视图转换为低维潜在表示,然后引导去噪解码器进行生成。论文详细描述了编码器的架构设计、新视角生成的机制,以及为了培养强大有意义的表示而开发的优化技术。
通过一系列定量和定性实验,作者展示了SODA在多个数据集上的强大表示和生成能力。这些实验涉及线性探测分类、图像重建、新视角合成,以及解混杂和可控性的评估。
SODA不仅在图像生成方面表现出色,而且能够学习强大的语义表示。未来,这种方法或许可以应用到动态组合场景中。这项研究为深度学习领域的发展提供了新的思路和可能性。
0000
评论列表
共(0)条相关推荐
老人为短剧一个月充值4万元:多个小程序无故下线、退费难
快科技3月8日消息,据媒体报道,短剧春节档最高日消耗破亿,总票房预估8亿元,但疯狂吸金的背后依然乱象丛生。家住成都的CC表示,自己在偶然帮妈妈处理手机问题时发现微信中有很多笔短视频小程序的支付记录,金额大部分在9.9元、19.9元、39.9元不等,有少数几笔是129元的。0000研究人员发现,谷歌Gemini表现不如GPT-3.5 Turbo
在近期的一项研究中,来自卡内基梅隆大学和BerriAI的研究团队对GoogleGeminiPro进行了深入的评估,并发现其在多项任务中表现不如OpenAI的GPT-3.5Turbo。这一发现无疑是对Google在生成式人工智能领域与OpenAI竞争的雄心的一次沉重打击。GeminiPro与GPT-3.5Turbo对比0000数据显软必应超越百度成为中国第一大桌面搜索引擎
截至2023年4月,根据StatCounter的数据显示,在中国内地桌面搜索市场上,微软必应的份额达到了37.4%,再次创下历史新高,超过了百度,成为中国第一大桌面搜索引擎。百度目前的市场份额为26.32%,微软必应、搜狗、Yandex、好搜、谷歌的市场份额分别为35.69%、14.48%、6.78%、6.17%、3.36%。站长网2023-05-22 16:23:350000魅族21官宣:搭载魅族味第三代骁龙8
星纪魅族集团董事长兼CEO沈子瑜正式宣布,魅族21系列将首批搭载行业最强的第三代骁龙8处理器。此前,魅族21系列的发布日期已经官宣,定于11月30日。值得注意的是,魅族此次表示将进行“魅族味”的独家调校,与高通紧密合作,旨在为消费者带来更出色的续航表现和持久稳定的性能。站长网2023-11-21 11:45:150000抖音起诉某聚合式智能刷量软件侵权 获赔100万元
据杭州中院消息,近日,杭州互联网法院公开宣判一起涉引流刷量软件干扰短视频算法推荐、妨碍短视频平台正常运行不正当竞争案。站长网2023-04-14 11:40:170002