谷歌推扩散模型变种UFOGen 真正实现一步文生图
站长网2023-11-20 14:54:031阅
要点:
1. 谷歌研究团队提出了一种名为UFOGen的扩散模型变种,只需要一步就能生成高质量的图片。
2. UFOGen通过改变生成器的参数化方式和重构损失函数的计算方式,理论上可以实现一步生成。
3. UFOGen的生成器和判别器都是由Stable Diffusion模型初始化,这样可以最大限度地利用Stable Diffusion的内部信息。
近年来,扩散模型在视觉创作领域的应用不断增加,但是生成速度一直是一个问题。然而,随着技术的进步,UFOGen模型的出现解决了这个问题,它只需要一步就能生成高质量的图片。通过改变生成器的参数化方式和重构损失函数的计算方式,UFOGen实现了一步生成的目标。
论文地址:https://arxiv.org/pdf/2311.09257.pdf
之前对扩散模型生成速度的研究主要集中在两个方向,一方面是利用更少的离散步数求解扩散模型的采样ODE,另一方面是利用知识蒸馏的方法将采样路径压缩到更小的步数。然而,谷歌的研究团队在UFOGen模型中采用了一种全新的思路,通过改变生成器的参数化方式和重构损失函数的计算方式来实现一步生成的目标。
UFOGen模型是在扩散模型和GAN混合模型的基础上发展而来的。扩散模型假设降噪分布是一个简单的高斯分布,但这种假设只在降噪步长趋于0时成立,导致生成速度很慢。而UFOGen模型通过使用带条件的GAN来模拟降噪分布,取较大的降噪步长来减少步数,从而提高了生成速度。
0001
评论列表
共(0)条相关推荐
移动通信联合会:防止对类ChatGPT等生成式人工智能应用进行滥用
4月13日,中国移动通信联合会元宇宙产业工作委员会等发布《关于元宇宙生成式人工智能(类ChatGPT)应用的行业提示》。中国移动通信联合会表示,科技风口的成长并非一帆风顺,行业的试错成本巨大,因此,呼吁行业自律并对本机构委员单位作出如下行业提示:第一,要着眼科学发展深化思想认识,严格遵守国家及行业相关法律法规要求,增强合规谨慎经营的理念,全面提高风险管控水平;站长网2023-04-13 09:24:070000麻省理工研究:利用AI帮助机器人让整个身体操纵物体
文章概要:1.新AI技术使机器人能够制定复杂的计划,利用整只手而不仅仅是指尖来操纵物体。2.该模型可以在大约一分钟内使用标准笔记本电脑生成有效的计划。3.尽管还处于初期阶段,但这种方法可能使工厂可以使用移动机器人来操纵物体,从而降低能源消耗和成本。站长网2023-08-25 17:23:260000富士通详细介绍面向人工智能和数据中心的 150 Armv9 核心的 Monaka CPU
富士通正在研发其下一代人工智能(AI)、高性能计算(HPC)和数据中心应用处理器,该处理器名为Monaka,承诺将提供强大的性能,采用了150个增强的Armv9核心以及使用加速器的能力。Monaka处理器将成为首批2纳米数据中心CPU之一,预计将于2027财年推出,该财年从2026年4月1日开始,到2027年3月31日结束。站长网2023-10-13 09:52:460000ChatGPT正式引入Bing网络搜索功能,并集成DALL-E 3测试版
划重点:1.OpenAI正式将Bing搜索引擎引入ChatGPT,为用户提供实时搜索功能。2.ChatGPT过去一年一直受限于数据截止日期,无法进行实时搜索,但现在可以通过Bing搜索引擎进行网络搜索。3.测试DALL-E3与ChatGPT集成,用户可以在文本查询中接收图像,无需切换应用程序。站长网2023-10-19 11:08:550000视频编辑利器Pix2Video 无需训练微调
要点:本文提出了一种基于预训练的图像扩散模型的视频编辑方法,实现文本引导的编辑,无需训练或微调,可推广到广泛编辑领域。通过自注意力特征注入,该方法在每个扩散步骤中注入前一帧的特征,以保持外观的一致性,解决了视频编辑中的外观变化问题。引入了潜在更新机制,通过能量函数提高一致性,增强了算法的时间稳定性,减少了时间闪烁的影响。站长网2023-11-29 18:17:040000