DragNUWA :一个可以实现精细控制的视频生成模型
站长网2023-08-19 15:33:101阅
DragNUWA 是一种基于扩散算法的视频生成模型,DragNUWA 模型旨在解决视频生成中的精细控制问题。该模型通过引入文本、图像和轨迹信息,并从语义、空间和时间角度提供精细控制。
论文地址:https://arxiv.org/pdf/2308.08089.pdf
模型中的轨迹建模包括轨迹采样器(TS)、多尺度融合(MF)和自适应训练(AT)策略。实验证明 DragNUWA 模型在视频生成的精细控制方面表现出色。
核心功能:
DragNUWA 在语义、空间和时间维度上同时引入文本、图像和轨迹信息,提供了精细控制视频生成的能力。
它采用轨迹采样器、多尺度融合和自适应训练策略,实现了开放域轨迹控制和生成连贯的视频。该模型在实验中展现出优越的细粒度控制性能。
0001
评论列表
共(0)条相关推荐
ChatGPT 背后的大型语言模型 GPT-4 需要大量的冷却水: 5 到 50 个问题就需消耗 500 毫升的水
站长之家(ChinaZ.com)9月11日消息:建设像ChatGPT这样的人工智能产品的成本往往难以衡量。但微软支持的OpenAI的技术需要大量的水,这些水来自爱荷华州中部的Raccoon和DesMoines河流域,用于冷却一台强大的超级计算机,以帮助教导其人工智能系统如何模仿人类写作。站长网2023-09-11 09:33:410000虚幻引擎 5.2 发布,原生支持 Apple Silicon
EpicGames宣布推出虚幻引擎5.2(UnrealEngine5.2/UE5.2)。EpicGames表示,虚幻引擎5.2进一步扩展了UE5开创性的工具集,继续实现最先进的实时3D创作工具的承诺。此外,虚幻引擎5.2还推动了开发者期望的开箱即用的界限,提供了更多的新功能。站长网2023-05-16 11:35:170000Chrome浏览器将集成侧边栏Google 搜索功能,紧追Edge脚步
谷歌Chrome浏览器是全球最受欢迎的网络浏览器之一,但面临着来自MicrosoftEdge的激烈竞争。众所周知,MicrosoftEdge浏览器具有侧边栏功能,允许用户在浏览网页的同时方便地使用自己喜欢的工具,例如BingChat、Outlook、MSN游戏等。谷歌浏览器也有类似的功能,称为“侧面板”,但目前只提供一些自定义功能,如颜色、主题和设置。站长网2023-07-31 11:04:3400001分钟毛坯房变精装修,AIGC如何改变4万亿家居产业链?
有没有想过,亲手设计自己的家?只需将毛坯房照片上传到AI家居设计软件,添加“复古、温馨、适合发呆”等描述词,几张逼真的装修效果图就出现在面前。还可以调整色彩搭配、灯光类型、外景类型、添加家具,“这个过程好像在玩换装小游戏。”一位体验过AI家居设计的用户说。站长网2023-08-14 18:00:020000美联社制定人工智能使用指南 承诺不会使用AI生成的照片、视频等内容
本文概要:1.美联社发布了关于使用人工智能的指南,提醒记者谨慎使用该技术。2.美联社强调人工智能不应替代记者,而是作为辅助工具使用。3.美联社将使用ChatGPT进行试验,但不会发布使用人工智能生成的内容。日前,美联社向其记者发布了有关使用人工智能的指南。该指南提醒记者要谨慎使用人工智能技术,将其视为辅助工具而非取代记者的工具。站长网2023-08-17 11:55:150000