腾讯和香港科技大学开源视频生成模型VideoCrafter1 超越其他开源模型

站长网2023-11-01 11:35:020阅

腾讯和香港科技大学最近合作推出了一种全新的视频生成模型VideoCrafter，用于高质量视频生成。这个模型包括视频VAE和3D去噪U-net，经过在庞大的数据集上进行了训练，其性能表现出色，超过了其他开源视频生成模型。

该项目旨在创建一个高级且用户友好的视频生成模型，以满足研究和生产的需求，并为社区的发展做出贡献。他们还设想了一个视频创作助手，能够通过视觉创作将想象的点子变为现实。

项目地址:https://ailab-cvc.github.io/videocrafter/

VideoCrafter1提供了两种开放扩散模型，分别用于文本到视频（T2V）和图像到视频(I2V)任务。T2V模型能够生成具有1024×576分辨率的逼真且具有电影质量的视频，在质量方面胜过其他开源T2V模型。而I2V模型则旨在生成与提供的参考图像内容严格一致的视频，保留其内容、结构和风格。这是第一个能够将给定图像转化为视频剪辑并保持内容保存约束的开源I2V基础模型。

该项目的视频扩散模型框架利用自动编码器的潜在空间中训练视频UNet，以FPS作为条件来控制生成视频的运动速度。对于T2V模型，只需将文本提示通过交叉关注（feed into the spatial transformer）输入即可，而对于I2V模型，则将文本和图像提示一同输入。

此外，他们提供了EvalCrafter进行综合评估。项目鼓励使用其代码、模型和数据的研究引用，并采用Apache2.0许可分发其代码、模型和数据。

腾讯和香港科技大学开源视频生成模型VideoCrafter1超越其他开源模型

0000

评论列表

共(0)条

相关推荐

站长资讯
GPT-4满分通过MIT本科数学考试，这套提示词火了
万万想不到啊，MIT数学考试，被GPT-4攻破了?!突然有人在最新论文工作中高调宣布:GPT-4在MIT的数学和EECS（电气工程和计算机科学系）本科学位考试中，表现出的能力完全满足毕业要求。而且妥妥地拿下满分!要知道，测出这个结果的不是别人，正是来自MIT和波士顿大学、康奈尔大学的研究团队。而且强如上一代王者GPT-3.5，在同样的测试中，只成功搞定了三分之一。△
站长网2023-06-18 17:18:52
0001
站长资讯
烧钱！OpenAI的ChatGPT每天维护成本高达70万美元
根据研究公司SemiAnalysis的数据，ChatGPT的巨大知名度和强大功能使其维护成本高得惊人，TheInformation报道称，维护OpenAI的ChatGPT等对话式人工智能引擎每天的开销高达70万美元。。
站长网2023-04-24 09:51:20
0000
站长资讯
ChatGPT提示词优化平台Promptport 专为ChatGPT定制的创意AI工具
Promptport是一款为ChatGPT服务定制的创意AI工具。它允许用户在平台上创建、优化和分享ChatGPT的提示词。用户可以自行创建ChatGPT提示词，并使用标签对它们进行分类。通过创建、优化和分享提示词，用户可以更轻松地与ChatGPT互动，克服创作难题，提高对话质量，创造更有趣、更有深度的内容，并获得更多灵感。
站长网2023-08-30 10:51:54
0003
站长资讯
纽约一议员用AI填补房屋法案漏洞批评者称其不够智能
今年早些时候，一位律师因使用ChatGPT来撰写法律论据而陷入麻烦，结果引用了虚构的案例法和不存在的审判决定。现在纽约州一位民主党议员莱德范尼尔（ClydeVanel）使用人工智能程序来填补法律漏洞，结果引起了争议。该议员表示，从人工智能获取立法想法与接受选民或倡导团体的意见没有什么不同。
站长网2023-07-15 11:18:57
0000
站长资讯
一夜之间，“电视家”等众多电视直播软件停摆，发生了什么？
昨天，电视家突然发布公告称，其服务遇到问题。若用户在会员期内，用户的付款将足额退还。昨天晚上，三言测试发现，使用电视家看电视，仍有几个央视频道可以观看，但很多电影不能看了，显示“网络原因播放失败”。此外，安卓应用市场显示，电视家“涉嫌资质造假，暂不提供下载”。电视家的官网已无法打开，“电视家跑路”登上了微博热搜。电视家助手表示会妥善解决所有退款需求，绝对不跑路。
站长网2023-11-22 14:00:46
0000