阿里图像生成视频模型I2VGen-XL代码发布

站长网2023-12-15 11:11:403阅

阿里在11月份发布了论文，宣布将开源I2VGen-XL图像生成视频模型。如今，他们终于发布了具体的代码和模型。这一模型可以生成没有大幅人物动作的视频演示。

I2VGen-XL模型分为两个阶段。首先是基础阶段，该阶段通过使用两个分层编码器来保证连贯的语义，并保留输入图像的内容。其次是优化阶段，该阶段通过整合额外的简短文本来增强视频的细节，并将分辨率提高到1280x720。

代码地址:https://github.com/damo-vilab/i2vgen-xl

为了优化模型，研究团队收集了约3500万个单镜头文本视频对和60亿个文本图像对。通过这些数据，I2VGen-XL模型可以提高生成视频的语义准确性、细节的连续性和清晰度。

阿里图像生成视频模型I2VGenXL代码发布

0003

评论列表

共(0)条

相关推荐

站长资讯
微软下放 AI 助手功能，如何在 Windows 10 上启用 Copilot？
微软公司于上周令人惊讶地宣布将Copilot引入Windows10。此前，Copilot仅限于Windows11，但现在即将推向前一代操作系统，该系统仍在超过十亿设备上运行。
站长网2023-11-20 10:11:14
0004
最新数据显示人工智能领域的失业率正在上升，但数字并不能说明一切
最近，ResumeBuilder对750名使用AI的商业领袖的报告显示，37%的受访者表示2023年技术取代了工人，而44%报告称2024年将因AI效率而导致裁员。然而，尽管有关AI激发的裁员报道，许多专家不同意ElonMusk关于AI将使人类达到「不需要工作」地步的观点。
站长网站长资讯2023-12-18 11:57:18
0000
小米员工有口福了：海底捞入驻小米食堂！
快科技1月7日消息，据媒体报道，近日，海底捞|企业火锅北京小米店开启试营业，为小米园区内上万名员工带来火锅用餐体验。据介绍，在小米公司的补贴下，该门店为小米员工提供专属优惠福利，火锅菜品价格参照临近门店执行88折，在产品上和园区外的海底捞火锅保持一致，菜单会及时更新，所有菜品都以半份菜为标配分量。另外，该店就餐区设有20多个大小不同的餐桌和2个包间，可同时容纳100多人就餐。
站长网站长资讯2025-01-07 21:38:15
0000
抖音创作者也有“会员制”，这个新玩法如何赋能内容与变现？
在直播礼物、短视频广告及直播带货之外，创作者还能依靠什么进行变现?12月22日，抖音在成都举办了首个抖音专属会员行业大会。会上，抖音对外介绍了专属会员业务的发展情况、未来规划等，还有多位创作者分享了专属会员经营的心得体会。
站长网站长资讯2023-12-27 18:23:47
0000
2024年以AI为中心的企业增长的11个数据预测
2023年主要集中在采用生成式人工智能和基础模型。然而，随着组织竞相将生成式人工智能置于工作流的前沿，它们意识到整理数据事务的重要性。尽管企业始终理解高质量数据在业务成功中的作用，生成式人工智能的崛起强化了其价值，确保它成为所有人关注的焦点。现在，随着我们进入2024年，这一年将带来更大规模的生成式人工智能故事，领先的行业专家和供应商分享了他们对数据生态系统不同方面未来几个月发展的预测。
站长网站长资讯2023-12-28 14:21:49
0002