谷歌Gemini整合Veo 2视频生成模型,8秒720P视频轻松搞定
站长网2025-04-16 10:12:110阅

谷歌宣布又有一款 AI 模型将加入 Gemini,但这次它不仅仅是一个聊天机器人。
据外媒报道称,谷歌将其 Veo 2 视频生成模型整合进了 Gemini 应用程序和网站之中,让付费用户有机会使用谷歌“最先进的视频模型”创建短视频片段。
Veo 2 的工作原理与包括 OpenAI 的 Sora 在内的其他视频生成器类似 —— 输入描述场景的文本,然后生成视频。据悉,Veo2 可以最高生成 8 秒 720P 电影级视频,在运镜、文本语义还原、物理模拟、动作一致性等方面都做得都很好,且支持图片转视频功能。
谷歌方面表示,Veo 2 很好地掌握了现实世界的物理规律,尤其是人类的运动方式。谷歌发布的视频案例看起来确实不错,当然这也可能是他们精心挑选的结果。
Veo 2 暂定将被放置入模型下拉菜单中,不过谷歌也指出,他们仍在考虑整合这一功能的方法,因此入口位置可能会改变。
由于谷歌从今天才开始正式推出 Veo 2,因此可能还需要几周的时间,所有 Gemini Advanced 订阅用户才能在 Gemini 中用上 Veo 2。
需要说明的是,Gemini 的功能要普及至大多数用户,一般需要很长时间 —— 例如,谷歌在宣布推出 Gemini Live 视频功能后,大约花了一个月的时间,才真正普及至所有用户。
0000
评论列表
共(0)条相关推荐
iPhone14和 iPhone15用户现在可使用 Verizon 的路边援助服务
苹果今天宣布,iPhone14和iPhone15用户现在可以使用Verizon的路边援助服务。该服务由Allstate旗下的SignatureMotorClub运营,可在没有移动连接的地区提供帮助。要使用该服务,您需要运行iOS17.2或更高版本,并使用VerizonSIM卡。您可以通过iPhone上的“设置”应用访问该服务。0000Open-Sora悄悄升级 支持16秒视频生成和720p分辨率
Open-Sora在开源社区悄悄更新了,现在,该项目不仅支持长达16秒的单镜头视频生成,而且视频分辨率最高可达720p,能够处理各种宽高比的文本到图像、文本到视频、图像到视频、视频到视频以及无限长视频的生成需求。技术报告与模型架构:Open-Sora技术报告已在GitHub上发布,详细介绍了新功能和模型架构。作者团队对STDiT架构进行了关键性改进,提高了模型的训练稳定性和整体性能。站长网2024-04-26 00:47:350001共创之下,百度百家号的剧情内容正在「破壳而生」
共创之下,百度百家号的剧情内容正在「破壳而生」。如今的剧情短视频迈入了精品化的阶段。随着优秀作品的数量和质量不断提升,剧情内容赛道蓬勃发展,内容形式百花齐放,创作者与机构不断挖掘热门题材,为用户带来了优秀的内容体验。平台分账、合作品牌商单、冠名等多样化的变现形式为创作者带来了实打实的收益,加之平台政策的激励,一系列优秀的内容创作者不断涌现出来。0000妙鸭相机摸着石头过河
万众期待出现一个AI相关的C端爆款应用,大厂尚未找到方法论之时,妙鸭相机突然冒了头。在微信小程序,用户只需支付9.9元,上传20余张个人照片,就能拥有一个专属的数字分身,之后便可在系统提供的多种风格模板中选择生成指定写真效果。站长网2023-08-04 09:23:550000生成式 AI 将为银行业带来巨大变革 模型精调和应用可能需在本地进行
站长之家(ChinaZ.com)8月4日消息:自2022年底ChatGPT3.5发布起,生成式AI相关话题热度持续走高。触手可及的生成式AI技术真切影响着各个行业,以及每一个人的生活与工作。波士顿咨询公司(BCG)日前发布了《银行业生成式AI应用报告(2023)》。作为最早应用传统AI技术的领域之一,银行业也正积极试水生成式AI在行业内各领域和场景下的应用。站长网2023-08-04 17:15:090000