Stability AI 推出稳定视频扩散 API 插件引起争议
站长网2023-12-22 10:28:440阅
站长之家(ChinaZ.com) 12月22日 消息:Stability AI,以其稳定扩散文本到图像生成器而著称的公司,近日宣布推出新的基础图像到视频模型——稳定视频扩散(Stable Video Diffusion,SVD),并已在其开发者平台上通过应用程序编程接口(API)提供。
这一举措允许第三方开发者将该模型整合到他们的应用程序、网站、软件和服务中。
该公司在一篇博客文章中写道:“这一新功能提供了对专为各个领域设计的最先进视频模型的编程访问……我们发布此版本的目标是为开发人员提供一种有效的方法,将高级视频生成无缝集成到他们的产品中。”
虽然这一版本为希望生成AI视频的企业提供了新的选择,但也引起了一些担忧。此前,Stability AI因在名为LAION-5B的开源AI数据集上训练其模型而受到批评。该数据集被发现包含至少1,008个涉及儿童性虐待的视频实例,因而在本周被下线。
尽管存在争议,但Stability的新SVD API插件在视频生成方面提供了领先的选择之一,可以生成包括25个生成的帧和24个生成的帧在内的“2秒视频”, FILM插值,平均时间为41秒。
此外,Stability还计划为其视频生成器推出面向用户的网络体验,尽管尚未透露推出时间。该公司正在邀请用户加入等待名单,成为第一批试用该界面的用户。
值得注意的是,尽管存在争议,但Stability AI的开发者平台API提供对所有公司模型的访问,从稳定扩散XL文本到图像生成器到新的SVD模型。该公司还提供会员资格,帮助客户在本地托管模型。
0000
评论列表
共(0)条相关推荐
极氪官微发蔚来宣传图 官方回应:小编手误
今天下午,极氪汽车官微发布了一篇宣传自家产品极氪007的文章,然而却意外闹出了一个乌龙事件。原本应该配图的极氪007轿车图片,却错误地使用了友商蔚来汽车的产品ET7。这一失误立即引起了网友们的热议。对于这一尴尬的情况,极氪汽车官方迅速做出了回应。极氪智能科技CMO关海涛首先为极氪小编解围,他发文表示:“大家给极氪小编一个理解吧!在一起,才是中国高端纯电!大家一起加电吧!”站长网2024-02-22 16:08:500000AI配音技术刷屏!声音克隆+口型同步,这下真的是“全世界都在说中国话”了
没开玩笑,现在的AI技术,能让全世界都说中国话。继“AI孙燕姿”后,最近,有一条视频再次刷新了大众对于AI配音技术的认知。10月19日,B站UP主“johnhuu”发布了一条题为“这才是没有译制片腔调的翻译”的视频。视频一开头,霉霉正在用地道的普通话侃侃而谈。正当我惊讶于“霉霉什么时候中文这么标准了”的时候,才发现这是AI配音的效果。站长网2023-10-24 21:27:220001轻量级代码库分析工具ctoc开源
ctoc(CountTokensofCode)是一个轻量级工具,用于分析代码库的令牌级别信息。它是基于gocloc的,具有极快的性能。这种工具允许开发者更深入地理解他们的代码,特别是在处理大型代码库时,它可以帮助开发者更有效地定位和解决问题。站长网2023-10-08 11:29:570000阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用
阿里开源大模型,又上新了~继通义千问-7B(Qwen-7B)之后,阿里云又推出了大规模视觉语言模型Qwen-VL,并且一上线就直接开源。具体来说,Qwen-VL是基于通义千问-7B打造的多模态大模型,支持图像、文本、检测框等多种输入,并且在文本之外,也支持检测框的输出。举个例子,我们输入一张阿尼亚的图片,通过问答的形式,Qwen-VL-Chat既能概括图片内容,也能定位到图片中的阿尼亚。站长网2023-08-26 17:26:150001复旦MOSS模型:接下来会推出算力更大的MOSS模型
据上证报报道,复旦大学MOSS系统负责人邱锡鹏表示,截至目前,MOSS后台已经收到几百家企业的使用申请,其中多数是中小企业,涵盖传统行业、智能信息服务、金融、医疗、教育等领域。此外,目前,MOSS模型的主要功能是帮助企业以更低的成本将大模型应用在具体领域中。邱锡鹏还透露,复旦将计划推出算力更强、推理能力更强的MOSS模型。站长网2023-06-01 15:54:540001