AI 初创公司 Pika 募集 5500 万美元资金,推出 AI 驱动视频编辑平台
站长之家(ChinaZ.com) 11 月 29 日消息: Pika 是一家创造 AI 驱动平台以编辑和从标题及静态图像生成视频的初创公司,今天宣布在 Lightspeed Venture Partners 领投的融资轮中筹集了 5500 万美元。此轮融资还得到了 Homebrew、Conviction Capital、SV Angel、Ben's Bites 以及包括 Quora 创始人 Adam D’Angelo、前 GitHub 首席执行官 Nat Friedman 和 Giphy 联合创始人 Alex Chung 在内的知名天使投资者的参与。
图片来自 Pika
这笔新资金仅在 Pika 从隐蔽状态浮出水面的六个月后到来,并与 Pika 早期访问版本「Pika 1.0」的发布同时进行。这是一个新的视频工具套件,引入了一种能够以多种风格编辑视频的生成式 AI 模型,比如「3D 动画」、「动漫」和「电影」。
Pika 在今晨其网站上发布的博客文章中写道:「视频是娱乐的核心,但到目前为止,制作高质量视频的过程仍然复杂且资源密集。当我们六个月前开始 Pika 时,我们希望推动技术的边界,设计一种未来的视频制作界面,让每个人都能轻松使用。自那时起,我们很自豪地将 Pika 社区发展到了 50 万用户,他们每周都在生成数百万视频。」
Pika 由前斯坦福大学人工智能实验室的博士生 Demi Guo 和 Chenlin Meng 共同创立。在斯坦福大学学习之前,Guo 曾在 Meta 的 AI 研究部门担任工程师,而 Meng 则共同撰写了多篇与生成式 AI 相关的 AI 研究论文。
Pika 的竞争对手包括 Runway 和 Stability AI 等提供生成式 AI 视频工具和模型的公司。但有了 Pika 1.0,Pika 希望通过几项差异化功能来提升其竞争水平。
例如,Pika 1.0 附带了一个可以延长现有视频长度或将它们转换为不同风格的工具,比如从「实景动作」到「动画」——或扩展视频的画幅或宽高比。另一个模块使用 AI 编辑视频内容,例如更改某人的服装或甚至添加另一个角色。
值得注意的是,Lightspeed——也是 Stability AI 的投资者——对该平台充满信心,即使像谷歌和 Meta 这样的科技巨头也在暗示他们正在开发用于视频的生成式 AI 工具。
Lightspeed 的 Michael Mignano 在一份新闻稿中表示:「正如其他新的 AI 产品对文本和图像所做的那样,专业质量的视频制作也将通过生成式 AI 实现民主化。我们相信 Pika 将领导这一转变。考虑到他们在早期对创意的热情和令人印象深刻的技术基础,Pika 团队似乎注定要改变我们所有人视觉分享故事的方式。在 Lightspeed,我们非常兴奋能够支持他们的使命,让任何人通过视频实现他们的创意愿景,并很高兴能够与其他处于 AI 前沿的出色投资者一起投资。」
Pika 的快速增长反映了对各种类型生成式 AI 的持续强劲需求——从 Midjourney 和 DALL-E 3 到 ChatGPT 等工具。
根据 IDC 的最新报告,预计生成式 AI 投资将从今年的 160 亿美元增加到 2027 年的惊人 1430 亿美元。虽然生成式 AI 在 2023 年只占 AI 总支出的 9%,但该公司预计这一比例将在五年内增加到 28%。
这些支出可能是有合理的。一项最近的调查(尽管只针对英国用户)发现,Z 世代正在接受生成式 AI,有四分之三(79%)的 13 至 17 岁的青少年报告使用了包括 ChatGPT 和 Snapchat 的 My AI 在内的生成式 AI 工具、应用程序和服务。
然而,Z 世代并不一定在为生成式 AI 付费。而拥有最大资金储备用于投资它的企业客户,在部署某些形式的技术时遇到了障碍。
O'Reilly 的 2023 年企业中生成式 AI 报告显示,许多企业 AI 采用者(26%)仍处于试点生成式 AI 的早期阶段,并且对技术目前和未来可能存在的潜在挑战感到深切的担忧——包括意外结果、安全性、公平性、偏见和隐私。寻找商业用例的困难和对法律问题(如谁拥有 AI 生成输出的版权)的担忧正在阻碍生成式 AI 的发展,报告暗示,同时也受到构思不佳和执行不当的 AI 解决方案的困扰。
在游戏开发中,如何平衡 GPT-3.5 和 GPT-4 的成本与性能?
【CSDN编者按】在成本允许的条件下,从性能方面考虑自然优先选择GPT-4;但考虑到游戏成本,适当“降级”到GPT-3.5似乎也在情理之中。那么,作为一名游戏开发者而言,具体要如何抉择呢?站长网2023-11-20 17:05:330000智谱AI推出第三代基座大模型ChatGLM3 智谱清言具备代码交互能力
智谱AI在2023中国计算机大会上发布了第三代基座大模型ChatGLM3及相关系列产品。ChatGLM3经过深度优化,在中英文公开数据集测试中表现优秀,其中MML提升36、CEval提%、GSM8K提升179%、BBH提升126%。ChatGLM3实现了多模态理解能力、代码生成和执行、网络搜索增强等新功能,并通过自研的AgentTuning技术提升了智能规划和执行能力。站长网2023-10-28 07:49:280000通过这些代码,PyTorch团队让Llama 7B提速10倍
要点:PyTorch团队通过优化技术,在不到1000行的纯原生PyTorch代码中将Llama7B的推理速度提升了10倍,达到了244.7tok/s。优化方法包括使用PyTorch2.0的torch.compile函数、GPU量化、SpeculativeDecoding(猜测解码)、张量并行等手段,以及使用不同精度的权重量化,如int8和int4。站长网2023-12-05 16:18:460000麻省理工推出AI工具PhotoGuard 对抗生成式AI模型
近年来,大型扩散模型,如DALL-E2和StableDiffusion,因其生成高质量、逼真的图像以及执行各种图像合成和编辑任务的能力而受到认可。但是,人们对用户友好的生成式AI模型的潜在滥用也越来越担忧,这些模型可能会导致不适当或有害的数字内容的创建。例如,恶意行为者可能利用公开分享的个人照片,通过使用现成的扩散模型,出于恶意目的对其进行编辑。站长网2023-08-01 16:32:310000威联通推出 ARM 架构 AI NAS-TS-AI642:加速 AI 图像识别及智能监控应用
站长之家(ChinaZ.com)8月9日消息:威联通今天宣布推出了新一代AINASTS-AI642。TS-AI642采用了搭载6TOPSNPU的ARM8核处理器,非常适合于AI图像识别和智能监控应用。图片来自QNAP站长网2023-08-09 17:18:240000