首页站长资讯Pika 1.0首测秒杀Gen-2！网友抢先体验电影级炸裂效果，背后技术细节首公开

Pika 1.0首测秒杀Gen-2！网友抢先体验电影级炸裂效果，背后技术细节首公开

站长网2023-12-10 09:27:263阅

Pika1.0正式上线后，拿到内测资格的网友们已经玩疯了!

有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。

以往，因为一致性的难题，用AI视频很难做出优秀的动漫作品。但是Pika1.0，实在是太给人惊喜了!

更令人震惊的是，作者表示，这是100%用文本到视频生成的。

还记得半个月前，这家有斯坦福AI Lab博士创办的初创公司Pika，发布的第一个产品瞬间成为顶流。

不仅能够生成3D动画、动漫、卡通和电影，甚至可以实现风格转换、幕布扩展等重磅能力。

如今，许多网友到手体验后，纷纷觉得太哇塞了。

与此同时，Pika官方账号公布了自家的最新研究。这是Pika1.0发布产品以来，这家公司首次对外披露技术细节。

最新研究中，提出了一种DreamPropeller方法，能够将文本到3D的生成速度提升4.7倍。

网友实测，皆为经典

接下来，先来一起看看，广大网友们的创意。

比起Runway的Gen-2，Pika1.0在让人物动起来时的一致性非常稳定。

电影级效果，堪称动漫界的「宫崎骏」

Pika1.0非常擅长动漫风格的动物，看看这些不同场景中的老鹰就知道了。

看得出，宫崎骏画风非常浓郁。

还有这种漫威风格的小人模型，让他们动起来真的像是「复仇者联盟」。‍

还有形单影只的白天鹅，在波光粼粼的湖中嬉戏，再游到岸边，好像在找回家的路。

就连美版「机器人总动员」动画的科幻风，呈现的也是淋漓尽致。

一朵含苞待放的花朵。‍

如下这个例子是Pika自己做的丛林中兔子士兵的电影级效果，并给出了提示（拿到内测资格的网友可试）

1. Cinematic， extreme close-up of a bunny soldier in a jungle，3D rendering

2. Cinematic， back-view long shot of a bunny soldier exploring a giant carrot in the jungle，3D rendering‍

疯狂动物城、狮子王、熊大熊二混版动画。

网友做了一个电影预告片，就连名字都想好了「金刚哥斯拉:新帝国」。

爱因斯坦和他的实验。

真人变身，泰坦尼克号被恶搞

还有一位自称「AI级导演」做出的真人演示效果，简直绝绝子。

戴上帽子，穿上羽绒服，服饰的搭配与人的身体契合度，毫无违和感。

还可以把周边的物体变成松柏，还能把自己变成北极熊，简直可爱到爆。

还有「泰坦尼克号」重制版，女主Rose直接变成熊猫，和男主Jack在一起牵手的画风，你细品...

‍‍再来看个真人变身的效果，还有二次元小姐姐。

AI魔法棒，一键替换

用AI「修改区域」，能够把所有背景，甚至包括主体的衣服能够换成一致的圣诞的风格。

还有网友尝试了这一替换功能，把海边的啤酒，瞬间变成了可乐。

具体实现效果，Chase Lean给出了一个教程，只需要3步过程。

首先需要生成一个视频，先让Midjourney生成一张海边Corona啤酒的图片，然后将其做成视频。

第二步:单击「编辑」，然后单击「修改区域」。

第三步，告诉Pika你想用什么来代替它，比如可口可乐。

画布扩展，超凡脑洞

图像画布扩展能力，其实我们也见到了许多像MidjourneyAI图像生成工具已经实现了。

而Pika1.0不仅能开出脑洞，还能让画面动起来。

就看这雅典帕特农神庙，外画出的景色更加凸显这座建筑的壮观。

还有橄榄树、游览古建筑都能暗藏各种惊喜。

你可以录一段视频，Pika能够直接想象出背景。

下面这个网友使用文本提示创建了第一个视频，然后扩展画布几次，获得了第二个视频。

初始提示是:A beautiful princess， standing on the castle wall，3d animation

还有网友做出了，演唱会级的音乐视频，不过不得不承认，还有些不足的地方。

，时长01:28

Pika1.0背后技术

看到这么多惊艳的效果，或许许多人更想了解一些关于Pika1.0生成的技术细节。

这不，官方刚刚公布了一篇论文，是由斯坦福大学和Pika Labs联手共创。

以往，通过分数蒸馏，比如DreamFusion、ProlificDreamer等模型，进行文本到3D的生成质量虽高，但运行时间可能长达10个小时。

最新论文中，研究人员提出了一种基于分数蒸馏的加速方法——DreamPropeller，能够将现有方法的速度提高4.7倍。

论文地址:https://arxiv.org/pdf/2311.17082.pdf

DreamPropeller整体架构如下图所示。

在每次迭代（k次）的开始，初始化一个由3D形状(用绿色表示)组成的窗口，然后，这些形状被分发到p个GPU上进行并行计算，在GPU上并行计算形状的SDS/VSD梯度。

然后根据公式（9）中的规则收集这些梯度，并使用这些梯度对形状进行更新。

窗口向前滑动，直到该时间步的误差不小于阈值e，阈值e根据窗口的平均/中值误差进行自适应更新。

另外，在VSD的情况下，研究人员会在所有GPU上保留LoRA扩散的独立副本，这些副本会独立更新，无需额外通信。

如下是应用DreamPropeller的代表性示例。

最新框架以并行计算换取速度，在保持生成质量的前提下，应用于DreamGaussian和ProlificDreamer时，速度提高了4倍以上。

在DreamPropeller完成时，基线版本的外观和几何效果明显较差。

如下是与其他模型的可视化比较。使用DreamPropeller的方法能以更短的运行时间实现同样高质量的生成。

对DreamFusion图库中的30个提示进行量化评估。运行时间以秒为单位。最新研究的方法达到了具有竞争力的质量，同时速度提高了4倍以上。

下一个视频生成顶流

对于Pika1.0的诞生，让全网热血沸腾，而它或许成为下一个视频生成的顶流。

有人统计了Discord上最大的人工智能产品，以及它们在平台范围内的规模。

如下是按邀请页面流量排序的十大人工智能应用程序，Midjourney位列第一，Pika排在第二。

在排名前十的应用程序中，有4个是图片生成应用程序，3个是语音/歌曲生成应用程序，2个是视频生成应用程序。

按流量计算，图片占了前10名流量的74%，其次是视频8%，语音/音乐6%。

Pika1 0首测秒杀Gen2 网友抢先体验电影级炸裂效果背后技术细节首公开

0003

评论列表

共(0)条

相关推荐

站长资讯
长虹宣布将AI大模型在智能电视落地应用计划6月全面公测
长虹公司宣布，正式开启人工智能电视2.0时代，兼容科大讯飞星火等多个AI大模型的“超级大脑”率先在智能电视应用落地，并已进入内测阶段。长虹表示，搭载AI大模型的生成式人工智能电视能更好地理解用户的指令和意图，快速响应并实现用户意图，使得操作更加便捷。其理解能力将呈几何倍数提升，“知识面”也将显著扩大。
站长网2023-05-09 16:04:20
0000
站长资讯
阿里全面拥抱鸿蒙旗下新增11款应用启动鸿蒙原生应用开发
进入第二发展阶段的鸿蒙生态，正在以如火如荼之势快速开疆拓土。3月14日，阿里旗下多款应用与华为举行鸿蒙合作签约仪式，宣布将基于HarmonyOSNEXT鸿蒙星河版，启动闲鱼、1688、飞猪、饿了么、盒马、菜鸟、点淘、淘宝特价版、大麦、淘票票、灯塔专业版共11款App的鸿蒙原生应用开发。
站长网2024-03-14 23:13:22
0000
站长资讯
德国反垄断负责人：人工智能可能会增强大型科技公司的主导地位
站长之家(ChinaZ.com)10月10日消息:德国卡特尔办公室主席AndreasMundt警告称，人工智能可能会增强大型科技公司的市场实力，监管机构应警惕任何反竞争行为。Mundt的评论强调了监管机构对科技巨头的担忧，这些公司拥有大量用户数据，可能在智能家居、网络搜索、在线广告、汽车和许多其他产品和服务中使用的新技术中获得竞争优势。
站长网2023-10-10 16:08:37
0000
站长资讯
第一批因AIGC裁掉自家员工的老板该后悔了？
自2022年11月30日推出后，ChatGPT受欢迎程度迅速飙升。2023年3月，Shopify成为首批采用ChatGPT生成移动产品推荐的企业之一，比一些大公司和CRM公司如Salesforce更为激进。
站长网2023-07-26 18:04:16
0000
小红书连夜招聘英文内容审核员此前老外疯狂涌入
站长之家（ChinaZ.com）1月15日消息:近日，随着TikTok剥离禁令生效日期的日益临近，全球众多用户纷纷开始探寻新的社交媒体平台。这一趋势意外地为小红书带来了前所未有的流量激增，使其迅速跃升至美国AppStore下载榜首位。
站长网站长资讯2025-01-15 17:00:21
0000