霉霉憨豆讲中文、蔡明阿姨秀英语，能让你说任何语种的AI神器火了

站长网2023-10-26 14:15:050阅

如果你平时玩微博、逛B站，最近肯定被一条“没有译制片腔调的翻译”视频刷屏过。

影片中，霉霉、特朗普、艾玛沃森、憨豆先生等一众外国友人操着流利的中文，口型语气声线无缝衔接，毫无违和；而以塑造“毒舌女王”角色著称的蔡明阿姨，则来了个如假包换的英文脱口秀，听口音还是伦敦市区的。

还没看的朋友可以点开感受一下：

搬运视频的博主表示自己真的被吓到了，完全一致的音色完美契合的口型，早已超越了真人配音所能达到的水准。评论区也炸开锅，网友们不敢相信自己的眼睛和耳朵，直呼外面的世界已经发展成这样了吗，别说老年人了，这谁看了不迷糊啊？

图片来自微博

影片原作者「johnhuu教英语」称，要达成这种“没有译制片腔调的配音效果”，需要同时符合三个条件：地道的口语翻译、克隆说话者的声音、替换嘴型。关于是怎么做出来的他却卖了个关子，表示自己是“先掌握了这种技术，但是制作起来还是非常麻烦”。

图片来自抖音

但是聪明的网友们很快发现，其实还挺容易的？

Johnhuu所使用的工具应该是HeyGen，一款在线AI数字人视频生成平台。它将人工智能技术融入一般的视频制作流程中，为用户快速生成定制化内容。目前可以做到创建自己的AI形象、制作虚拟主播、文字/图片转视频、声音克隆等。

这则风靡全网的影片似乎就是结合了HeyGen前不久更新的Video Translation（视频翻译）功能。只需上传一段视频，选择要转换的语言，就可以让视频里的「美国甜心」霉霉保留原本的声线语气，摇身一变成为“中文十级学者”了（Johnhuu亦有对翻译、字幕等进行剪辑调整）。

而在国外的社交网站上，大家也早已兴奋地玩出了花：

从硅谷到中国发展的连续创业者Jim Fields就在X对HeyGen大加赞赏，他尝试把他说的英语翻译成中文，又把他讲的中文翻译回英语，表示“效果还挺溜儿！说不定未来我也可以'说'广东话

HeyGen的Co-founder和CPO Wayne Liang录制了英文视频，来展示日语和法语版本。更有人一次性解锁了韩语、印尼语、意大利语、土耳其语、德语、英语 6 种语言，每一个都惟妙惟肖，切换自如，不输母语者。

图片来自X

于是互联网上，金发碧眼的网友们满世界纯熟地“你好、扣尼基哇”，亚洲的家人们优雅地微微一笑：“Bonjour、Hola”。语言的巴别塔似乎暂时消失了，毕竟，谁不想看到说着异国他乡外语的“世另我”呢？

所以，这个让大家如此着迷的HeyGen是个什么来头，怎么忽然就爆火了？

HeyGen是谁

其实，推出HeyGen的公司中文名叫诗云科技，成立于 2020 年底，总部在深圳。他们的愿景是“颠覆内容生产的方式，用 AI 生成来打造新一代的内容生产平台” ，希望代替摄像机，让用户以更为低廉的成本完成高质量内容创作。其核心技术是深度学习、生成对抗网络（GAN）、强化学习和3D建模等。目前已获得来自IDG资本、真格基金、红杉中国和百度的早期投资。

创始人Joshua Xu和Wayne Liang是美国卡内基梅隆大学的两位校友。其中Joshua曾是Snapchat 前 100 号员工，Monetization团队的 3 号工程师和Ads Ranking团队首席工程师，参与创建了Snapchat机器学习平台Barista。Wayne则曾任字节跳动美国的设计主管，负责企业软件和内部产品创新的设计。

图片来自HeyGen

从公司发布的招聘信息来看，团队成员人数不多且都很年轻，主要来自 Snapchat、谷歌、Pinterest、字节、腾讯和百度等国内外互联网大厂，在洛杉矶和旧金山湾区都分布有办公点。

图片来自诗云科技/Boss直聘

今年 4 月，Joshua在X上高兴地向大众宣布，HeyGen在推出短短 7 个月内就迭代了 30 多个版本，实现 100 万美元的年度经常性收入（ARR），达到一个重要的里程碑。

图片来自X

8 月份，步履不停的他又在社交平台官宣了自己的最新数字人影像「Joshua Avatar 2.0」：下面这两个视频片段都是百分百由AI生成的，展示了Joshua的虚拟形象和声音克隆。他说，这次HeyGen对数字人的视频质量进行了大幅改进，并微调了语音技术，可以完美模仿自己的独特口音和语言模式。效果之炸裂，又引发了一波小轰动，获得 300 多万观看量。

那么目前，我们用HeyGen都可以做些什么呢？

AI视频内容创作矩阵

登进账户控制面板，官方罗列了以下这四大主要功能。

图片来自HeyGen

首先，最受欢迎的就是制作自己的AI Avatar。你可以通过录制一段 2 分钟左右的清晰视频，短时间内创建自己的数字人形象，生成符合你声线的多语种视频。值得一提的是，正如Joshua 2. 0 演示的那样，这里的你并非像以往常见的AI换脸软件，只是生硬的面部在动，而是表情、口型、肢体动作都自然一致，足以以假乱真。

同时，用户还可以在线AI制作或上传图片生成影像，让你的照片动起来、并且会说话。推上有网友就先在 GPT- 4 里用DALL·E3 捏出皮克斯风格的卡通人物图片，再传到HeyGen分分钟搞定，制作小动画从此不求人。

图片来自X

，时长00:06

此外，对于短视频内容创作者来说，不再需要昂贵的摄影团队和布景、编辑制作，只需在平台内置成百上千的模版中选择背景、主题、虚拟主播，输入台词，点选声音，就能制作符合自己需求的视频片段。用户还可以根据喜好更改背景、添加动画元素、AI换脸换衣。可以说是市场营销、电子商务从业者的福音了。

HeyGen多种多样的内置模板，图片来自HeyGen

如果台词不会写也没关系，在最后这项AI Script里，只需要输入主题、风格，选好语种，HeyGen就能帮你撰写好几段专业级别的出来。甚至连主题也不确定，只是粘贴上链接也能生成文字脚本。

现在，HeyGen已经内置 300 余种声音，支持 40 多种语言，还实现了与在线设计工具Canva、ChatGPT Plugin等集成，允许用户在这些第三方平台随时调用它来创建视频。

价格方面，大家可以注册免费用户使用有限资源，也可以升级为每月29 美元的创作者用户或每月89 美元的商业用户。

图片来自HeyGen

在作家刘慈欣的小说《诗云》里，一个高级外星文明为了创作出能超越唐代诗人李白的诗歌，穷尽太阳系的大部分能源，列举了所有可能的字词组合。尽管他们借助先进的技术写出了令人印象深刻的诗作，最终还是选择认输，放弃侵略地球。

Joshua Xu和团队都很喜欢《诗云》这个描述「艺术与技术对抗」的故事，「诗云科技」也以此命名。在人工智能赛道拥挤，AIGC应用扎堆的今天，诗云科技推出的HeyGen作为新晋杀出来的一匹黑马，进入了大众的视野。也许用技术去升华艺术，正是这个年轻团队所追寻的。

后续它会如何发展，能否保持现在这样不斐的成绩，获得越来越多的用户群？对于网友们最关心的AI安全和监管，大家又有什么看法呢？欢迎留言告诉我们！

最后，我们也用DALL·E 3和HeyGen制作了小动画，点开看看再走吧~

霉霉憨豆讲中文蔡明阿姨秀英语能让你说任何语种的AI神器火了

0000

评论列表

共(0)条

相关推荐

站长资讯
视频编辑器CapCut：针对人工智能驱动的脚本生成工具
站长网2023-10-18 11:26:59
0000
越来越卷的剧集“售后经”，CP营业是“好生意”吗？
“磕到是一个太平常的事”，多年前刘烨的一则采访画面，成为各大CP评论区热门谐“音”表情包，CP超话作为最活跃的社群之一，已然成为剧集播出“晴雨表”，每逢大型盛典红毯，嗑学家更是迎来“过年”。
站长网站长资讯2025-01-12 11:44:57
0000
站长资讯
我使用GPT在15分钟内用零前端知识创建了一个名叫GitHub Searcher的Chrome扩展
要点:作者想开发一个右键搜索GitHub项目的Chrome插件，但前端知识有限。作者将想法简述给GPT，GPT生成了完整可用的代码。虽有小问题，但GPT生成代码基本实现了预期功能，仅需少量修改。没有前端经验，使用GPT在15分钟内就开发了一个Chrome扩展程序，你敢信吗?作者Lorain在dev.to上分享了他的开发经验。
站长网2023-09-11 12:12:30
0000
站长资讯
Adobe全力冲刺人工智能！员工：自掘坟墓
快科技7月26日消息，今年早些时候，设计行业巨头Adobe宣布，推出AI图像生成工具Firefly，帮助用户通过简单的文本描述修改或生成图形。对于Adobe这一积极备战人工智能的行为，一些Adobe员工表达出了明显的不满，认为这是在自掘坟墓”。
站长网2023-07-26 21:49:54
0000
余承东称2024年是原生鸿蒙的关键一年数百家合作伙伴启动鸿蒙原生应用开发
华为常务董事、终端BGCEO、智能汽车解决方案BU董事长余承东在一封全员信中表示，2024年是原生鸿蒙的关键一年。他呼吁加快推进各类鸿蒙原生应用的开发，并集中打赢技术底座和三方生态两大最艰巨的战斗。他强调要构建强大的鸿蒙生态，拉动中国电子工业崛起，开启终端未来大发展的新十年。余承东还提到目前已有数百家头部合作伙伴宣布启动鸿蒙原生应用开发，涵盖18个领域，鸿蒙新生态版图已基本完善。
站长网站长资讯2024-01-03 08:35:27
0000