首页站长资讯1000+AI智能体复活，OpenAI版元宇宙上线？ ChatGPT+VR百分百还原「西部世界」

1000+AI智能体复活，OpenAI版元宇宙上线？ ChatGPT+VR百分百还原「西部世界」

站长网2023-08-21 09:23:252阅

游戏版的「西部世界」已然成为现实。

YouTube博主Art from the Machine正式发布Mantella，能够让「上古卷轴5」中的NPC们复活的全新AI Mod。

项目一经发布，在Reddit上掀起轩然大波。

通过ChatGPT、以及文本转语音工具xVASynth、语音识别模型Whisper直接让游戏中AI智能体拥有意识，进行自然对话。

值得一提的是，Mantella Mod支持1000多个NPC，以及20 种语言。

网友纷纷表示，绝对要改变游戏规则。

很多玩家在游戏里打怪升级什么的早就玩腻了。

可以想象，在VR模式下安装了这个Mod后，肯定有玩家就在「上古卷轴」里面找NPC聊天，一聊就是一整天。

升级是不可能升级的，这辈子都不会升级了，打怪什么的又难打。只有找NPC聊天才能打发游戏里的时间。

游戏里的老哥们各个都有自己的故事，说话又好听，超喜欢和NPC们在游戏里聊天的了。

有网友甚至觉得，这个Mod不仅仅是游戏，而是开启了一个人类和计算机交互新时代。

1000 NPC注入「灵魂」

过去的几个月里，Mantella一直在进行公开测试，作者在19日终于发布了这个Mod。

简单来说，这个Mod就是把「上古卷轴5:天际」里边所有的NPC都接入了ChatGPT GPT，让AI帮助原本只会来回移动的NPC真的活过来了。

这1000多个NPC全部都直接能语音互动，而且每个人都有自己独特的背景。

NPC能够记住你和他之前对话的内容，也知道他们自己所处的位置，游戏里的时间，以及玩家在游戏中他看到的操作，比如拾取了什么物品。

NPC的对话内容由ChatGPT生成，而在游戏内的语音实现则由一款名为xVASynth的AI工具实现。

一起看看，NPC们如何与人对话交流。

玩家:这些奶酪多少钱?

NPC:这些奶酪是我们这里的精品，需要10金币。你还有其他需要的吗?

玩家:麦当劳。

NPC:对不起，「上古卷轴」里没有麦当劳。

玩家:我抢走了的你的妻子。

NPC:我不信，我没有结婚，更别说有妻子了，你可能搞错了...

更有趣的是，NPC还会幽默回复你的对话。

NPC:如果你是在暗示，你假设是我的妻子或你没有妻子，我很抱歉听到这个消息。

其实，用AI让游戏角色更加鲜活，英伟达也在攻关。

还记得，老黄在今年的COMPUTEX大会上，推出了全新的定制AI模型代工服务 ——Avatar Cloud Engine （ACE） for Game。

在一个充满「赛博朋克」风格的拉面店场景中，玩家按下一个按钮，可以用自己的声音说话，然后店主Jin会进行回答。

Jin是一个NPC角色，但他的回答是由生成式AI根据玩家的语音输入实时生成的。

Jin还有着逼真的面部动画和声音，全部与玩家的语气和背景故事相符。

这个逼真人物角色的生成，使用了一个实时人工智能模型渲染工具Nvidia ACE。

老黄表示，这个游戏中的角色并没有预先设定。他们有一个典型的任务提供者NPC类型。

背后技术介绍

Mod制作者通过ChatGPT—xVASynth—Whisper，构成了一个「群活」NPC的技术框架。

Whisper能够识别玩家通过麦克风输入的语音内容，并且转化成文字，经由API调用ChatGPT对玩家说的话进行文字回复。

然后再通过xVASynth将ChatGPT生成的文字回复生成符合游戏角色特点的游戏内语音，和玩家直接进行语音交流。

而且整个流程的实现几乎没有成本，为一需要服一点点ChatGPT调用API的费用。大概玩一天需要几美分。

xVASynth

https://www.nexusmods.com/skyrimspecialedition/mods/44184

他可以根据游戏中某一个声音，来生成符合这个声音的游戏NPC配音台词。

xVASynth使用神经语音合成（Neural Speech Synthesis）来专门生成游戏中的NPC的语音对话。它是基于一个根据游戏中的角色语音数据单独训练的模型。

支持从文本到语音的转换（TTS）或者音频直接输入进行语音转换(V/C)。

通过这个工具，用户只要提供一小段特定的声音素材作为模板，就能使用文字来直接生成和模板风格一致的语音内容。

Mentella就是采用了ChatGPT生成NPC对话内容 xVASynth转化为游戏内语音的框架完成的。

xVASynth针对文字的语音转换，能让用户可以控制语音的很多细节，例如单个字母的音高和持续时间、能量、情感和风格，来突出角色所要表达的情绪和重点。

神经语音合成技术的使用可以让它产生自然的声音，现有数据串联的传统方法很难做到这一点。这也意味着可以在配音演员已经读出的内容之外生成全新的语音内容。

这样生成的语音就不会是一段「机里机气」的AI转述音频了，能让NPC的真实感和游戏玩家的沉浸感大大加强。

更吊的是它可以支持28种语言，并且可以使用同一文本提示在多种语言之间切换输出。大大方便了游戏制作者进行多语言版本的制作。

为了方便用户处理游戏中成千上万个不同的游戏语音，它还内建了一个3D语音嵌入可视化工具。

这个3D可视化UI也是由AI生成的，用户可以按游戏的NPC的属性对语音进行上色，比如性别，职业等等，让用户摆脱了传统通过时间轴来控制语音的方式。

现在xVASynth也已经上架Steam，可以让游戏开发者和玩家免费使用大部分功能。

Whisper

而为了完成语音交互，NPC除了自己发音，还必须要能识别玩家和他们的语音交流。

Mod开发者使用的是由OpenAI发布的语音转文字AI工具:Whisper。

OpenAI通过网络收集了超过68万小时的多语言和多任务监督数据训练出了Whisper。

使用如此庞大且多样化的数据集使得Whisper对口音、背景噪音和专有名词有非常强的适应能力。此外，还可以进行多种语言的转录和翻译。

Whisper采用的是一种简单的端到端的构架，通过Transformer编码器-Transformer解码器的形式实现语音的识别。

输入音频被分成30秒的块，转换为梅尔频谱图，然后传递到编码器。

解码器经过训练来预测相应的文本内容，并与特殊标记混合在一起，指示单个模型来执行语言识别、多语言语音转录和英语语音翻译等任务。

下载与安装

要求

硬件:目前还没有发现最低要求，但有报告称Mantella在运行2000个Mod的modlist时崩溃了。Mantella需要一定数量的硬件分配才能成功运行，如果这被其他硬件密集型mod占用，它可能会崩溃。

存储:安装所有语音模型时，Mod需要约17GB的空间。解压语音模型总共需要约32GB。

兼容性

- 已经确认，Mantella可与 FUS（将 skyrim_folder 指向 Skyrim）、Librum(将 skyrim_folder 指向 overwrite/root)和 Wildlands(将 skyrim_folder 指向 Wildlander/SKSE)Wabbajack mod 列表一起使用。

- 如果你安装了非官方的Skyrim SE版（USSEP），则需要在此mod之后加载Mantella

注意:由于 Mantella 会访问和写入「上古卷轴」文件夹中的文件，因此如果你将「上古卷轴」存储在「Program Files」（程序文件）中，则 Mantella 可能无法正常工作。请确保将其存储在此文件夹之外(例如 C:\Games\Steam)。

将此Mantella文件夹解压。

MantellaSpell.zip

该压缩文件的安装方式与其他 MOD 相同。如果你以前没有手动安装过模块，在模块管理器2的用户界面左上角有一个光盘图标，你可以指向MantellaSpell.zip压缩文件进行安装。

对于Vortex，你可以将压缩的MOD拖入Vortex面板。

xVASynth

- 通过

Steam（https://store.steampowered.com/app/1765720/xVASynth/）或Nexus(https://www.nexusmods.com/skyrimspecialedition/mods/44184)下载xVASynth。

- 为你可能遇到的所有或任何角色下载经过xVASynth训练的Skyrim语音模型。你必须通过Nexus Mods页面手动下载，或使用Nexus Premium自动下载，xVASynth中包含了Nexus Premium的API。

- 在 https://www.nexusmods.com/skyrimspecialedition/mods/44184?tab=files 的「可选」选项下，将压缩文件存储到一个文件夹中。

打开xVASynth，将文件夹中所有压缩的声音模型文件拖入声音面板。等待安装完成。

如果这种方法不适合你，你也可以手动将模型解压缩到正确的xVASynth文件夹中（xVASynth\resources\app\models\skyrim）。解压缩完成后，就可以删除压缩的语音模型文件了。

最后，具体操作步骤，可参考视频。

试过之后网友表示非常好，语音恰到好处，一点不违和，沉浸感爆棚。

也许是《上古卷轴》历史上最厉害的Mod!

这个网友跟了这个Mod很长时间，认为这个Mod直接让《上古卷轴:天际》变了一个游戏，未来也许所有游戏的交互方式都会发生改变。

等不及要马上爽一把了!

1000x2BAI智能体复活OpenAI版元宇宙上线ChatGPTx2BVR百分百还原西部世界

0002

评论列表

共(0)条

相关推荐

站长资讯
万达集团推出旅游景区AI导游“小丹” 基于大语言模型开发
万达集团宣布全国首个旅游景区AI导游“小丹”上线，数字人AI导游“小丹”由万达集团企业文化中心为贵州丹寨万达小镇量身打造，基于大语言模型开发。据悉，“小丹”的知识库是全网知识，除了景区介绍外，在游客闲暇时，小丹还可以开启闲聊模式。“小丹”可以同时面对成千上万个游客，而且能做到每个人“一对一”个性服务，随时唤醒，随时服务。
站长网2023-06-05 21:07:02
0000
站长资讯
腾讯推出ELLA大型语言模型适配器助力模型语义对齐与高效提示跟踪
站长之家（ChinaZ.com）3月12日消息:腾讯研发团队于3月8日在预印本平台arXiv发布了一项重要成果，推出了名为ELLA的大型语言模型适配器。这一适配器的推出标志着在扩散模型中配备大语言模型的新里程碑，为模型提供了增强的语义对齐能力。
站长网2024-03-12 10:06:13
0000
站长资讯
李想：理想L6明年交付有信心2024年总销量超过BBA
快科技6月13日消息，我们从理想官方获悉，在刚刚过去的2023年第24周（6.05-6.11），理想汽车的周销量再创新高，达到了0.84万辆，远超其他新势力品牌，超过了榜单中第二、三、四名的销量总和。截至6月11日，理想汽车本月销量已达1.19万辆。
站长网2023-06-13 23:54:05
0000
站长资讯
卡内基大学开源TOFU框架，帮助大模型遗忘隐私数据
要点:1、TOFU框架包含遗忘、数据集、评估等多个模块，提升大模型的安全性。2、TOFU数据集帮助深入理解大模型的遗忘过程，并提供全新的评估方案。3、TOFU的遗忘模块可以帮助开发者移除敏感数据，使大模型在行为上表现得好像从未学习过这些遗忘数据一样。
站长网2024-01-19 10:03:34
0000
站长资讯
纵观这两年的千元机手机市场，发现一个现象
纵观这两年的千元机市场，相信机友们应该也发现了一个现象。那就是——选择更多样了。现在各家厂商不仅会做偏向性能向的机器，同时主打质感颜值的千元机，也在不断变多。包括之前也有不少机友在问机哥，这些主打质感颜值的机子，用起来的体验到底怎么样vivo也发布了一台主打千元曲屏的vivoY78。机哥体验过后，发现，这机子用起来还真有点说法。vivoY78老规矩，先看外观。
站长网2023-05-24 04:12:29
0000