通过 NVIDIA ACE 游戏为虚拟角色注入新生代 AI 活力

然而,玩家与 NPC 的互动仍然倾向于交易性的、脚本化的和短暂的,因为对话选项很快就会耗尽,只会推动故事向前发展。现在,生成性人工智能可以通过提高 NPC 的会话技能、创造随着时间的推移而进化的持久个性,以及实现玩家独有的动态反应,使 NPC 变得更加智能。

推荐:将NSDT场景编辑器加入你的3D工具链
3D工具集:NSDT简石数字孪生

通过 NVIDIA ACE 游戏为虚拟角色注入新生代 AI 活力

一代又一代的人工智能技术正在彻底改变游戏的构思、制作和玩法。游戏开发人员正在探索这些技术在制作过程中如何影响 2D 和 3D 内容创作管道。部分兴奋来自于在运行时创建游戏体验的能力,而使用早期的解决方案是不可能的。

随着游戏变得越来越复杂,不可玩角色( NPC )的创建也在不断发展。预先录制的台词数量增加了,玩家与 NPC 互动的选项数量也增加了,面部动画也变得更加逼真。

然而,玩家与 NPC 的互动仍然倾向于交易性的、脚本化的和短暂的,因为对话选项很快就会耗尽,只会推动故事向前发展。现在,生成性人工智能可以通过提高 NPC 的会话技能、创造随着时间的推移而进化的持久个性,以及实现玩家独有的动态反应,使 NPC 变得更加智能。

在COMPUTEX 2023, NVIDIA 宣布了 NPC 的未来 – 面向于游戏的 NVIDIA Avatar Cloud Engine (ACE)。NVIDIA ACE for Games 是一项定制的人工智能模型铸造服务,旨在通过人工智能驱动的自然语言交互将智能带给 NPC ,从而改变游戏。

中间件、工具和游戏的开发人员可以使用 NVIDIA ACE for games 在软件和游戏中构建和部署定制的语音、对话和动画 AI 模型。

利用人工智能基础模型的最新突破生成 NPC

Graphic showing modules of NVIDIA ACE for Games.
图 1 。使用 NVIDIA ACE for Games 通过云或 PC 定制和部署 LLM ,以生成智能 NPC

优化后的 AI 基础模型包括以下内容:

  • NVIDIA NeMo:提供基础语言模型和模型自定义工具,以便您可以进一步调整游戏角色的模型。根据需要,这些模型可以端到端集成,也可以任意组合。这种可定制的大型语言模型( LLM )支持适合游戏世界的特定角色背景故事和个性。
  • NVIDIA Riva:提供自动语音识别( ASR )和文本转语音( TTS )功能,以实现与 NVIDIA NeMo 的实时语音对话。
  • NVIDIA Omniverse Audio2Face:仅从音频源立即为游戏角色创建富有表现力的面部动画。 Audio2Face 为虚幻引擎 5 提供了 Omniverse 连接器,因此您可以直接向 MetaHuman 角色添加面部动画。

您可以通过 NeMo 模型对准技术为 NPC 带来活力。首先,使用行为克隆使基本语言模型能够根据指令执行角色扮演任务。为了进一步使 NPC 的行为与预期保持一致,在未来,您可以应用来自人类反馈的强化学习( RLHF )来在开发过程中接收设计师的实时反馈。

NPC 完全对齐后,最后一步是应用NeMo Guardrails,为 NPC 添加了可编程规则。该工具包可帮助您构建准确、适当、主题明确且安全的游戏角色。 NeMo Guardrails 本机支持 LangChain ,这是一个用于开发 LLM 驱动的应用程序的工具包。

NVIDIA 为各种规模的中间件、工具和游戏开发人员提供了灵活的部署方法。使 NVIDIA ACE 能够用于游戏的神经网络针对不同的功能进行了优化,具有不同的尺寸、性能和质量权衡。

ACE for Games 代工服务将帮助您微调游戏模型,然后通过 NVIDIA DGX Cloud 、 GeForce RTX PC 或内部部署进行实时推理。您还可以实时验证模型的质量,测试性能和延迟,以确保它们在部署前符合特定标准。

为游戏创建端到端化身解决方案

为了展示如何利用 ACE for Games 构建 NPC , NVIDIA 与Convai,一家初创公司,正在构建一个在游戏和虚拟世界中创建和部署人工智能角色的平台,以帮助优化 ACE 模块并将其集成到其产品中

Convai 创始人兼首席执行官 Purnendu Mukherjee 表示:“有了 NVIDIA ACE for Games , Convai 的工具可以实现所需的延迟和质量,使几乎每个开发者都能以经济高效的方式使用人工智能不可玩的角色。”。

Convai 将 NVIDIA Riva 用于语音到文本和文本到语音功能,将 NVIDIA NeMo 用于驱动对话的 LLM ,将 Audio2Face 用于语音输入的人工智能面部动画。视频 1 。 NVIDIA Kai ROS 演示展示了金,一个身临其境的 NPC ,以及一个使用最新 NVIDIA RTX 和 NVIDIA DLSS 技术建造的拉面店

如视频 1 所示,这些模块被无缝集成到 Convai 服务平台中,并被输入到虚幻引擎 5 和 MetaHuman 中,使身临其境的 NPC Jin 栩栩如生。由 NVIDIA Lightspeed Studios 艺术团队创作的拉面店场景在NVIDIA RTX Branch of Unreal Engine 5( NvRTX 5.1 )运行。场景使用RTX Direct Illumination( RTXDI )用于光线追踪照明和阴影,与 NVIDIA DLSS 3 一起实现最大性能。

游戏开发商已经在使用现有的 NVIDIA 生成人工智能技术进行游戏开发:

  • GSC 游戏世界欧洲领先的游戏开发商之一,正在其即将推出的游戏中采用 Audio2Face ,S . T . A . L . K . E . R . 2 :切尔诺贝利之心
  • 落叶,一家独立游戏开发商,也在使用 Audio2Face 制作中的角色面部动画索利斯堡,一款发生在火星上的第三人称科幻惊悚游戏。
  • 专注于人工智能的世代公司,如魅力. ai正在利用 Audio2Face 为他们的对话引擎中的动画提供动力。

3D建模学习工作室 翻译整理,转载请注明出处!

NSDT场景编辑器 | NSDT 数字孪生 | GLTF在线编辑器 | 3D模型在线转换 | UnrealSynth虚幻合成数据生成器 | 3D模型自动纹理化工具
2023 power by nsdt©鄂ICP备2023000829号