HelloKitty • 2023-03-31 15:54
1450
本文由 量子位 撰写/授权提供,转载请注明原出处。
文章来源于:量子位(ID:QbitAI)
作者:萧箫
ChatGPT 彻底引爆了 AI 领域,也点燃了各赛道玩家的热情。
以虚拟交互体验为例,就已经有不少新产品冒头。
不仅像 Chat D-ID 这类以 ChatGPT 驱动的虚拟女友 bot 花样百出,就连游戏 AI NPC 也变得火热起来,这几天知名游戏公司育碧要推出 AI 工具 Ghostwriter 一事,更是引起了巨大关注。
不过这些都还只是用 AI 驱动单人 NPC 对话。
如果能用 AI 操控 NPC、甚至搭建出一个 AI 社会呢?
前不久,一个名为“活的长安城”的技术 Demo 引发讨论,其中 NPC 不仅全由 AI 操控,彼此之间还能互动:
要做的事也不会脱离性格和目标,如只想摸鱼翘班的捕快、立志当首席的舞女:
这场景,属实有点《西部世界》内味了!
但与《西部世界》不同的是,这些 NPC 没有预设剧本,也不会消除已有的“记忆”。
它究竟有何不同?又是如何运转起来的?
“活的长安城”,有何不同?
据上述 Demo 的发布方最新介绍,“活的长安城”是一个还在演进中的“AI 社会”,背后由一个名叫 GAEA 的技术系统驱动。
(之所以还在演进中,是因为它只运转了 30 天,更像是一个社会雏形)
而以“活的长安城”为代表的“AI 社会”具备以下特点:
. 包含一群身份多样、能互动的、受社会常识和反馈影响的 AI
. 这些 AI 的生活环境开放,能受交互反馈影响产生文明,反过来影响 AI 未来生活
这也导致在身处“AI 社会”的 AI NPC,与其他虚拟世界如游戏中的 NPC 有很大不同。
首先,与众多为剧情设计的 NPC 相比,AI NPC 有自己的目标和行动理由。
在不少游戏中,NPC 的目的只是引导用户走完剧情,即便用 AI 生成对话,这一目标也不会改变。
但“AI 社会”中的 NPC 不仅有各自的长期目标,当下也需要为生存等短期目标而考虑,换而言之,它们和人一样有需求,并根据性格和心情状态做出不同的行动。
此外,与其他游戏 NPC 不同的是,这些 AI NPC 还能“观察”其他角色的行动。
就像你走在大街上会观察路人一样,AI NPC 也会在一定范围内观察你和其他NPC。如果有人吵架、或是举止异常,他们还会化身吃瓜群众上来围观。
最后,相比其他游戏 NPC,这些 AI NPC 拥有社会常识,能“记住”看见和做过的事,并影响之后的行动。
例如舞女决定对路人出手援助,是因为她没有遇到过“受骗”的事情。如果她目睹或经历了类似事件,那么AI就会降低她援助别人的几率。
这些特点,也导致了“AI 社会”不需要预设剧本,就能让 AI NPC 自己碰撞产生故事,积淀到社会中后又能回馈到 NPC 身上,反过来影响 AI NPC 的行动决策。
听起来很有意思,但具体到技术上,会发现实现起来并不简单。
拆解 GAEA 两大核心系统
从公开架构来看,GAEA 分为灵魂系统和环境系统两个子系统。
这其中,灵魂系统相当于 AI NPC 的大脑和行动中枢,环境系统则包含“AI 社会”的社会常识和物理信息等,它们彼此之间会相互影响交互。
先来看看灵魂系统,它被分为“记忆”和“策略”两部分。
“记忆”又分为内部状态和事件经历两个模块。内部状态用于建模 AI NPC 做事的“动机”,包含各种实时变化的状态值,如有钱就想摸鱼,不开心就想吵架:
事件经历则包括 AI NPC 一路观察或亲历的事情,用于给 AI NPC 的行动决策提供参考。例如 AI 小偷在大街上偷东西被捕快抓住过,它下次可能就不会在捕快出现的场景实施盗窃。
“策略”则分为上层宏观决策模型和下层交互模型。上层模型是一个长序列策略模型,它有点像 AI 的大脑,能够基于“记忆”中的社会常识信息+当下的环境系统做出决断,相当于给 AI NPC 制定一个整体计划:
下层交互模型则是通过符号系统建模的多任务模型,负责将上层模型做出的宏观决策进一步拆解细分,把整体计划变成一步步实际行动。
再来看看环境系统,它被分为“社会环境”和“物理环境”两部分。
“社会环境”包含了两方面的内容。
一方面,AI NPC 之间通过交互和反馈生成的语言行为关系等信息,会被记录在这个系统里,持续影响 AI NPC 灵魂系统做出的行为决策;
(当然,灵魂系统驱使 AI NPC 做出的行动,也会反过来交互中对环境系统产生影响,形成系统自运转)
另一方面,它包含了运转“AI 社会”所需要的所有人类社会常识,例如带有人类社会含义的状态标签(快乐、希望、金钱等)就包含在这个库中,而社会知识和规则也纳入其中。
“物理环境”就是场景中的各种物理数据了,包括风景建筑和商品水果等实物的建模信息、以及其他 NPC 的物理建模数据等,让 NPC 知道能与哪些场景数据发生交互,并指引它们做出具体的行动。
但即便GAEA背后的技术原理已经透露,具体如何实现让 AI NPC“更像人”的效果,又是哪些关键技术提升了它的剧情生成细节,仍然是一个未知数。
带着这些问题,我们找到了 GAEA 背后的团队——超参数科技。
据其项目负责人张弛介绍,GAEA 综合了不同模型能力,研发周期比想象中要长,大致分为两阶段:阶段一是搭建出完整的迭代场景和技术框架,也就是 GAEA1.0;阶段二是着重提升 GAEA 的剧情生成和自然语言交互能力。
阶段一,团队主要依靠自研的 AI BOT 技术和长期实践积累的工程能力,一步步完成 GAEA 的技术选型,让虚拟场景“长安城”自运转起来。
这一阶段,不仅需要着重提升 AI NPC 的能力,包括丰富的行为表现和自然的语言交流等,来让它们看起来“更像人”,还需要不断改进技术方案和迭代路线,相当于将实验室的内容落地。在张弛看来,后者尤其难,不仅要考虑技术落地,还要具备从系统的角度思考整个 NPC 生态的产品思维。
他举例说,光是让 NPC 看起来“更像人”,涉及到的技术就不少。比如,让 NPC 根据昼夜等常识概念做出合理行动,涉及到模型对社会常识的理解与推理能力;给 AI 赋予“理想”和生存等现实目标,则要考虑建模 NPC 内在动机;而支撑 NPC 海量的行为表现,需要用到多任务强化学习等技术;而有效“记忆”信息提取,得通过特殊的编解码方式来解决……
阶段二,在系统已经能完整运转的基础上,团队引入了大语言模型来提升系统的生成效果。正如原理框架中展示,大模型提升了原有 GAEA 在目标拆解、AI常识推理和对话等模块上的能力,进一步提升系统的“转速”。
谈及下一步,张弛也做了小小透露,他说团队计划持续优化 GAEA 的技术细节,利用大模型去进一步提升 NPC 与真人交互的能力,以及整个生态的剧情生成能力,并对其他方向的 AI NPC 技术做一些预研布局。
当然,如何将 GAEA 输出到轻量化、可感知的产品上,建立合作机会,也是他们正在思考的方向。
公开资料显示,在推出 GAEA 之前,超参数科技已在“AI+游戏”领域取得成绩,包括率先在在 3D FPS 领域实现大规模商业化落地,AI bot 在多款千万日活的头部产品中稳定运营,已经部署到全球 50 多个国家及地区等。
AIGC 催生产业变革浪潮
AIGC 这波浪潮推动下,各行各业正在迎来新一轮 AI 变革节点。
正如比尔·盖茨在《人工智能时代已开启》文章中所言,AI 的到来将会极大地提升社会生产力,从而进一步改变人与人之间的交互方式:
整个行业都会围绕它重新定义。
一方面,AI 的到来正在不断地提升社会生产力。
以大模型为例,它正在改变很多行业的工作方式、未来甚至能极大地提升行业的工作效率。
另一方面,对于产业本身而言,AI 的出现又改变了人与人之间的交互方式,从而带来产品的新一轮爆发。
在红杉资本两位合伙人与 GPT-3 联合撰写的一篇名为 Generative AI:A Creative New World 的文章中,更是预测 AIGC 技术会如当年移动通信一样,诞生一轮“杀手级应用”。
简而言之,这些新技术的出现,不仅会给产品开发过程带来变革,催生出产品交互方式、乃至于产品本身的进化,甚至带来 AI 原生产品。
至于如何应对这波 AIGC 浪潮?有玩家选择 All in 新技术,开辟新场景;也有玩家质疑新技术应用前景,选择再观望一波。
超参数科技 GAEA 项目负责人张弛接受采访时表示:
随着技术迭代,市场的不断竞争,我相信大模型的调用成本一定会持续降低。
因此,现阶段该聚焦的还是如何在原有技术积累上用好大模型,做出完全不同以往的东西,给游戏或未来产品带来新的可能性。
活动报名链接:乘“云”而上 数智AI并行 用数据构建企业出海新路径
扫码关注公众号
获取更多技术资讯