HelloKitty • 2024-01-18 16:02
1746
本文由 科技云报到 撰写/授权提供,转载请注明原出处。
文章来源于:科技云报到
作者:科技云报道
当所有人都沉浸在与 ChatGPT 对话的乐趣中,一场静水流深的变革已然启动。
2023 年 11 月,比尔·盖茨发表了一篇文章,他表示,AI Agent 将是大模型之后的下一个平台,不仅改变每个人与计算机互动的方式,还将在五年内彻底改变我们的生活。
如果说大模型是未来水电煤一般的基础设施,那么 Agent 则是未来用户接触、使用 AI 的方式。
AI Agent 不再满足于仅仅作为“聊天对象”的角色,而是渴望成为能在真实世界里挥洒自如的“智能执行者”。
数据显示,过去两年间,针对 AI Agent 的研究投入增长幅度高达 300%。大模型市场的玩家们,似乎正齐刷刷地转向 AI Agent。
在国内,截止去年 11 月中旬,AI Agent 赛道发生融资事件 13 起,总融资金额约 735 亿人民币,公司融资均值为 56.54 亿人民币。
在国外,据外媒 MattSchlicht 数据显示,至少有 100 个项目正致力于将 AI 代理商业化,近 10 万名开发人员正在构建自主 Agent。
毫无疑问,AI Agent 正在成为大模型之后下一个爆发点。
值得探讨的是,作为一种巨大的技术变革,AI Agent 将如何改变我们的生活?国内外 AI Agent 的发展现状如何?AI Agent 落地的关键点是什么?
AI Agent:自主执行任务的“小助手”
去年 4 月份,斯坦福和谷歌的研究者共同创建了一个“西部世界小镇(Westworldsimulation)”。在这个小镇里,25 个 AI Agent 每天都在乐此不疲地散步、约会、聊天、用餐以及分享当天的新闻。
在这个实验中,AI Agent(智能体)在执行任务和互动上表现出了令人惊艳的自主性和智能性,由此引发了业界的高度关注。
事实上,这并不是 AI Agent 第一次出圈,其概念从出现到爆发,已经迈过多个阶段。
在单一 Agent 阶段,主要是针对不同领域和场景的特定任务,开发和部署专门的智能体。以 GPTengineer 为例,给它一个需求,其就可以把代码写个大概。
在多 Agent 合作阶段,是由不同角色的 Agent 自动合作完成复杂的任务。
例如在 MetaGPT 上,如果让其做一个股票分析的工具,它会把这个任务分别翻译给产品经理、架构师、项目经理等 5 个角色,模拟整个的软件开发中所有决策工作流。
不过,随着微软全新工具 AutoGen 的发布,AI Agent 很快翻开了新的篇章。
AutoGen 允许多个 LLM 智能体通过聊天来解决任务。LLM 智能体可以扮演各种角色,如程序员、设计师,或者是各种角色的组合,对话过程就把任务解决了。
与 MetaGPT 不同的是,MetaGPT 的角色模型是被定义好的,而 AutoGen 可以让开发者自己定义 Agent,还可以让他们相互对话。
这是一个新的且富有创造性的 Agent 框架。在 AutoGen 发布的两个星期内,星标量从 390 狂增到 10K,并在 Discord 上吸引了 5000 多名成员。
如果说 AutoGPT 拉开了自主智能体(Autonomous Agent)的帷幕,那么前文提到的“西部世界小镇”则开启了生成智能体(Generative Agent)之路。
生成智能体就像美剧《西部世界》中的人形机器人或《失控玩家》中的智能 NPC,它们在同一环境中生活,拥有自己的记忆和目标,不仅与人类交往,还会与其他机器人互动。
总的来说,AI Agent 是一个能够自主行动、执行任务的“小助手”,能够针对目标独立思考并做出行动,会根据给定任务详细拆解出每一步的计划步骤,依靠来自外界的反馈和自主思考,为自己创建 prompt 以实现目标。
比如,让 AI Agent 买一杯咖啡,它会首先拆解如何才能为你购买一杯咖啡并拟定代用某 APP 下单以及支付等若干步骤,然后按照这些步骤调用 APP 选择外卖,再调用支付程序下单支付,过程无需人类去指定每一步操作。
而目前基于 LLM 的 ChatGPT 给出的反馈,只能止于“无法购买咖啡,它只是一个文字 AI 助手”之类的回答。
这也就不难理解,为什么 AI Agent 会是大模型的下一个高地——大模型聚焦于处理语言相关的任务,它并不直接与现实世界互动,而 AI Agent 强调解决实际问题的能力和与环境交互的全面性。
AI Agent 加速落地
事实上,大模型还没有出现之前,一些企业就已在研究传统 AI 与 Agent 的结合应用。因此,AI Agent 在各领域的落地比大家预想得要快很多。
目前,海外已经在零售、房地产、旅游、客户服务、人力资源、金融、制造业等多个领域出现 AI Agent 架构与产品,例如:
在医疗领域,Agent 可以帮助诊断、治疗和监测患者。IBM Watson Health 是一个 AI 智能体,可以分析医疗数据,以识别潜在的健康问题并推荐治疗方案。
在金融领域,Agent 可以分析财务数据、检测欺诈行为并提出投资建议。嘉信理财(Charles Schwab)使用名为 Intelligent Portfolio 的人工智能智能体,根据客户的投资目标创建和管理投资组合。
在零售业务场景中,Agent 可以提供个性化推荐,改善供应链管理,增强客户体验。亚马逊的 Alexa 是一个 AI 智能体,可以推荐产品、下订单和跟踪发货。
在制造业,Agent 可以优化生产流程,预测维护需求,提高产品质量。通用电气使用名为 Predix 的 AI 智能体实时监控机器,以预测和防止设备故障。
在运输领域,自主 AI Agent 可以协助路线规划、交通管理和车辆安全。特斯拉的 Autopilot 有助于自动驾驶车辆,并帮助驾驶员停车、变道和安全驾驶。
不仅如此,在底层技术方面,AI Agent 也打下了不错的基础。
例如,OpenAI 开发的 GPTs,以及推出的 GPT-4Turbo 和可定制 AI Agent,提供了基础 Agent 的构建能力,如工具调用、基于知识库文件记忆能力等,使得 AI Agent 进入了另外一个新阶段,即人人都可以打造自己的 Agent。
但总的来说,AI Agent 技术还处于比较早期的阶段,主要在两个类型的场景中更容易落地:
一类是具有交互性质的场景。
例如,智能机器人和问答式交互,这与 AI Agent 的迭代性质天生匹配。在这种情境下,对于一些简单的任务,比如购买火车票或解决企业内部IT服务的问题,任务型机器人的应用效果较好,并且相对容易维护。
另一类是线性执行任务的场景。
例如,一家支付公司要求用户在开户时提交身份证明,在这种场景下,前台是单向的,但后台可以利用 AI Agent 执行,相较于原有的流水线,AI Agnet 更为高效。
AI Agent落地挑战
尽量理想很美好,但当前市场上的大多数 AI Agent,其实只是构建了一个基于特定知识库或专业数据的 Chatbot。这些智能体主要用于进行问答交互,如获取行业资讯、报告等,在程序联动和操作方面还有很大的提升空间。
在一些更复杂的场景中,现有的 AI Agent 技术只能做到辅助,无法完全实现自动执行。
这背后的原因有很多,包括技术能力、商业化路径、应用场景等,都会影响 Agent 的能力体现。
首当其冲的,依然是技术问题。
LLM 作为 AI Agent 的认知核心,其智能性在很大程度上决定了 AI Agent 感知环境、做出决策并执行适当行动的能力。但就目前而言,包括 GPT-4 在内的所有大模型,能力仍需提升。
同时,AI Agent 继承了 LLM 的一些问题,比如“幻觉”、“可解释性”等问题。此外,对于底层基础模块的质量和性能,包括调用图像识别等模型,也会直接影响到上层建筑的性能。
此外,Agnet 各个模块之间的交互和运行可能会产生许多中间结果和状态,这也带来了一些技术挑战。例如,处理中间结果的鲁棒性是一个问题,下层模块的性能和质量会直接影响上层模块的执行。
其次,AI Agent 的落地效果也受限于应用场景。
例如,在出行预订中,得益于丰富的 API 等问题,AI Agent 表现出色。而在如法律助手场景中,由于新知识的频繁出现和 API 的不完善,实际应用面临更多挑战。
这一点,从国内 AI Agent 纷纷生长于协同办公平台就可见一斑。
由于协同办公平台本身具备良好的 API 接口和插件体系,这使得将大模型集成到现有工具中变得更加容易。
同时,许多企业都在使用协同办公软件,这意味着广泛的用户基础可以加速大模型的迭代和优化过程,使其更好地满足用户需求。
最后,找到切入点以及好的商业模式至关重要。
AI Agent 爆发的一段时间,人们普遍认为补齐了大模型短板的 AI Agent 更具备实用性,将是大模型重要落地方向。
但就目前而言,这一路径的商业化存在诸多问题。拿游戏场景而言,目前收费主要来源于出售游戏装备、皮肤等方式,而 AI Agent 的价值无法体现在这些固有的变现途径上。
由于 AI Agent 落地效果未出现颠覆性的能力,C 端用户是否会为其买单无法得知,能否成为 AI 大模型从 C 端商业化爆发一个最核心应用方向,还需时间验证。
相对来说,B 端可能更适合 AI Agent 的落地。在 Agent 构建平台上,企业或将可以自己构建自己 RPA、CRM、办公 OA 等一系列管理软件;软件厂商也可以基于此平台构建软件为企业提供服务。
但这仍需要成本控制、投入预算、实现效率、安全管控等多方面严格及缜密的评估。
结语
无论存在多少质疑,时至今日,AI Agent 依然带来了诸多想象力。技术发展之路本就充满质疑与批判,科技变革对于任何一个企业与个体都是一场机遇,关键在于如何把握它。
扫码关注公众号
获取更多技术资讯