面壁智能,狂奔在Agent道路上

HelloKitty 2023-11-15 17:55

扫一扫 在手机阅读、分享本文

2398

本文由 GenAI新世界 撰写/授权提供,转载请注明原出处。

文章来源于:GenAI新世界

作者:薛良Neil

面壁最早是佛教用语,相传禅宗祖师达摩曾在中岳嵩山的石壁前静坐了整整九年,于石洞中留下了《易筋经》与《洗髓经》。

有关面壁的还有一个引人入胜的联想是《三体》中所谓“面壁计划”,面壁者试图完全依靠自己的思维拯救整个人类。

无论面壁智能的名字是受了上面哪种渊源的启发(或许两者都有),它都暗含着同一种意思,在经历了长久、隐秘又艰苦的蛰伏后,面壁的过程最终将带来巨大的突破,而以一个这样颇有玄奥气质的名词当做一家研究尖端科技公司的名字,也从侧面反应了其背后蕴藏的技术理想主义。

11 月 4 日,面壁智能的多模态大模型应用面壁露卡 Luca 正式面向公众开放服务,这是一个技术理想主义落地的节点。

面壁的新一站到来了。

面壁露卡 Luca

Luca 其实在今年 5 月就已开放公测,8 月时它更新到了 2.0 版本,这三个月的时间,根据面壁官方的描述,Luca 总共迭代了 85 次,也就是说几乎平均一天一次。

露卡 Luca 的名字也颇为有趣,它是 The Last Universal Common Ancestor 的缩写,意思是地球生命最后的共同祖先。现在地球上所有的生物都是从 Luca 演化而来的,科学家们推测,Luca 的形态或许像是细菌,生活在海底岩浆涌动的温暖湿润的水中,这样方便它获取各种矿物质和营养元素,从而促进随后几亿年的快速进化。

是的,相比于地球乃至宇宙的漫长,Luca 诞生的时间——科学家推测大概距今 3.8 到 3.5 亿年前就显得非常短暂了,而它身上包含着的生化结构,从 DNA 转换为 mRNA 再到蛋白质的转录和翻译机制,已经为一切生物的进化奠定了技术上的基础。

1.png

这恰好和大模型起到的作用相似。越来越多的人把预训练大语言模型称呼为基座模型,足够强大的基座模型将会加速人工智能从切实的落地场景和应用从中生长出来,从这个角度上说,Luca 的命名和面壁一样,都充满着一种浪漫的技术理想主义。

Luca 背后的基座模型名字 CPM 就异常直白了,它的全称 Chinese Pretrained Model,也就是中国的预训练模型。这是面壁完全自研的预训练大模型,它的第一个版本 CPM-1 在 2020 年 12 月发布。

光是从 CPM 这个略显草率的名字就能看出来,当时恐怕没有多少人对大模型之于人工智能的重要性有充分足够的认识。面壁当时所做的事情与其说是一家人工智能公司有目的性的刻意为之,倒不如说是一支顶级科研团队在前沿技术探索的过程中整理出的一个阶段性成果。

这支科研团队,正是清华 NLP,全称清华大学自然语言处理与社会人文计算实验室。

双轮驱动

实际上你根本不能用面壁这家公司成立的时间来反推 CPM 大模型的研发进度,毕竟 Luca 发布的时候面壁这个公司才成立十个月,而 CPM-1 发布的时间更是比面壁成立的时间早整整 20 个月。

CPM 大模型的开发是由清华 NLP 主导的,这个实验室的学术带头人孙茂松担任清华大学计算机系主任/书记长达十年,在人工智能领域有着深厚的影响力,他研究的领域——自然语言理解,恰好是大语言模型的理论基础。

孙茂松的学生,NLP 实验室的另一位老师刘知远副教授即是面壁智能的联合创始人,而面壁年仅 25 岁的 CTO 曾国洋则是刘知远的学生。在 NLP 实验室官网的新闻列表里直接将面壁智能称呼为“我组孵化公司”,他们彼此之间联系的紧密程度可想而知。

另一个值得一提的事情是,刘知远副教授同时还是清华基础模型研究中心的副主任,这个中心在今年 6 月刚刚成立,目的正是为了集中清华的各种资源以推动基础模型的突破。

因此,CPM 的开发,包括面壁智能的成立,从一开始就得益于清华的力量,你可以把面壁的成立理解成清华产学研结合能力导致的一种自然转化。

例子之一是面壁官网上 CPM-2 的发布被归属于“悟道”系列大模型——刘知远当时带领的悟道·文源团队是整个悟道项目的一部分,它的成果就是 CPM-2。

另一个例子则是面壁的种子轮融资规模达近千万之多,众所周知,清华系背景几乎是科技领域创业中一个金字招牌,这一点在大模型领域尤甚,而面壁的种子轮股东里就包括了智谱AI——另一家清华系背景大模型公司。

这种彼此关联、互相瓜葛的关系反应了清华在我国理工院校中十分独特而超然的地位,特别是人工智能领域,你甚至很难找到另外一家在技术、规模和资源上能够与之匹敌的大学。

根据我们了解到的情况,目前面壁智能的技术开发,尤其是面向大模型的最前沿领域,始终和清华 NLP 实验室保持着密切的合作关系,换而言之,同时有两架马车在面壁的内部狂奔,而某种程度上,面壁作为公司的形态可以更好地将NLP实验室的研究成果工程化、商业化,这是一种技术成果转化和组织形态融合上的飞轮效应。

Agent 赛马

当然了,如果你认为面壁只有 Luca 和 CPM 大模型这样的服务那就错了。市面上有不少清华系背景的大模型公司,它们的区别不仅体现在技术实力,还有技术路径的选择上。同样是大模型,每一家都有自己独有的“绝活”。

面壁的绝活名叫 AI Agent。从年中开始,AI Agent 这个概念变得异常火热,但实际上目前为止关于究竟什么是 AI Agent,业界还没有形成统一的共识。简单的解释是,你可以把 AI Agent 理解成一种智能体,它能够把复杂的问题逻辑拆解并执行,不再需要用户同大模型用 prompt 进行连续不断地多轮交互,它是没有实体化的个人助理,类似《钢铁侠》里的贾维斯,能够比所谓人工智能助理 copilot 做的更好、更全面。

OpenAI 对 AI Agent 同样关心,首席科学家 Ilya Sutskever 不止一次表达了对这个概念的兴趣,显然 OpenAI 内部也在攻关相关的问题。有人认为,现在的 ChatGPT 之所以把所有的调用工具都集中在页面上,其实就是针对 AI Agent 方向的尝试,用户用自然语言来完成包括代码、表格和数据在内的抽象处理以及多模态内容的生成,这种变化不能用简单的 UI 改变或工具集成来理解。

面壁在 AI Agent 领域则是推出了不同的三款产品。根据我们了解到的情况,AgentVerse、XAgent 和 ChatDev 这三款 AI Agent 实际上是面壁和 NLP 实验室内不同科研小组赛马的产物。

2.png

最新推出的 XAgent,按照面壁智能联合创始人、CEO 李大海的说法,它被定义为超强 AI 智能体应用框架,也就说说它能自行拆解复杂任务。面壁宣称 XAgent 的能力已经全面超越 AutoGPT。

AgentVerse 则顾名思义,类似一个大模型宇宙,李大海则称之为智能体通用平台,让每个 Agent 如同角色扮演一般加入其中并彼此互动。最早斯坦福大学和谷歌进行了这方面的探索,让一个虚拟小镇迎来了 25 个智能角色,AgentVerse 是面壁针对这种思路延伸出来的产品,现在已经迭代了多个版本,最新的更新是研究人员试图让 Agent 的行为不再 sequential ,即不再顺序执行,而是可以并行执行——这样一来 Agent 的行为就会更接近人类。

可以想见,这种平台能为心理学、社会学的研究带来极大颠覆,而它目前最切实的应用则还是在游戏领域,据说已经有国内头部的游戏团队同面壁进行过接触,试图把 AgentVerse 应用到相关游戏产品中。

ChatDev 则可以看作是一个用 Agent 技术自动化开发软件应用。面壁的这几个 Agent 产品在 GitHub 上总共收到了超过两万三千颗星,足以见得全球开发者对面壁在 Agent 技术上领先程度的认同。

浪漫与现实

三款 AI Agent 产品被面壁概括成三驾马车,也就是说面壁想要通过在 Agent 这种先进技术上的密集开发来引领整个人工智能技术路线,它的远景被李大海概括为 IoA,即 Internet of Agents。据悉这个概念是由刘知远设想出来的,它采用了类似物联网 IoT 的构词法,反应出了面壁对 Agent 的长远想象:在未来,万物都是 Agent,每个物品都通过 Agent 技术内置了对自己功能的智能化理解,这些理解通过互联网联系起来,最终引发人类生活方式的全面变革。

举例来说,一个冰箱将会知道自己储存了什么东西,多久过期,该如何根据不同的存储物品设置不一样的温度,在许多时候这些工作将会由冰箱自己完成(Agent 自己完成),人类不需要进行干预(类比到大模型的交互,就是用户不需要不停发出 prompt 指令)。

这种设想就和面壁的名字一样,带有一种浓郁的浪漫的技术理想主义气质,这种气质,在清华系大模型公司中格外少见。

比如 Agent 能力究竟能发挥多少,十分有赖于基础模型的能力。像上面提到的 Agent 不再顺序执行的问题,这对 Agent 逻辑拆分、归纳总结和执行能力提出了非常高的要求,这种要求的实现没有基础模型的强大能力的支持是不可想象的。再比如,对面壁这样的成长期创业公司来说,该如何在模型迭代、Agent 研发和应用落地取得精准的平衡,恐怕也是一个需要精准拿捏的问题。

“如果将 AI 智能时代类比移动互联网时代,大模型就相当于安卓系统,…… (Agent 技术)处于安卓系统更上层一个比较体系化的技术突破状态。”李大海在《中国企业家》杂志的采访中如此形容 IoA,这背后当然代表着面壁对于 Agent 技术的乐观判断。

市场也一定程度上认可这种乐观。4 月,面壁完成了数千万天使轮融资,那时它甚至还没有发布 Luca 的第一代版本。这种乐观,助推了面壁团队的扩张步伐。不算 NLP 实验室的相关人员,目前面壁有着百人的规模,占据了清华科技园大厦中整整一层楼,而在年初,面壁的规模还仅仅只有十数人,很快,有关 CPM 新版本的迭代更新也会推出,从而进一步完善面壁大模型 -AI Agent 的双重布局。

看上去,面壁由技术理想主义支撑的人工智能版图正在逐渐清晰。

据说达摩祖师决定北上弘法时不见舟船,被大江拦住了去路,最后靠着一根芦苇翩然过江,入嵩山少林寺开始了长达九年的面壁,结束静修后,达摩写下了一系列著作,其中《二入四行论》中有一句偈语,诠释了他面壁的心得。

心如墙壁,可以入道。

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章