HelloKitty • 2024-11-06 16:50
1026
本文由 松果财经 撰写/授权提供,转载请注明原出处。
文章来源于:松果财经
作者:再见CBB
号称中国“最像 OpenAI”的清华系 AI 大模型创业公司智谱 AI 下半年频繁登上新闻头条。
7 月底发布视频生成功能;9 月初以 200 亿元投前估值拿到数十亿元融资;10 月 21 日与高通达成端侧合作;10 月 25 日推出能够模拟人类操作手机的自主智能体 AutoGLM,以及懂方言懂情绪的情感语音模型;11 月 1 日宣布其领衔并联合多个行业内部资本成立的 Z 基金近期完成首关,用于投资大模型赛道其他创业公司。
由于技术指标领先,坚持做 next step 的产品,坚持开源,不少人惊叹智谱 AI 正在成为中国版的 OpenAI——甚至更开放(因为 OpenAI 拒绝开源)。
智谱 AI CEO 张鹏曾说:“智谱 AI 的特色就是对标 OpenAI 的全线产品,不是说人家做什么,我们就做什么,而是因为我们追求 AGI 的目标是一致的。”
两个巨头都在追求的 AGI 到底怎么影响现实生活?
AI 助理概念再次火爆,
为什么这次不一样?
从智谱 AI 此前引爆市场概念的 AI 助理说起,谈到 AI 助理,就不得不提 Siri。乔布斯曾经说过:
“Siri 属于人工智能,而不属于搜索。”
但乔布斯的才华没能延续,如今的 Siri 和 AI 助理不能说不像,只能说毫无关系。
它的迷失不是乔布斯的遗憾,而是移动互联网时代的人类探索 AI 助理的失败。
AI 带来了逆天改命的希望,ChatGPT 让梦想沸腾。尤其是 2023 年 4 月,AutoGPT 上线,宣称能够在用户完全不插手的情况下自主执行任务。
特斯拉前 AI 总监、Open AI 联合创始人安德烈·卡尔帕西兴奋地说,AutoGPT 是“提示工程的下一个前沿”。更有人称 AutoGPT 将会替代 ChatGPT。
然而,由于底层模型的推理能力不足,AutoGPT 最终也没能实现主动地识别和操作屏幕。它和茫茫多的“对话式 AI 大模型”一样,被困在一问一答的气泡中,没有自主操作的权力和能力。
逆天改命的角色又出现了,这就是海对岸最像 OpenAI 的智谱 AI ——旗下的 AutoGLM。
从评测画面来看,智谱 AutoGLM 已经能够精准识别并理解用户指令,无需用户手动操作示范,不受制于简单的任务场景或 API 调用,可替代用户在电子设备执行操作,可以自动完成:
点外卖、编辑评论、淘宝购物、朋友圈点赞、总结文章生成摘要等日常活动。
图源:数字生命卡兹克
同时,与其他的语言模型和AI助理不同的是,Auto GLM 具备了一定自我纠错能力。
据智谱 AI 团队介绍,基于自进化在线课程强化学习框架 WEBRL,AutoGLM 克服了训练任务稀缺、反馈信号稀少和策略分布漂移等网页智能体研究和应用难题,能够在迭代过程中不断改进、持续稳定地提高自身性能。
在智谱 AI 看来,理论上,AutoGLM 将来可以完成人类在电子设备上做的任何事。
只需要简单的语音指令,它就能够理解用户意图,自动调用工具,使用和人类相似的操作逻辑去操作手机,完成各种任务。
智谱 AI 将其称为“phone use”能力,有了 AutoGLM 的“phone us”,未来的手机应用将充满想象力,AI 技术也将真正惠及千万家。
从这个角度来看,AutoGLM 的出现是里程碑式的。
它的出现意味着,在整个 AI 革命的进程中,AI 将不再被局限在聊天框内,而是能够真正地接管人们手中的设备。看似遥不可及的 AGI,已经近在咫尺。
越开放、越智能:
距离人手一个“贾维斯”还有多远?
斯塔克的 AI 助手“贾维斯”似乎无所不能但市场上大多数的 AI 助理只是“更专业一点”的 ChatGPT,而且不让人放心。
是什么限制了它们的发展?
用智谱 AI CEO 张鹏的话来说,以初代 GPT 为代表的早期语言模型,“训练优势并不明显”。
直到 OpenAI O1 大模型、Claude3.5 大模型等强推理模型的出现,才让 AI 大模型应用从简单对话生成时代,进入到 Agent 执行操作复杂多步骤任务时代。
过往的 AI 大模型更注重交互,同时在图像、视频等特定领域提供部分功能,以实现多模态的交互。
而如今,大模型更注重理解和整合,即 Agent 能力——
以前的 AI 是创作天才,现在,它要能给人类的工作当牛马。
它要求模型具备独立思考、调用工具、完成目标的综合能力,在原有的模型基础之上,增加了规划、记忆、总结的工作流程。
因此,只有这一能力得到彻底的提升,才能使得AI助理更泛化、更实用的渗透到用户日常工作和生活中去。
同时,据研究机构 Gartner 预测,2024 年 1 月,在生产中接入 AI 助理的企业已经达到 21%,到 2026 年,超过 80% 的企业都会接入 AI 助理。
麦肯锡预测,到 2030 年前,它有望为全球经济贡献 7 万亿美元的价值,中国进一步释放生成式 AI 总效益的 1/3。
由此可见,AI 助理的需求仍然旺盛,而目前业界正在积极地对其进行布局和探索,正在努力地提高供给。
典型的例子有,Open AI 的 Agent,阿里的 Mobile Agent、腾讯的 App Agent、字节的豆包、荣耀的 MagicOS 9.0 操作系统、苹果的 Apple Intelligence 等。
从这个角度来看,随着 AI 助理渗透率的提高,AI 终将成为所有人都可以使用的基础生产要素。
彼时,所有的上层建筑都会重构,人类在工作和生活的协作方式、组织方式、商业模式都将迎来彻底的改变。
科技巨头们的“代理人战争”:
如何解决通往 AGI 道路上最大的阻碍?
事实上,不仅是智谱 AI,放眼整个 AI 行业,美国的科技巨头们都已经“转向”,开始加强自己在 AI 助理这一领域的产品力:
2023 年,微软开始尝试探索 Copilot 与办公软件的集成。今年 10 月,微软再次推出了 Dynamics365 中集成的 10 个自主 AI 助理,能够自动执行跨平台的超复杂业务,帮助企业节省时间和运营成本。
谷歌、Meta、Open AI 蜂拥而至,开始争夺这个市场。科技巨头们放缓了在模型参数,API 价格方面的内卷,转而开始加速布局 AI 助理,只是因为商业化形势急迫:
目前,顶流的 AI 大模型仍然保持着每年百亿美元级别的烧钱速度。
Open AI 预计:从 2023 年到 2028 年,公司将蒙受 440 亿美元的损失。如此巨大的投入,换来的却只有 34 亿美元左右的年化营收。
今年以来。更是有着许多大模型公司已经游走在并购、破产的边缘:Character.AI 被谷歌收购;AI 独角兽 Inflection AI 被微软收购;Stability AI 单季度亏损超 3000 万美元,一度传出“卖身”消息。
此前,“红衣大叔”周鸿祎自硅谷交流归来,发出了一句感叹:
“硅谷已经没有人在卖大模型了,大家都在卖产品。”
当硅谷的创业公司都已经开始考虑推出产品盈利,足以见得盈利对于 AI 公司的重要性。毕竟,当泡沫逐渐退去,不管是投资人还是用户,最终都要关注自己的投入是否能够值回票价。
而针对商业化这一问题,智谱 AI 也给出了自己的答案:“全产品矩阵”。
自 2022 年开始,伴随千亿级超大规模预训练模型 GLM-130B 的诞生,智谱 AI 就基于这一千亿基座模型开始了商业化布局。
如今,从底层通用模型,到与国产算力芯片的适配,再到多模态生成和 AI Agent 智能体,智谱已经打通了 AI 产业链中全流程的技术和商业闭环,从而推出了国产大模型中最全的产品矩阵,让更多的用户和企业能够在智谱的平台上找到适合自己的产品和服务。
2023 年以来,智谱 AI 与超过 2000 家的企业达成了合作,包括消费、制造、游戏、医疗、教育、文旅等多个领域的龙头企业,为 C 端提供个性化应用的同时为 B 端提供降本增效的方案。
图源:智东西
此前,博研咨询报告显示,截至 2022 年底,全球 AI 助理市场规模已达到约 450 亿美元,预计到 2027 这一数字将突破 1200 亿美元,复合年增长率高达 22%。
从这个角度来看,面对这一广阔的市场前景,智谱AI或许已经为所有的 AI 企业提供了一种思路,用 AI 助理在产业层面的全面推广,为企业带来营收的同时,让投资者拥有继续烧钱的动力,把 AI 这个美好的故事继续讲下去。
智谱 AI 今年曾公布首批 10 个商业案例,包括德勤中国、分众传媒、华泰金融、蒙牛、上汽集团、金山办公等。
但其想象力不止于此,比如在端侧,智谱 AI COO 张帆近日在硅星人 AI 创造者大会(ACC 2024)表示:
智谱在端侧投入巨大,很多高校背景的成员加入,我们保持务实的态度,但这些成果尚未广泛传播。
等到它们广泛传播了,也许外界才能真的被 AI 的能力震撼。
而如他所言,对智谱 AI 乃至整个大模型行业来说,“下一个阶段是与物理世界的连接,即具身智能的实现”。
这个过程不可避免的伴随着对手在减少,头部效应越来越明显。
“这是一个好的状态,大家的战略还是有差异化的,不必在同一个事情上低效的创造,而是可以有不同领域的创造反而是更好的。”
迭代越来越快,最终,大模型的终极竞争也许会在其充分成熟之前就到来。
扫码关注公众号
获取更多技术资讯