百度:不做大模型王者,要做AI世界的基石

zhaoling 2024-04-18 17:01

扫一扫 在手机阅读、分享本文

862

本文由 罗超Pro 撰写/授权提供,转载请注明原出处。

本文来源:罗超Pro

作者:罗超

讨论国产 AI 大模型,百度是绕不过的话题。作为中国 AI 产业的扛旗者,百度在 AI 技术上拥有足够高的话语权,其推出的文心大模型被视作是最有机会追赶 GPT 的国产基础大模型。不过从最新的发布来看,百度在 AI 大模型这件事上,似乎并不想过度地卷参数,而是将重心放在了落地上,给人们提供开发 AI 应用的工具,则是百度推动 AI 大模型落地的关键。

4 月 16 日,Create 2024 百度 AI 开发者大会在深圳举行。从现场人流量可以看出,AI 依然是科技圈顶流。现场嘉宾中,有企业高管,有技术人员,有销售人员,有高校学生……所有人都在学习 AI 大模型,都在寻觅 AI 大模型的机会。

1.png

自去年以来,诸多热门 AI 大模型技术持续占据媒体头条,对普通人来说却遥不可及。当所有人都在仰望神坛上的 AI 大模型技术时,百度决定要让 AI 技术走下神坛,这正是李彦宏的演讲主题《人人都是开发者》所表达的愿景。

李彦宏没有过多地介绍文心大模型的技术优势,而是将主题围绕开发者,将更多时间给到了“工具”。

为什么要让工具成为这届开发者大会的主角?用李彦宏的话说是:"大语言模型本身并不直接创造价值,基于大模型开发出来的 AI 原生应用才能满足真实的市场需求。”根据过去一年的实践,踩了无数的坑,交了高昂的学费后,百度积累了基于大模型开发 AI 原生应用的思路,并带来三大 AI 开发神器:智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder、各种尺寸的模型定制工具 ModelBuilder。

2.png

三大 AI 开发神器

让“人人都是开发者”不是梦

在 2023 年 10 月,百度发布了文心大模型 4.0 版本。为了推动 AI 大模型落地,李彦宏提出了 AI 原生应用概念,他认为大模型技术和 AI 原生应用是一体两面、共生共存:前者的理解、生成、逻辑、记忆四大能力的进步是 AI 原生应用不可或缺的生存土壤;反过来,如果没有 AI 原生应用在各个场景的落地、普及,大模型技术也就失去了现实意义。

简单地说,AI 原生应用之于大模型技术,如同 App 之于移动互联网。所有应用都值得用 AI 重做一遍,在 AI 大模型上也将长出截然不同的新应用。

然而,对于绝大多数企业与个体来说,开发 App 本身就是高门槛的事,基于大模型开发 AI 原生应用,门槛更是指数级上升:大模型技术新,人才本就奇缺,大模型技术还高度复杂、且日新月异,开发难度更高,很多学计算机类专业的程序员在未经专业培训时都难以掌握。

提供专门的 AI 原生应用开发工具就成为大模型落地的燃眉之急。2023 年 10 月提出 AI 原生应用概念时,百度就意识到这一问题,且提出了要让AI原生应用开发更敏捷的目标。随着代码大模型技术本身的快速升级,百度如今推出了可以让人人成为开发者的系列 AI 开发工具。

1、AgentBuilder 是人人可用的智能体开发工具,用户不需掌握任何编程技术,即可用“对话式交互”的模式,用自然语言输入指令创造 AI 原生应用。目前已有新加坡旅游局、启德教育和索菲亚等上万家企业、5 万多名开发者基于 AgentBuilder 开发智能体,最快 5 分钟即可创建完成。

2、AppBuilder 是目前最好用的 AI 原生应用开发工具。百度已提前将开发 AI 原生应用所需的组件和框架封装在 AppBuilder 中,开发者最快三步就可以开发一个 AI 原生应用,且依然是自然语言编程。李彦宏在现场基于 AppBuilder 进行 AI 原生应用开发实战,演示了“游乐场排队助手”、华北电力大学“华电 AI 助理”和百度文库智能漫画生成三个 AI 原生应用的创建过程。

3、ModelBuilder 是面向专业开发者的模型定制工具,其预置了最全面最丰富的大模型(高达 77 个),包括旗舰基础大模型 ERNIE3.5、ERNIE4.0,百度旗下的多款轻量级大模型以及垂直模型,以及第三方主流模型。ModelBuilder 可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,达到更好的效果,李彦宏在现场展示了基于 ModelBuilder 开发教育行业的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。

AgentBuilder、AppBuilder、ModelBuilder 三大 AI 开发神器的底层,则是强大的代码大模型技术。据李彦宏介绍,文心大模型快速进化,其中“代码”是重要升级领域,其在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。

在一年多前,百度就基于文心大模型推出智能代码助手 Comate,支持 100 多种语言和主流IDE平台,可推荐代码、生成代码注释、进行代码续写、查找代码缺陷、给出优化方案,还可深度解读代码库、关联私域知识生成新代码,目前已被百度自身,以及喜马拉雅、三菱电梯、软通动力等上万家企业应用,生成代码采纳率达 46%,百度每天新增代码中已有 27% 由其生成。

3.png

在开发者大会上,李彦宏还发布了文心大模型 4.0 的工具版,让开发者可在工具版上使用代码解释器功能,通过自然语言交互实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势。

随着大模型在代码领域的持续进阶,以及 AgentBuilder、AppBuilder 这样的低门槛甚至零门槛开发工具的出现,自然语言编程不再是梦想,每个人都可以使用自然语言来表达自己的需求、构建需要的程序,专业程序员则可以靠 ModelBuilder 专业工具大幅提高效率,减少重复工作,聚焦在业务与创造本身。

4.png

正如李彦宏所说:“AI 正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”他甚至乐观地表示:“你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”

有了计算机就有了编程的概念。编程语言一直在进化,从最初的二进制,到后来的机器代码,到汇编语言,再到高级语言。这些年,高级语言也在不断革新。而编程语言不断进阶的目的,就是为了让编程难度更低、效率更高。按照这样的路线来看,人人都掌握的自然语言将是“编程语言”进化的终极形态。

5.png

不只是百度意识到这样的趋势,此前,英伟达 CEO 黄仁勋也曾表示,AI 可以让每个人都能编程:“编程语言可以普及成为人类的语言,现在世界上每个人都是程序员。这就是人工智能的奇迹。”

英雄所见略同,百度发布三大 AI 开发神器,让“人人都是开发者”变为现实,让每个人都可以更好地掌控、利用和挖掘 AI 红利,创造更好的世界。

不卷参数卷工具

百度成为 AI 普及的推手

在这届开发者大会上,李彦宏也有分享百度文心大模型的最新进展。截至目前,文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。基于文心大模型的 AI 原生爆款应用文心一言在发布一年后,用户数已突破 2 亿,API 日均调用量也突破 2 亿,服务客户数达到了 8.5 万,利用千帆平台开发的 AI 原生应用数超过了 19 万。

丝毫不难发现:百度丝毫没有要卷大模型参数“堆料”的意思,它分享的核心数据均关系到大模型的应用进展,它正在进行的一切努力也围绕着大模型落地进行。

首先是提供更全、更好、更智能的应用开发工具。

在“百模大战”如火如荼且许多大模型走向开源后,当下的市场不再需要更多的基础大模型。市场真正紧缺的,一个是具有世界级竞争力的顶尖大模型,这是文心大模型努力的方向;另一个则是基于 AI 大模型的杀手锏应用。只有形成类似于 AppStore 这样的繁荣的原生 AI 应用生态,AI 大模型技术才算真正实现了爆发。

然而,AI 原生应用开发彻底改变了软件开发的思路,不再是面向过程也不再是面向对象,而是“面向智能”,开发者需要调用、组合模型的能力来创造应用,传统的开发工具体系很难适应这样的新型开发模式。因此,不论是从 0 到 1 的新建,抑或是对成熟应用的改造,AI 原生应用的构建都必须要有更适合的专业 AI 大模型应用开发工具,就像网站、软件、App 开发有各自的专门工具体系一样。

于是我们发现,“工具”成了百度这届 AI 开发者大会的最高频的关键词。

其次是不断降低大模型成本,让开发者愿意用、用得起、用得多。

除了降低 AI 原生应用开发门槛外,百度也在努力降低大模型的计算成本。从“囤卡现象”,到“电力短缺”,诸多与大模型相关的新闻均表明 AI 大模型应用成本高昂务必。然而,技术普及的关键就在于成本降低。从飞机到 5G 网络到电动车再到智能驾驶,每一个技术走向爆发都会经历一个进化曲线:随着技术不断发展,产品化与商用化加速促进成本降低,到达一个奇点时,成本出现质变,走向大规模普及。

推动大模型经济成本降低,百度双管齐下:

一方面是技术降本。在芯片、框架、模型、应用这四层架构上有着全栈的布局,具备端到端这一模式的先天优势,基于此可不断地将模型成本打下来,让更多人都可以高效、低价地用大模型来做AI应用,且不断提高文心大模型和文心一言的效率。

另一方面是规模降本。在 GPT 出圈以前的 2019 年,百度就已布局大模型技术并推动落地。大模型用得越多越智能,也越便宜。随着百度大模型技术的规模化落地,技术持续进化的同时成本不断降低,飞轮效应已然形成。据李彦宏介绍,“相比一年前,文心大模型的算法训练效率提升到了原来的 5.1 倍,周均训练有效率达到98.8%,推理性能提升了 105 倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在一天可以调用 100 万次。”

最后、建立 AI 大模型生态,鼓励 AI 原生应用创新。

在这届开发者大会上,李彦宏宣布,第二届“文心杯”创业大赛正式启动,这是一个鼓励开发者基于大模型开发 AI 原生应用的大赛。2023 年 5 月百度首次启动“文心杯”创业大赛,一共给 15 支优胜团队提供了数千万元的资金支持。今年百度“文心杯”创业大赛力度更大,首次设立‘特别大奖’,特别优秀的项目,将有机会获得 5000 万人民币的现金和资源支持。

不论是 WEB 时代的网站,抑或是移动时代的 App,任何应用生态的繁荣都来自于开发者的创新。在 AI 原生应用生态中,百度一方面提供更强的基础大模型技术基石,和更成熟的配套开发工具支持,另一方面则营造良好的创新生态,降低开发门槛,吸聚开发者,发挥中国创业者善于做应用落地的优势,推动大模型上更早长出更多成功的AI原生应用。

李彦宏多年来一直扮演着“AI 布道师”角色,自深度学习时代起就一直为 AI 产业化摇旗呐喊,致力于让全社会理解 AI、重视 AI、用好 AI。在演讲的最后,李彦宏动情地表示:“今天的中国,有 10 亿互联网用户,有强大的基础大模型,有足够多的 AI 应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”

百度 AI 的落地范式

行业的游戏规则

2023 年,大模型就已成为科技产业的头等大事,中国兴起了如火如荼的“百模大战”。然而迄今为止,真正让用户有感知的 AI 大模型应用仍是凤毛麟角。虽然时不时会有类似于 Sora、Suno 这样的 AI 大模型爆款应用或者技术刷屏,但它们大都仅限于“娱乐”,且往往会“昙花一现”,因为无法真正解决用户生活中面临的问题,或者没有给企业带来任何实质性价值。

由此可见,“落地”依然是大模型以及 AI 发展的重中之重。行业亟待杀手锏应用的出现,亟待能跑通商业模式的大模型应用,亟待更繁荣的 AI 应用生态。在这样的关键窗口期,百度旗帜鲜明展现出的 AI 观,正是行业需要的AI观。

当行业在卷开源“重复造轮子”,或者围绕“比大更大”的参数进行军备竞赛时,百度公然“唱反调”,只做有价值的大模型,号召开发者使用更合适(而不是更大)的模型,让行业回到理性发展的轨道。

在开发者大会上,李彦宏甚至直言,“开源模型会越来越落后。”在百度看来,未来绝大多数 AI 原生应用都是 MoE 的,即大小模型的混用,不依赖一个模型来解决所有问题;小模型推理成本低,响应速度快,在一些特定场景中,经过精调后的小模型,它的使用效果可以比美大模型。基于此,开发者可在强大的基础模型文心 4.0 之上,根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低。“所以开源模型会越来越落后。”

6.png

在大模型基座研发上,百度在确保文心大模型自主可控、技术领先的同时,强化中文等独特优势。同时,围绕多模态大模型等垂直场景构筑长板优势,李彦宏在开发者大会上表示:“视觉大模型最大的应用场景是自动驾驶。百度在这个方向上是最好的,是自动驾驶的全球领导者,我们不只训练 AI 如何生成视频,更训练 AI 理解真实世界发生的事情并预测未来。”这一点马斯克也曾发出同样的感慨,在 Sora 发布后他在 X 上直言:特斯拉的视频生成技术是世界上最好的,甚至超过 OpenAI 的 Sora,原因在于特斯拉拥有强大的自动驾驶技术。

更重要的是,百度将“落地”视作发展大模型 AI 的头等大事。技术只有落地才有价值,大模型只有转化成 AI 应用才能为人类所用。不论是提出 AI 原生应用的畅想,抑或是推出成套的 AI 开发神器,都表明百度在力所能及地推动 AI 大模型落地。

作为技术领先者的百度,已然成为 AI 大模型落地的关键推手,其AI观已成为行业游戏规则,将让AI大模型健康发展,让AI大模型的普惠时刻更早来临。

大模型落地不需要“大炮打蚊子”。“适合的才是最好的。”百度以务实的态度,构建基础大模型和垂直大模型技术基座,同时提供工具链支持,让每个人都有机会挖掘到 AI 红利。

毫无疑问,百度走在正确的道路上。

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

1711682390_pic_real.jpg

微信图片_20240313155219.jpg

微信图片_20240207151541.png

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章