HelloKitty • 2023-03-09 16:12
838
本文由 智东西 撰写/授权提供,转载请注明原出处。
文章来源于:智东西
作者:李水青
编辑:漠影
生成式 AI(AIGC)正引爆全球,各行各业的 CEO 和开发者们都在寻找机会,搭上这趟数智化“快班车”,从而实现业务转型、业绩增长。
在国内,接入百度对话机器人“文心一言”无疑成为企业进入 AIGC 赛道“掘金”的一张入场券。根据官方数据,已有超 400 家企业宣布接入文心一言,覆盖消费、工业、旅游、传媒等各个领域。
无论是让文心一言做搜索引擎的“大脑”,还是基于其开发智能媒体小编、智能家居助手、电商金牌客服等应用……我们看到,AI 不仅在口口相传中名气大涨,也在这一过程中变得更加规模化、平民化、普惠化。
百度创始人兼董事长李彦宏在近日的内部信中说:“AI 技术已经发展到一个临界点,各行各业都不可避免地被改变,中国 AI 市场即将迎来爆发性的需求增长。”
在生成式 AI 爆发的前夕,企业接入文心一言这样的应用,无疑意味着其搭上了通往数智化高地的“快班车”。但这显然只是“长征”的第一步。如何让 AI 技术真正跨越工程化鸿沟,飞跃 AI 落地的“最后一公里”?这是各行各业的 CEO 和开发人员眼下关注的问题,因为过去几年 AI 工程化确实经历了不少挫折。
近日,通过对话百度 AI 中台的三位资深专家,智东西对这一问题进行了深入探讨。百度 AI 中台,简单说是百度智能云旗下的 AI 开发 PaaS(平台即服务)平台,后续将推动文心一言大规模产业落地,面向企业提供一系列 AI 开发和运维工具。
400+ 企业接入文心一言
有多少能抵达“最后一公里”?
根据官方消息,百度文心一言将在 3 月 16 日正式推出。届时,百度多项主流业务将接入文心一言,包括百度搜索,以及基于百度智能云的智能语音助手小度、智能驾驶阿波罗(Apollo)等;同时,目前已有超 400 家企业宣布加入文心一言生态圈,享用这一服务。
从 AI 产业落地的流程来看,接入文心一言或许只是一个开始。
要实现技术到产品的“最后一公里”飞跃并不容易,AI 开发工程化尤为重要。如果把 AI 模型比成一个汽车发动机,AI 工程化就好比将一台发动机装配成一辆可自如行驶的汽车的过程。
百度 AI 中台相关负责人告诉智东西,在过去很长时间里,AI 工程化面临以下几个显著问题:
1、AI 开发流程长且复杂,行业缺乏规范。AI 开发流程大致包括:数据采集和标注、模型训练、应用部署、数据回流和模型观察,没有规范意味着混乱无序。
2、市面上众多 AI 工具使用门槛高。AI 模型面对碎片化场景会效果衰减,企业需要做二次开发,但市面上的 AI 开发工具不是不好用,就是不符合需求。
3、客户基础设施不完善、内部孤岛严重、人才短缺。比如某银行客户各部门建立的 17 个云系统,同时各部门孤岛严重、需求难以聚合,加之缺乏专业 AI 人才,众多因素使得花大成本购入的 AI 技术成为烂尾工程。
为了应对这些 AI 工程化难题,整套百度 AI 中台的价值在文心一言的落地中凸显了出来。
简单来说,百度 AI 中台是一个助力企业 AI 模型开发和运维的 PaaS 平台。其面向金融、能源、互联网、教育等多行业提供人脸识别、OCR、图像、AR、自然语言处理等多种 AI 能力(文心一言是其中一项 AI 服务),并帮助其实现简单、快速部署和验证。
百度 AI 中台相关负责人告诉智东西,一方面,文心一言本身的数据准备、标注、模型训练、应用评估等开发过程,都是基于百度 AI 中台完成。另一方面用途可能更受企业关注,那就是助力文心一言的应用开发。
具体来说,在文心一言相关模型开发过程中,百度 AI 中台可提供从数据模型评估、推理优化、数据回流等全生命周期开发工具,以保证模型训练效果。比如:在数据标注环节,百度 AI 中台提供智能标注方式和标注标准,最高可使成本降低 70%;在算力消耗方面,百度 AI 中台能依照规范提高 GPU 利用率,能提升资源利用率40%~80%。
总的来说,有了 AI 中台中一整套工具链,企业将能更好地飞跃产品落地的“最后一公里”,从而实现 AI 投入变现
生成式 AI 爆发前夕
产业呼唤更适合跑 AI 的云
众所周知,算法、算力和数据是 AI 落地的三大要素。
当下,基于大模型的 AIGC 正进入爆发前夜,新的海量智能算力需求也随之产生。知名调查机构 IDC 预测,人工智能产业的软件、硬件和服务有望在 2023 年突破 5000 亿美元大关。智能算力成为产业最大增量。
百度 AI 中台相关负责人告诉智东西,在这种背景下,产业需要“更适合跑 AI 的云”。
何谓“更适合跑 AI 的云”?该负责人解读道,从传统思路来看,云计算主要支撑企业数字化,AI 契合智能化升级,往往分阶段完成;但现在,很多企业会选择将数字化和 AI 化一起规划、齐头并进,效率会高得多——这就需要更适合跑 AI 的云。而随着生成式 AI 爆发,适合跑 AI 的云无疑需要支持大模型,支持更高速效的训练和推理,需要更好的异构算力支持。
这位负责人称,百度 AI 大底座正是提供了这样的新型 AI 基础设施。
简单来说,百度 AI 大底座是集百度十年 AI 研发之大成的“全栈自研的 AI 基础设施”。百度 AI 大底座将 AI 生产全要素,包括自研芯片、大模型、深度学习框架、AI 应用集于一身,并可面向企业真实业务场景进行端到端的全流程调优。
纵观人工智能产业,我们看到当下市面上实际上已经出现了“AI 大装置”等同类产品。但就像“发动机”有很多车企造,每一家的质量水平有所区别一样,百度 AI 中台负责人告诉智东西,百度 AI 大底座相比同行竞品的一大特征就是:“全要素”和“端到端”。
▲百度AI大底座架构图
具体来看,百度 AI 大底座由前文提到的 AI 中台、底层百舸异构计算平台两部分构成。百度 AI 中台是用户“界面”,文心大模型是其中可调用的一个关键模型 PaaS 服务。百舸异构计算平台是底层基础设施服务平台,通过自研芯片、计算、存储、加速等多方面技术提供加速算力 IaaS(基础设施即服务)服务。
▲百度AI大底座产品图谱
这位负责人指出,这种端到端的能力十分关键。比如有些企业可能买了最好的 AI 模型,但由于在开发中缺乏对数据的标注和结果监控,就导致 AI 应用中间断层,久而久之 AI 模型就被闲置了。举个具体案例,比如某银行在布局 OCR 技术中,曾就有旗下七八个部门采购了不同厂商的产品,并不会考虑数据回流等全链条问题,就导致整体效果大打折扣。
可以看到,基于 AI 大底座,百度一定程度上建立了在生成式 AI 爆发前夕的技术优势。根据 IDC 数据,百度智能云已连续四年居 AI 公有云市场第一。而这种先发优势,很有可能在 AI 大模型时代保持叠层效果。
AI 走向平民化,百度要打造
人人能用的 AI 开发平台
生成式 AI 的爆发也意味着AI进一步走向“平民化”。
这种核心价值层面的升维,不仅大大提升了 AI 的知名度,实际上也对 AI 开发工具提出了更加深刻的要求。
具体来说,大模型本身就帮企业简化了 AI 工程化流程,企业只需结合业务具体场景进行小样本调优就能获得所需应用。
但与此同时,承载了“平民化”期待的生成式 AI,需要在工程化中延续这一“普惠”价值。新的问题就出现了:大模型拥有巨量参数,一次调优涉及的资源消耗依然可观;同时这类技术往往进入企业业务核心,带来更高价值的同时,一旦出问题后果会更严重。
因此要实现真正的 AI 平民化,一整套高效易用的 AI 规范与标准、工具平台尤为重要,而这需要产学研多方力量共同努力。
面向 AI 普惠发展诉求,百度已积极参与行动。2022 年底,为了引导产业有序发展,中国信息通信研究院联合百度、阿里、华为、“AI 四小龙”等几十家优秀企业编制了 MLOps 系列标准。MLOps(Machine Learning Operations),简单来说,是指 AI 开发与运维的全流程。信通院 MLOps 标准则可以理解为一本汇集 AI 开发全流程的最佳实践“宝典”,其诞生标志国内 AI 开发从混乱无序走向标准统一,将大幅提升 AI 开发质量和效率。
在这一背景下,百度 AI 中台已首批通过信通院 MLOps 系列标准,意味着其能够让企业获得最专业的 AI 开发服务,以业界较低的成本开发出需要的 AI 应用。换句话说,MLOps 标准提供了一套 AI 软件项目研发和运营的方法论,百度 AI 中台则为企业提供了对应方法论的“绝佳工具”。
百度 AI 中台相关负责人说,百度智能云企业 AI 开发平台的整体能力在需求管理、数据工程和模型开发三个模块均达到了旗舰级水平。
在功能上,百度 AI 中台具有完善的需求和代码管理流程,AI 模型生产过程具备可视化建模、自动化建模、作业建模、工作流等建模方式,对底层计算资源具有完备高效的管理模式,对模型具有全面的管理能力,对数据具有功能丰富的管理平台和质检能力。
在服务过程上,百度 AI 中台从组织结构到流程管理,再到管理工具方面,均具有较高的服务水平,能够为外部企业客户的需求提供较为快速和较高质量的响应。
百度 AI 中台相关负责人告诉智东西,在 AI 基础设施能力获得权威认证背后,AI 普惠实际上是百度智能云长期以来的一大核心价值。
这不是一蹴而就的。他回顾道,2016 年,百度发布了国内第一个深度学习框架——飞桨,随之百度内部开始“赛马”做多个机器学习平台。2018 年,高级开发能力的 BML、低门槛开发的 EasyDL、以及用户实训比赛社区的 AI Studio 三大平台脱颖而出。
“分久必合,合久必分”。2020 年百度将这三大平台整合,并按照 MLOps 的过程将业务划分为样本数据中心、开发中心、模型中心和服务运行平台四大阶段板块,基本涵盖了人工智能开发运维的全生命周期。通过 2021~2022 年的一年三到四次迭代,这一平台最终实现了 AI 开发低门槛目标。
可以看到,通过八年内部赛马打造百度 AI 中台,百度正将其“反馈驱动创新”的科学方法论赋能给企业,更将其 AI 普惠价值传达给行业。
结语:生成式 AI 风起
云智一体趋势凸显
当下,我国人工智能产业在经历了十几年波峰波谷之后,正乘着生成式 AI 技术的东风迎来新的春天。凭借技术属性和社会人才等各方面条件,AI 技术落地的广度深度延展,正走向规模化、平民化、普惠化。
从企业角度来看,他们正通过接入文心一言等产品的方式,实现数字化与智能化转型的齐头并进。尽管正如科技部部长在两会“部长通道”中所说,国产力量与 OpenAI 等国际公司仍存在差距。但百度文心一言无疑是国内企业吃到 AI 技术新红利的一条“快车道”入口。
与此同时,企业接入大平台大模型也只是一个开始。下一步,如何基于 AI 大模型进行二次开发、数据挖掘、优化调优及部署测试,让 AI 实现“最后一公里”飞跃,成为更关键的问题。
这也使我们越来越意识到,AI 落地是一条算法、算力和数据跨越漫长开发链条的握手合作。产业呼唤更适合跑 AI 的云,云智一体也成为云计算产业发展的重要趋势。
扫码关注公众号
获取更多技术资讯