阿里云造「生态」，能让开发者实现「大模型创业自由」吗？

HelloKitty • 2023-07-11 15:40

扫一扫在手机阅读、分享本文

3456

本文由雷峰网撰写/授权提供，转载请注明原出处。

文章来源于：雷峰网

作者：黄楠

编辑：陈彩娴

“这一波大模型浪潮，与十年前移动互联网元年的样子很像。”

7 月 6 日，在上海举办的一场 AI Hackathon 上，主办方告诉雷峰网。十年前，当移动互联网兴起的时候，各互联网公司及相关机构时常组织类似的编程比赛，只要开发者愿意，几乎每天都可以有 Hackathon 参加。大模型浪潮到来后，以 AIGC 为主题的 Hackathon 也开始遍地开花。

但这场 Hackathon 略有不同：在 WAIC 大会 7 月 7 日的“MaaS：以模型为中心的 AI 开发新范式”论坛现场，前排最好的位置预留给了参加 Hackathon 比赛的队伍代表。

毫无疑问，主办方希望向开发者们传达一个信号：你们是这个论坛最重要的人。

这场 Hackathon 的主办方是中国最大的 AI 模型社区“魔搭”，论坛的主办方是中国云计算领域的领导者阿里云。在现场，阿里云 CTO 周靖人在开场演讲中表示：“阿里云将把促进中国大模型生态的繁荣作为首要目标，向大模型创业公司提供全方位的服务，并在资金和商业化探索方面提供充分支持。阿里云魔搭社区现已聚集 180 万 AI 开发者和由 20 多家顶尖人工智能机构贡献的 900 多个优质 AI 模型，我们将努力把魔搭社区培育成中国最大的‘大模型自由市场’。”

周靖人在WAIC现场

阿里云的野心，是在 MaaS 时代缔造一个全新的大模型生态。

AIGC 开发者之痛，关上的创业之门

当科技不断发展进步，最先行动起来的是那些拥有技术和产品背景的年轻的创业者们。ChatGPT 向他们展示了一种通过简单的对话交互方式调用 AI 强大能力的可能，让他们看到了 AIGC 未来的无限可能性。

开发者们能感受到技术变革的来临，但如何降低大模型研发门槛、实现大模型落地应用，他们尚未看到答案。

对于他们来说，要想从“开发者”变为“创业者”，算力成本、数据场景的匮乏与落地的不确定性是几大关键因素。

由于基础大模型对技术和成本的超高要求，国内能做通用模型创业的公司和团队是少数。当前创业公司的方向主要可以分为两类：一类是与通用大模型厂商合作定制、或是基于开源基础模型之上，基于行业 Know-How 训练自己的模型算法；另一类是做应用型服务，在通用模型或行业大模型之上做 AI 产品。

无论哪一条路线，创业公司的行业大模型和 AI 工具的研发都离不开通用大模型的能力。但现实的情况是，国内大模型成果虽多，但每一家的模型参数、侧重能力、配套设施等均不相同，能力也良莠不齐。不仅如此，有些厂商提供的模型覆盖面比较有限，面对一个创业公司、多个服务场景的定制化服务时，需求难以被满足。

开发者和创业者面临的另一大问题是：好的工具和服务太少。从模型搜索、调用、精调、定制到产品化开发，整个链路都缺少“开箱即用”的工具。

这也是 AIGC 声浪巨大，但真正的创业浪潮却并未爆发的原因。创业者的每一个需求和反馈都十分紧迫，但面对现实，沸腾的从业者们也不得不被迫进入冷静期。

从 MaaS 的首倡者到践行者阿里云的“水到渠成”

如何让大模型的基础能力在生产环节更好地释放？作为业内最早布局大模型的科技公司之一，阿里云对此有先人一步的思考。

2022 年，阿里云 CTO 周靖人在业内首次提出 MaaS（Model as a Service）“模型即服务”理念。不到一年时间，探索以模型为中心的 AI 开发范式已成行业共识。阿里云率先落子，围绕 AI 模型这个中心，重新设计云计算的技术和服务架构，试图让云服务覆盖大模型从研发到落地的整个周期。

为了让AI开发者能够更高效地查找使用模型，阿里推出了AI模型开源社区魔搭（ModelScope），以模型为纽带，链接起AI模型的生产者和使用者。

魔搭社区现已集聚 180 多万 AI 开发者和 900 多个优质模型，涵盖 IDEA 研究院、澜舟科技、清华 TSAIL、智谱 AI 等国内大模型赛道核心玩家贡献的优质模型。平台现有 10 亿以上参数规模的大模型约 100 个，是名副其实的中国大模型第一门户。

建成一站式的 AI 模型门户后，下一步要帮助创业者和开发者把模型用起来。周靖人曾说，MaaS 要解决的核心问题是让模型使用更简便。

为此，魔搭平台推出了一系列的模型开发工具和服务。比如，魔搭社区打通了与阿里云灵积服务平台的部署链路，支持社区的模型通过灵积来实现服务化。灵积拥有模型上云统一工具链路，支持模型的自主接入，所有接入灵积平台的模型都能自动获取阿里云的强大服务能力，包括基于阿里云强大算力的跨区域自适应弹性能力。

本次人工智能大会，社区又上线一款新工具——ModelScopeGPT（魔搭 GPT）。用户在前端用自然语言发出指令，ModelScopeGPT 就能借助作为“中枢大脑”的大语言模型，调用魔搭社区其他 AI 模型，通过大小模型协同，完成人类布置的多种模态融合任务。这是继 AutoGPT、HuggingGPT 等“大模型调用工具”兴起以来，国内推出的首个智能工具。

阿里云表示，构建 ModelScopeGPT 的数据集和训练方案将会对外开放，供开发者自行调用，开发者可以根据需要对不同的大模型和小模型进行组合。

ModelScopeGPT 是阿里云 MaaS 范式在模型使用层的重要映射：将大模型及模型工具在“模型自由市场”开放，帮助开发者多、快、好、省地使用大模型。

对大模型创业公司和开发者来说，这些工具就是大模型掘金人的“铲子”。

以生态换创新，“大模型创业自由”可以有

1912 年，创新理论的鼻祖熊彼得在《经济发展理论》一书中写道：“任何经济结构都可以拆解为技术、产品、组织、市场、资源五个要素。将这些旧要素重新组合，便可以称为‘创新’。”

MaaS 时代，阿里对上述要素重新组合、交出的答卷是：打造 MaaS 的生态，帮助整个行业降低成本，从而激发群体创新力。从历史来看，这种“以生态换创新”的做法，多次被证明是有效且最能释放创新红利的方法。

对很多人来说，大模型的到来属于“横空出世”。对技术人来说，一切不过是 AI 技术发展至今“水到渠成”的事。周靖人曾说：“我们行业内的人并不认为这条道路（大模型）是 2023 年突然出现的，这是一个长期以来技术发展的演进过程。”

同样，MaaS 理念，也是阿里云在云计算和 AI 领域多年深耕后水到渠成的结果。

拍摄于展区

阿里云早在 2019 年就开始研发大模型，在超大模型、语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面，都对中文大模型发展做了很多前沿性、引领性的工作，积累了丰富的大模型研发经验。

基于对大模型研发和落地需求的理解，阿里云搭建了一套适配 AI 时代的算力基础设施。阿里云拥有国内最强的智能算力储备，其智算集群可支持最大十万卡 GPU 规模，承载多个万亿参数大模型同时在线训练，为大规模 AI 集群提供无拥塞通讯的自研 RDMA 网络架构和低成本高可靠的高性能存储 CPFS。

阿里云知道怎么设计好用的 AI 工具。在 AI 平台层，以机器学习平台 PAI 为核心的 PaaS 服务可支持万卡的单任务分布式训练规模，覆盖全链路 AI 开发工具与大数据服务，AI 训练效率提升可达 10 倍，推理效率提升可达 6 倍。

大模型通往开发者和用户的道路，势必由云计算铺就。阿里云推出了专门的模型 API 门户——灵积，灵积平台拥有模型上云统一工具链路，能够提供基于云原生的公共部署以及用户自定义独占部署等多种形式，来满足不同模型的需求。平台还积累了模型自适应推理优化和高效微调训练的能力，并提供了基于插件进行模型能力拓展的系统框架。通过灵积，丰富多样化的模型不仅能通过推理 API 被集成，也能通过训练微调 API 实现模型定制化。

通过开放技术、工具、经验，降低大模型的研发门槛，通过建设活跃的生态社区，激发群体智慧，让更多创新的河流汇入 MaaS 的时代汪洋之中，促进中国大模型生态的繁荣，共同塑造、呈现一个全新的创造生态。如果这一切变成现实，“大模型创业自由”还会远吗？