大模型+大装置！商汤开启AGI“日日新”时刻

HelloKitty • 2023-04-13 17:16

扫一扫在手机阅读、分享本文

4753

本文由猎云精选撰写/授权提供，转载请注明原出处。

文章来源于：猎云精选

作者：王非

十年剧变！

自 2013 年 Deepmind 开启 AGI 的实现道路之后，Narrow AI（弱人工智能）一直是AI的代言人。

进入 2023 年，ChatGPT 爆火后，我们讨论的 AI 慢慢变为了 AGI（通用人工智能）。

数据、算法、算力自始至终是 AI 的三大支柱，而以“大数据+大算力+强算法”支撑的大模型，也吸引着国内外巨头以及创业公司前赴后继。

放眼国内互联网大厂，百度“文心”、华为“盘古”、腾讯“混元”、阿里“通义千问”、商汤“日日新”、昆仑万维“天工”等大模型，带着浓厚的中国文化色彩，密集涌现。

其中，BAT 无需多言，天然自成“体系”。商汤则凭借“多年来一直积极投入建设超大规模的算力，也一直训练越来越大的模型”，得以与巨头比肩。

4 月 10 日，商汤刚刚在技术交流日上，正式公布了“日日新 SenseNova”大模型体系，并公布了其依托 AI 大装置 SenseCore 实现“大模型+大算力”融合创新的研发体系。

来源：商汤科技

基于此，商汤也得以在 AGI 时代的开端，抢先开启 MaaS（Model as a Service，模型即服务）模式，面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种服务。

大模型“诸神之战”已然开启，MaaS 模式下的千行百业争夺，也成为这场比拼的一大焦点。

建造开发“大装置+大模型”，长期坚定底层技术研发投入

作为一家成立于 2014 年的 AI 公司，商汤在 AI 领域已储备多年。

在 AI 大基础设施上，商汤于 2020 年启动建设亚洲最大的人工智能计算中心 AIDC，并在 2022 年 1 月启用。

在 2021 世界人工智能大会期间，商汤正式推出新型AI基础设施——SenseCore 商汤 AI 大装置；2022 年 9 月，商汤大装置 AI 云也对外发布，并于今年 2 月 25 日正式上线。

2022 年，商汤 SenseCore AI 大装置持续扩建，完成 2.7 万块 GPU 的部署并实现了 5.0 exaFLOPS 的算力输出能力，目前可最多支持 20 个千亿参数量大模型（以千卡并行）同时训练，最高可支持万亿参数超大模型的训练。

自成立之初不断打磨至今天，商汤建设了业界领先的 AI 大装置，拥有亚洲目前最大的智能计算平台之一。

来源：商汤科技

而在大模型上，商汤自 2018 年开启研发，也已深耕超五年。

来源：商汤科技

2019 年，商汤就首次发布了 10 亿参数的视觉大模型。

2021 年 11 月，商汤联合上海人工智能实验室、清华大学、香港中文大学、上海交通大学共同发布“书生”大模型，并持续联合研发。今年 3 月 14 日，商汤也刚刚发布多模态多任务通用大模型“书生（INTERN）2.5”，其拥有 30 亿参数，是目前全球开源模型中 ImageNet 准确度最高、规模最大，同时也是物体检测标杆数据集 COCO 中唯一超过 65.0 mAP 的模型。

2022 年，商汤还成功研发了 320 亿参数量的全球最大的通用视觉模型，在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。

来源：商汤科技

多年的大装置建造，加上大模型开发，离不开商汤在研发上持续不断的投入：2018 年至今，商汤累计研发投入达 128.47 亿元。

3 月 28 日，商汤公布的 2022 年财报显示，研发人效相比去年进一步提高 90%，人均每年研发模型数 9.35 个；累计商用模型数提高了 93% 至 6.7 万个。

在财报发布时，商汤科技董事会执行主席兼 CEO 徐立博士总结到：“2022 年，通用人工智能（AGI）领域在大算力与大模型的驱动下取得了显著进展。商汤始终以前瞻性的眼光，专注于超大模型的研发，并积极投资建设人工智能高性能计算基础设施。面向未来，我们将通用人工智能（AGI）作为核心发展战略，以期在未来几年内实现重大突破。”

不止语言大模型“商量”，商汤造了个“大模型超市”

商汤“突破”的第一步，正是 4 月 10 日重磅亮相的“日日新 SenseNova”大模型体系，并同步推出了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

徐立表示：“我们以 AI 大装置 SenseCore 打造 AGI 时代的基础设施，并基于此将大模型体系命名为‘日日新 SenseNova’，寓意‘苟日新、日日新、又日新’，希望在模型的迭代速度及处理问题的能力上可以日日更新，不断解锁 AGI 的更多可能。”

来源：商汤科技

正如百度的“文心一言”，360 版 GPT（被网友戏称为“红孩儿”），商汤基于“日日新SenseNova”，推出了其最新研发的语言大模型“商量 SenseChat”，Slogan 为“商量商量，都能解决”。

来源：商汤科技

作为千亿级参数的自然语言处理模型，“商量 SenseChat”使用大量数据训练，并充分考虑了中文语境，能够更好地理解和处理中文文本。

在 4 月 10 日的技术交流日活动现场，“商量 SenseChat”展示了出色的多轮对话和超长文本的理解能力。此外，商汤还展示了语言大模型支持的几项创新应用，包括：编程助手，可帮助开发者更高效地编写和调试代码；健康咨询助手，为用户提供个性化的医疗建议；PDF 文件阅读助手，能轻松从复杂文档中提取和概括信息。

不止于“商量 SenseChat”，商汤还展示了“日日新 SenseNova”的各种 AI 文生图创作、2D/3D 数字人生成、大场景/小物体生成等一系列生成式 AI 模型及应用：

“秒画 SenseMirage”文生图创作平台，展现了光影真实、细节丰富、风格多变的强大的文生图能力，可支持 6K 高清图的生成；客户还可根据自身需求训练生成模型。

“如影 SenseAvatar”AI 数字人视频生成平台，仅需一段 5 分钟的真人视频素材，就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

“琼宇 SenseSpace”和“格物 SenseThings”3D 内容生成平台，可以高效低成本生成大规模三维场景和精细化的物件，为元宇宙、虚实融合应用打开新的想象空间。

来源：商汤科技

其中秒画作为 AIGC 文生图方向的创作平台，备受市场关注。据了解，商汤“秒画 SenseMirage”是一个包含商汤自研 AIGC 大模型和便捷的 LoRA 训练能力，并提供第三方社区开源模型加速推理的创作平台，旨在为创作者提供更加便利、完善的内容生产创作工具。秒画“SenseMirage”不仅融合了超 10 亿参数的商汤自研文生图生成模型，还支持一键导入多个平台的开源模型或上传用户本地模型并对其进行特异性推理加速优化，结合自研模型及训练能力，用户可免除本地化部署流程，并基于开源模型自训练模型，高效地生成更多样的内容。

徐立认为，“日日新 SenseNova”带来的这些强大而易用的内容生成能力，将会改变内容生产行业的生产范式，突破内容创意的天花板，将会重塑内容生产行业生态并打开新的增长空间。

而这也与阿里张勇，“面向 AI 时代，所有产品都值得用大模型重新升级”的观点不谋而合。

徐立表示，“我们在起到‘日日新’这个名字的时候，大家反映它很像是一个超市。寓意也不错，商汤提供一个大模型的超市。我们的‘日日新 SenseNova’大模型超市里面，有数据、模型训练以及部署的三位一体的飞轮，能够完成自然语言的生成工具、图片生成的服务工具，所有的感知类任务的工具，以及模型的增量研发、服务工具。我们以此来作为上下游合作的基础，也欢迎合作伙伴来接入我们的‘日日新 SenseNova’大模型体系，一起迭代下一个阶段的大模型。”

模型即服务全面“开放”，MaaS 模式已成趋势

对内而言，“日日新 SenseNova”已为商汤的自身业务带来了诸多突破。例如在智能驾驶领域，基于视觉大模型，商汤实现了可识别 3000 类物体的 BEV 环视通用感知算法的实车量产，也构建了感知决策一体化的自动驾驶多模态模型，带来更强的环境、行为、动机解码能力。

然而，AI 的潜力不能仅靠一家公司挖掘，需要千行百业共同探索。

深谙于此的商汤，早在 2022 年就已全面布局生成类预训练大模型，围绕文本、语音、图像、视频、3D 场景的内容生成形成完整能力，整体升级了 SenseMARS 混合现实平台的产品及功能，面向行业客户服务并带来收入增长。

据了解，SenseMARS 的 AIGC 相关能力赋能小红书、微博、bilibili、ZEPETO、Line 等 APP 应用超过 200 个，头部客户续约率超过 95%。所拓展的线下场景覆盖面积增加至 1500 万平方米，覆盖大型游乐园区、大型商场、博物馆、银行等多个顶流场景。

于是在最新发布“日日新 SenseNova”时，商汤也继续强调“开放、共赢”。

据介绍，“日日新 SenseNova”已为政企客户提供了多种灵活的 API 接口和服务，包括图片生成，自然语言生成，视觉感知通用任务与标注服务。客户可根据实际应用需求，调用“日日新 SenseNova”大模型的各项 AI 技术能力，低门槛、低成本、高效率地实现各类 AI 应用。