HelloKitty • 2025-07-28 14:22
1003
本文由 乌鸦智能说 撰写/授权提供,转载请注明原出处。
以下文章来源于:乌鸦智能说
2025 世界人工智能大会(WAIC)正在上海火热进行中。作为国内 AI 领域最具分量的年度盛会,今年的 WAIC 不仅卷技术,更卷“落地能力”——从自动驾驶、具身智能,到产业 AI、国产算力,各大展区比拼的不是噱头,而是真正“能落地”的硬科技。
今天,乌鸦君就带你快速盘点一下本届 WAIC 展区的几个高光时刻。
大模型及应用篇:
这届 AI 不只是能想,还开始能干了
在 WAIC 2025,AI 早已不止于算力和模型的比拼,它正以超出预期的速度加速落地。
从能自动派活、项目复盘的 MiniMax Agent,到建模城市交通系统的蘑菇车联 MogoMind;从 10 分钟复刻真人数字主播的百度慧播星 NOVA,到可实时主持群聊、识别情绪的Soul 全双工语音大模型,AI 正以“智能体+ 多模态”的形态,深入工作、交通、直播、社交等多个真实场景,成为真正可感、可用、可部署的“数字劳动力”。
1.来 WAIC 当一天“数字高管”,MiniMax 的 Agent 太懂打工人了
MiniMax 展区整体以“大模型空间站”为概念设计,几款重磅模型引人关注:MiniMax-M1 是全球首个混合架构开源推理模型,视频生成模型 Hailuo 02 支持 1080P 原生输出,Speech-02 则在国际语音榜单上表现优异。
最惊喜的是 Agent 展区,亲手试玩 MiniMax Agent,真能“秒变高管”——从派活监工到项目复盘,全流程一个智能体搞定,交付质量堪比专业团队。
还有首次亮相的 MiniMax × Rokid AI 眼镜,语音交互丝滑到像在和真人对话;在 AI 艺术展区,我一键生成了全球打卡大片,立刻想拍个 AIGC 微电影试试。
2.蘑菇车联携首个物理世界 AI 大模型 MogoMind 亮相 WAIC
如果说 OpenAI 做的是“理解语言的 AI”,那蘑菇车联展示的 MogoMind,则是“理解物理世界的 AI”。
在 WAIC 2025,蘑菇车联展出了其物理世界 AI 大模型 MogoMind,聚焦大模型在交通领域的实际应用。不同于传统语言大模型,MogoMind 接入实时交通数据,具备全局感知、路径规划、通行能力计算、风险预警等能力,支持城市级交通运行状态的实时建模与判断。
现场展示中,MogoMind 可接入道路传感器、车载终端等多源数据,识别路面状况、行人动态、交通标识等物理信息,并基于融合算法完成推理与规划,服务交通管理、出行辅助和自动驾驶。
此外,MogoMind 已应用于蘑菇车联旗下的 RoboBus、RoboTaxi 等自动驾驶产品,其中自动驾驶巴士 MOGOBUS 搭载端到端“MogoAutoPilot+MogoMind”系统,已在全国10省落地运营,累计行驶超 200 万公里,服务乘客超 20 万人次。
同时,在本次活动上,蘑菇车联还展示了数字孪生建模、道路预测、盲区风险感知等功能模块。
3.百度慧播星发布新一代数字人技术 NOVA,10 分钟完成真人复刻
百度慧播星发布了新一代数字人技术 NOVA,支持 10 分钟完成真人声情动作复刻,预计 10 月向全行业开放。
据介绍,NOVA 技术实现三大关键突破:一是依托文心大模型 4.5 Turbo 的大师级剧本模式,可生成高质量脚本并驱动多模态协同,实现数字人“形、神、音、容”的高度统一;
二是搭载 AI 大脑,具备实时数据感知和自主决策能力,能调度多个智能体完成直播互动,并结合热点生成风格化内容;
三是具备高效复刻能力,仅需 10 分钟真人样本,即可完成声音、表情与动作的精准还原。
该技术已在罗永浩数字人直播中创下 5500 万 GMV,并在蒙牛等品牌落地应用,实现转化率提升33%。目前,NOVA 技术已进入邀测阶段,提前应用于教育、健康等十余个行业的达人与商家。
4.AI 主持上线!Soul 发布全双工语音大模型,群聊也能秒接话
Soul App 首次展示了其自研的全双工语音通话大模型,现场模拟 AI 主持群聊派对,实现无延迟、多轮次、自然流畅的多人互动体验。这一模型突破了传统语音对话的“轮流说话”限制,AI 可自主控制节奏、识别情绪、实时生成内容,并辅助活跃群聊氛围。
在现场体验中,AI 主持人可在群聊派对中实时发言、引导话题、调节氛围,提升用户参与感。同时,Soul 还展示了基于该能力的全双工实时视频通话技术,结合实时人像生成,让用户能看到具象的 AI 形象。
该模型将于近期在平台开启内测,应用于 1V1 通话、多人互动等社交场景。
5.49 克的 AI 管家?我在 WAIC 戴上了 Rokid 的新眼镜
在 WAIC 2025 现场,Rokid 带来了全新智能眼镜产品——Rokid Glasses,现场上手体验最大的感受是:真的轻!整机仅 49 克,几乎无感佩戴,外观看起来就像一副普通眼镜,时尚感和实用性兼备。
这款眼镜采用衍射光波导技术,能在透明镜片上清晰显示虚拟信息,同时不遮挡现实视野,实现虚实融合。现场我体验了 AI 物体识别、实时翻译,响应速度快,交互自然。它还内置 1200 万像素摄像头,支持拍照录像,并有指示灯保障隐私。
Rokid Glasses 已接入通义千问、Deepseek 等大模型,集成算力与交互能力,不再只是“能看”,更像一位随身 AI 助理。
6.AI 开始 Rapper 出道?我在 WAIC 现场被机器人唱服了!
去年在 AI 圈爆红的“歌词爆改机”今年再次升级!阶跃星辰携手青心意创,带来全新人形机器人伙伴“Ocra”,在 WAIC 现场与新生代歌手王晓天同台竞技,上演了一场“AI 中国好声音”对决。
这位“能说会跳”的智能机器人,不仅能实时识别语音,还能根据音乐节奏做出情感化肢体动作,与 Rapper 同步跳舞,现场互动感拉满。
观众也可亲自参与,用阶跃星辰的音乐大模型创作一段 AI Rap,并获得《中国好声音》官方系统的评分,体验从作词到表演的“即兴出道”全过程。
AI 基础设施篇:
从华为到摩尔线程,重塑 AI 时代“地基”
在 WAIC 2025,过去被认为高冷、遥远的底层算力与平台系统,如今正以更高效、更落地的方式,走进真实场景,支撑起大模型训练、智能体开发和产业级应用的落地需求。
1.384 张 NPU 组成“超级计算机”,昇腾 Atlas 900 A3 首次实机展出
在 WAIC 2025 现场,华为展出的“昇腾 384 超节点”同样让人印象深刻——384 张 NPU 卡通过高速总线互联,整套系统像一台“巨型计算机”一样高效运转,堪称 AI 训练界的超级发动机。
这台 Atlas 900 A3 SuperPoD,解决了传统集群资源利用率低、通信瓶颈等老问题,具备“超大带宽、超低时延、超强性能”三大特点,为大模型训练和推理提供了更稳、更快的底座。
展区还有昇腾联合 2700+伙伴打造的超 6000 个行业解决方案,覆盖金融、医疗、政务、交通等 11 大场景,展现了 AI 落地的真实路径。简单说,这不只是炫技术,更是全景展示了“AI 怎么真用起来”的样板间。
2.10 分钟打造产业智能体,星环科技你如何“用好 AI”
星环科技展区以“AI x Data = Future”为核心理念,集中展示了其新一代 AI Infra 基础设施的全栈能力。
展区设置了“10 分钟打造 AI 产业问答智能体”实操区,观众可现场体验如何利用星环科技 LLMops 和 TKH 快速构建一个面向特定行业(如金融、制造、政务)的专属问答智能体,直观展现从数据导入、知识构建到模型接入的全流程自动化。
星环新一代 AI Infra 架构由四大核心平台组成:支持异构算力资源管理的 Resources Platform(资源平台)、统一多模态数据处理的 AI-Ready Data Platform(AI 就绪数据平台)、支撑训练推理与应用开发的 AI Platform(AI 平台),以及完成知识管理与工程化的 Knowledge Platform(知识平台),形成面向企业级 AI 应用的全流程闭环。
同时,展区还展示了 AI PC 赋能、能源智能化生产、金融风控、政务服务等多个行业应用实践,结合真实场景诠释 AI 如何与业务深度融合,加速企业智能化转型落地。
3.国产 GPU 真能打?摩尔线程在 WAIC“现场交卷”
摩尔线程以“全功能 GPU 加速美好世界”为主题,集中展示了其围绕国产 GPU 构建的“云边端”全栈 AI 解决方案。从大模型训练推理到 AI for Science、数字人、智能制造、智慧医疗等多个高算力场景,几乎覆盖了 AI 产业链的全部关键环节。
其中最具看点的是第二代智算中心 KUAE2,可支持超过一万颗 GPU 部署,具备从 FP64 到 FP8 的全精度计算能力,为大模型训练与推理提供稳定算力底座。在推理侧,摩尔线程已支持运行 DeepSeek R1 等大模型,在国产 GPU 上实现约 100 token/s 的解码速度,性能处于行业领先水平。
此外,摩尔线程 GPU 已在多个场景落地:联合北大和昌平实验室,支持国产分子模拟软件 SPONGE 和 DSDP 的高效运行;与超图合作,构建遥感大模型训练与推理全流程国产化方案;在自动驾驶领域,为极佳科技“世界模型”平台提供图形渲染与 AI 计算支持,显著提升仿真效率。
机器人篇:全是“打工人”,
会跳舞、盖章还能递果冻!
在 WAIC 上,曾经被视为“未来产物”的机器人、机器狗、机械臂,如今已成为展馆内随处可见的常态展品。具身智能正迅速从概念走向应用,成为本届展会的“顶流”:
从泡咖啡的服务机器人,到能打麻将的陪伴型机器人,再到各类工业作业机器人,正在多个真实场景中加速落地。
1.银河通用亮相 WAIC:人形机器人值守便利店,机器狗自动捡垃圾
银河通用在展台展示了其轮式底盘人形机器人 Galbot,化身“店员”,可在商超和便利店全天候值守。
观众通过 iPad 下单后,Galbot 能从密集货架中准确取出面包、卤蛋、塑料瓶、果冻杯等商品并送达指定位置。同时,展区还展出了一款具备垃圾回收能力的机器狗,观众可在现场随意丢弃水瓶等垃圾,机器狗能自动识别目标位置并迅速完成拾取操作,体现出其自主感知与动作执行能力。
2.它能跳啦啦操、盖章、分快递,这届 WAIC 最忙的是智元机器人!
在 WAIC 2025 现场,智元机器人 300㎡ 超大展台堪称“机器人职场秀”。人形机器人、四足机器人、灵巧手齐上阵。
展台中,远征 A2 人形机器人能跳啦啦操、讲解展品,活跃展会氛围;灵犀 X2 则主打社交交互,会主动聊天、识别情绪,还能自然回应被打断的问题;精灵 G1 一边服务观众盖纪念章,一边在物流区打工分拣包裹,连条码朝下的快递都能自主翻面;远征 A2-W 聚焦工业应用,精准拆垛、堆叠箱体,还能识别障碍主动提醒。
此外,首次亮相的四足机器人 D1 Ultra 灵活敏捷,能原地翻滚,模拟复杂地形作业;灵巧手 OmniHand 还能与观众玩猜拳、跳手势舞,展现极高操作精度。
当天,百事还联合智元发布“百事酷宝”机器人 IP,由灵犀 X2 定制打造,能识别情绪、递可乐、与观众聊天,并将在 8 月推出联名包装。
3.玩迷宫、叠衣服,Moz1 机器人在 WAIC 火力全开
在千寻智能的点单互动区,观众只需扫码下单,机器人 Moz1 就会帮你辨识各类饮料、精准定位、稳稳抓取递送到手。
Moz1 通过一系列动态动作演示其整机协调性与稳定性:不仅能灵活完成太空步等高难度动作,还能在自由摆动身体的同时,稳稳端起水杯不洒一滴水,展现出强大的动态平衡能力和路径规划能力。
同时,在技术人员的指令下,它能完成“掌上迷宫走珠”、“搭积木”以及精准舞蹈动作,操作流畅自然。
此外,Moz1 还完成了对柔性衣物的抓取、折叠与堆叠,将一堆凌乱衣物整齐码放,呈现出出色的柔性物体操作能力。
扫码关注公众号
获取更多技术资讯