HelloKitty • 2025-03-11 11:25
1014
本文由 雷峰网 撰写/授权提供,转载请注明原出处。
以下文章来源于:雷峰网
作者:刘伊伦
编辑:包永刚
“在资源受限的端侧,有了 DeepSeek 的蒸馏模型之后,比如原来只能部署 7B 模型的场景,现在能达到 14B 模型的效果,让端侧 AI 的能力上一个台阶。”芯片工程师哲宇认为 DeepSee k 的出现对生成式 AI 的普及意义重大。
DeepSeek 的出现让终端侧 AI 的表现超越了一年前仅能在云端运行的模型,端侧 AI 蓄势待发,高通作为连接和计算领域的领导者,也正在加速终端侧 AI 时代的到来。
去年,高通公司总裁兼 CEO 安蒙(Cristiano Amon)就表示,“AI 推理正在向数据所产生的边缘侧转移。边缘侧和终端侧 AI 实现了 AI 功能的扩展,提升了 AI 的性能和效率。它兼具即时性、可靠性和极低时延。数据保留在终端,有助于保障隐私性和个性化。”
最近高通发布《AI 变革正在推动终端侧推理创新》白皮书后,高通公司高级副总裁兼技术规划和边缘解决方案业务总经理马德嘉(Durga Malladi)表示,AI 推理和处理正在全面向终端侧转移。而从硬件、软件到生态的全面适配,高通将加速终端侧 AI 时代的到来。
高通也正在引领端侧 AI 多模态的发展。2025 年世界移动通信大会(MWC 2025)上,搭载骁龙 8 至尊版的智能手机演示了采用 AI 智能体作为用户界面,对音乐、导航、天气和信息等任务的处理。搭载骁龙 X 系列的商用 PC,也具备多模态AI的能力。
DeepSeek「降本增效」,
AI 正在成为终端侧新的 UI
终端侧 AI 是将 AI 直接部署在终端设备上,对本地数据进行处理、分析以及决策。在过去一段时间里,终端侧 AI 的发展受制于模型部署需要消耗大算力、占用存储空间以及高昂的开发成本。
DeepSeek 出现后,高效“小”模型开始涌现,新的蒸馏模型,保持准确性的同时迁移知识,实现更快的推理速度、更少的内存占用和更低的算力需求,让端侧 AI 也能有媲美云端 AI 的效果。
LiveBench.ai 数据显示,对比同为 700 亿参数的 Llama 3.3 和 DeepSeek R1 蒸馏模型各项性能表现,结果显示蒸馏能够在推理、编程、数学和数据分析任务中显著提高性能。
Meta Llama 700亿参数模型和DeepSeek对应蒸馏模型的LiveBench AI基准测试平均结果对比
蒸馏小模型与前沿大模型的性能差距正在缩小,量化、压缩和剪枝等进一步优化技术,推动了较小的高质量生成式 AI 模型的激增,在 2024 年发布的大规模AI模型中,超过 75% 的模型参数在千亿规模以下。
丰富的小模型为边缘 AI 开发者提供了多样化的选择,以用于开发应用和 AI 智能体。
“这意味着我们关注的焦点已不再是模型本身,而是演进到终端上的应用发展。”马德嘉说,“随着终端侧可以运行越来越多高质量的 AI 模型,越来越多的 AI 应用和用例开始涌现。AI 正在重新定义所有终端的用户界面,这也意味着,AI 正在成为终端侧新的 UI。”
AI成为终端侧新的UI
未来,不同的信息输入类型将不直接应用于某个具体的 App,而是先传输到 AI 智能体,AI 智能体接收后再将工作负载分配给后台的不同应用,所有的处理任务都将由 AI 智能体直接完成。
对于终端用户来讲,AI 智能体就是唯一在前端与他们交互的 UI,而所有实际应用的处理都是在后台完成的,用户全程“无感”。
除了简化原有的 APP 交互之外,AI 智能体对复杂任务的推理同样让用户体验“丝滑”。马德嘉在骁龙 8 至尊版刚发布时表示:“智能体能够执行更加复杂的任务,尤其是那些指令不明确的任务。”
引领 AI 推理——软硬件「协同」以及
AI Hub「加持」
如何突破算力以及应用生态的限制助力终端侧 AI 的发展?构建硬件、软件及生态协同的全面解决方案是高通给出的答案。
追求高效处理、保持电池续航对终端侧 AI 的用例至关重要,高通通过提供集成定制 CPU、NPU、GPU 和低功耗子系统的 SoC 芯片,在硬件层面实现能效与功耗的双重性能优势。
以最新发布的骁龙 8 至尊版移动平台为例,其自研的第二代高通 Oryon CPU 性能较上一代提升45%、Hexagon NPU AI 性能和能效均提升 45%,而最新的 Adreno GPU 性能提升 40%,且功耗降低 40%。
在搭载骁龙 8 至尊版的最新智能手机上,我们已经看到了诸多创新的 AI 智能体应用涌现,以小米 15 系列为例,其 AI 智能体“超级小爱”推出两项 AI 功能,“AI 记忆能力”可以协助用户管理个人信息、日程及收藏等,“多模态交互能力”则让超级小爱能理解屏幕中的信息并进行交互反馈。
而为了在平台上充分释放 AI 潜能,高通构建了强大的 AI 软件栈与之协同。软硬件协同让高通构建出更强的竞争力,资深 AI 从业者对雷峰网表示,同样实现一个功能,代码写得好,效率就会高很多。
高通构建的 AI 软件栈包括库、SDK 和优化工具,能够简化模型部署流程并提高性能。以图像生成为例,图像扩散模型 Stable Diffusion 通过高通 AI Stack 进行全栈式 AI 优化,结合骁龙平台上的 NPU 等领先 AI 处理器组件,两年前就能在终端侧于 15 秒内完成 20 步推理生成 AI 图像,无需访问云端,为用户提供高效且可靠的交互式体验。如今,骁龙平台已经支持在终端侧运行高达 100 亿参数的模型和 70 亿参数的多模态大模型。
“开发者不需要知道硬件端的具体设计细节。”马德嘉说,“他们需要的是软件工具库支持、让他们能够按照自己所需,非常自由、灵活地选择他们所需的框架、runtime 和工具,面向任何操作系统设计 AI 应用和智能体。”
通过遵循开发者为中心的策略,高通为开发者简化了在消费和商用产品中集成先进 AI 特性的过程,帮助开发者加速创新。
而为了向各行各业实现规模化 AI 扩展,则需要推动开发者创新走向生态式创新,高通与全球 AI 模型厂商积极合作,并推出高通 AI Hub。
马德嘉表示:“目前已有超过 1500 家企业在使用高通 AI Hub,比如 Meta、Allam、OpenAI等。此外,还有许多服务和软件提供商合作,如 AWS、dataloop、IBM Watsonx、Nota AI 等。丰富多元的合作伙伴,让高通 AI Hub 在能够运行的模型数量、支持的模型厂商数量和整个生态系统的合作方面取得了长足的进步。”
高通AI Hub
高通 AI Hub 支持主流大语言模型和多模态大模型,让开发者可在搭载高通平台的终端上部署、优化和管理推理任务。
马德嘉表示,高通 AI Hub 让应用开发变得非常简单,高通提供大量的软件工具、模型库、编译器,开发者可以编写生成应用并在高通提供的免费云端设备场上进行测试,最终完成部署。高通要做的就是极大简化边缘侧 AI 开发者的整个开发流程。
借助预优化模型库和支持定制模型优化与集成等特性,不仅缩短开发周期,同时增强了与广泛 AI 生态的兼容性。
“我们和全球各个地区的众多开源和闭源模型厂商展开了广泛的合作。”马德嘉说,“这让我们能够和生态系统实现非常紧密的结合,并且在实施我们的 AI 发展战略和推动生成式 AI 创新方面拥有独特优势。”
多终端覆盖,
高通让智能计算「无处不在」
智能手机被认为是最普适的终端设备,骁龙 8 至尊版让 AI 智能体变成手机上的“原生应用”,在通信优化、图像生成以及其他个性化功能上进行助力。
在 MWC 2025 上,荣耀发布全球首款图形界面移动 AI 助手“荣耀 AI agent”,这款 AI 助手通过深度学习用户习惯,能智能识别用户的需求和意图,自动化地进行任务安排。比如,荣耀 AI Agent 可以在用户和朋友的聊天中读取上下文,根据用户的地点和偏好来选择餐厅,并为用户实时预定。这种便捷的交互体验,让用户真正感受到 AI 技术如何在日常生活中发挥作用。这也正是高通在骁龙 8 至尊版发布时,对接下来终端侧智能体体验发展的预测。
需求的演进让终端形态走向多元,智能手机之外,PC、平板电脑及汽车同样覆盖大量消费者,AI 眼镜、XR 以及 IoT 设备则方兴未艾。
骁龙 X 系列平台搭载的领先 NPU,拥有 45TOPS 的行业领先 AI 算力,能够为 Windows 应用带来推理加速,并率先支持诸多 Windows 11 AI+PC 先进特性,带来性能、续航及隐私保护上的全面优化。
骁龙数字底盘解决方案则利用先进摄像头、生物识别、环境传感器以及先进的多模态 AI 网络,提供根据驾驶员状态和环境条件而调整的实时反馈和功能,从而增强汽车安全和驾驶体验。
面对工业互联网的隐私性和数据安全问题,高通推出的 Qualcomm AI 本地设备解决方案和 Qualcomm AI 推理套件让敏感客户数据、调优模型和推理负载能够保留在本地,增强隐私性、可控性、能效和低时延。
“从移动到汽车、PC、XR 以及 IoT 终端,我们都有一系列出色的产品。”马德嘉说,“对于开发者来说,使用搭载骁龙平台的终端进行开发的优势在于能够获得更广阔的应用开发和规模化扩展空间,并且拥有非常全面的产品线选择。”
然而,面对多个不同的终端,开发者担心“多端部署”所带来的兼容性挑战。
对此,马德嘉表示:“开发者不用面向不同平台进行重复开发,只需一次开发,即可轻松实现跨多平台部署。进入高通 AI Hub 后,开发者首先可以看到高通 AI Hub 所支持的所有不同细分领域的芯片平台,如果对 PC 感兴趣,就选择需要的 PC 芯片平台,并选择想要运行的模型,你会看到你在 PC 平台上所选择的模型能够支持的其他的芯片平台。”
在 DeepSeek 带来的发展浪潮之下,智能手机、PC、汽车、AI 眼镜以及 IoT 等各类终端的 AI 功能将被重新定义,一个以终端侧 AI 为主导的 AI 行业新格局正在形成。
扫码关注公众号
获取更多技术资讯