HelloKitty • 2024-01-11 17:18
1562
本文由 新智元 撰写/授权提供,转载请注明原出处。
文章来源于:新智元
作者:桃子 好困
创世纪人机交互的变革前夜,谁也不曾想到,最懂自己意图的 AI 竟是这样的!
一早醒来,拿起手机便可以看到所有的待办事项,全都放在了「我的一天」。
10 点小组内部会议、信用卡还款最后一天、妈妈生日 12 点记得送祝福、腾讯视频《繁花》7 点开播等等,一目了然。
当你偶然在小红书上刷到了很感兴趣的内容,直接拖住图片放到「任意门」中,淘宝京东不同平台同款一目了然。
而且很快,你只需要说一句「下周一去北京出差,帮我订一张机票」,AI 就会根据个人习惯和当天日程,迅速给出 12:30 前到达北京首都的航班。
甚至「先接老婆下班,再接孩子去老地方和朋友聚会」这种只有熟人才能知道的「暗号」,AI 不仅能理解,还能一口气把路径全给规划出来!
AI 能够预判你的预判,难道是科幻中的科幻?
其实不然,它只是一个「越用越好用,越用越懂你」的魔法 OS。
1 月 10 日,荣耀在 2023 开发者大会上带来了行业首个基于 AI 意图识别的人机交互(IUI)操作系统——MagicOS 8.0(魔法 OS 8.0)。
与此同时,首个平台级自研 7B 端侧 AI 大模型「魔法大模型」也正式亮相,不仅强化了全新内核,还为 IUI 提供全 AI 能力的加持。
正如《2001 太空漫游》作者 Arthur C. Clarke 曾说过的一句话,「任何足够先进的科技,都与魔法无异」。
而现在,荣耀正拿着那把 AI「魔法钥匙」,带我们进入人机交互的新纪元。
60 年变革,人机交互走到了哪?
那么,历次的人机交互革命,究竟是由谁定义的?
去年 6 月,苹果 Vision Pro 横空出世,开启了全新的「空间计算」时代,再次革新人机交互的方式。
戴上 Vision Pro,只需眨眨眼,轻轻捏合手指,甚至动动嘴,头号玩家中科幻的一幕立即上演。
说来,这已经是苹果第四次发起改变人机交互方式的挑战。
2007 年的发布会上,乔布斯曾展示了苹果革命性的用户界面历史,从电脑鼠标,到 iPod 点击轮,再到初代 iPhone 多点触摸屏。
显然,苹果登顶世界的背后,离不开以往历史性的革新定义了人机交互。
也就是说,谁能定义交互,谁就是王者。
过去 60 年的技术迭代,曾多次刷新了人们的交互方式。时隔近一个世纪,人机交互范式将迎来第四次革新。
上个世纪 60 年代中期,以 DOS/Unix 为代表的命令行界面(CLI),人机交互的方式是问答式。
然而,这种命令行系统的可用性很差,于是,一种全新的图形用户界面(GUI)就此诞生了。
其标志是,施乐在 1973 年发布了世界上首个第一台运用图形化用户操作系统界面的微型电脑。
从 80 年代开始,苹果 Macintosh,到微软 Windows,图形用户界面一直在 UX 世界占据了 40 年的霸主地位。
直到 2007 年,乔布斯发布了世界第一台 iPhone,开启全新的自然用户界面(NUI)新时代。
这种交互方式带来的惊喜,我们所有人再熟悉不过。
乔布斯台上边演示边说,你只需要将手指轻轻从屏幕划过就能解锁 iPhone
而现在,能够开启下一代 UI 范式的技术降临了。
ChatGPT 的横空出世引爆全球 AI 热潮,大模型再次让 AI 人机交互更迭的齿轮转动起来。
借助大模型之力,智能设备全新的交互方式,必定是更加懂你的 AI。
那么,智能设备操作系统的范式应该是怎样的?未来 OS 发力的正确方向有三点:新交互、新内核、新生态。
2023 开发者大会上,荣耀一系列的发布,就是朝着这一方向前进。
面向未来 AI 和多系统并存时代,以人为中心、AI 使能的个人化全场景操作系统「魔法 OS 8.0」,就是荣耀带来的思考结果和解决方案:
以平台级 AI 为内核,以端侧大模型为加持,驱动基础体验的进化,带来多模态全新的交互范式,将传统基于需求查找的方式,进化为基于 AI 理解消费者意图的人机交互。
同时,以人为中心的智慧互联和服务生态也迎来突破,带来基于大模型的生态和新一代的互联体验。
荣耀的平台级 AI 能力,正在给操作系统插上想象的翅膀。
AI 正在成为操作系统的「魔法棒」,让我们可以跨设备、跨系统、跨生态的去寻找未来智慧新世界的答案。让任何足够先进的科技都与魔法无异。
新交互:魔法 OS 8.0,更懂你的 AI
我们见证了,从传统命令到图形的交互,给人们的交互方式带来了深刻的影响。
到了 AI 大模型爆发时代,人工智能用户界面代表了一种不同的人与计算机交互范式。
我们不再需要告诉智能设备具体要做什么,相反,只需要告诉它想要的结果,便可实现。
而荣耀全新发布的「魔法 OS 8.0」便是那根魔法棒,可以「任意门」,不用跨应用寻找,你想做的都可以一步直达。
打开哆啦 A 梦百宝袋——任意门
和小伙伴约饭时,直接把信息拖拽到旁边的滴滴,立即就帮你呼叫司机了。
你喜欢的专辑图片、做饭菜谱等等,一拖一拽就能直接收藏。
可以说,「任意门」简直就是手癌者的福音。
而且,除了刚刚发布的 Magic6 系列外,包括 Magic3 和荣耀 50 在内的旧机型,也可以在升级之后体验全新的「任意门」功能!
AI 贴心管家,承包了「我的一天」
你的私人助理,何必是个真人?在 MagicOS 中,每个人皆可拥有一个 AI 助理,掌管你的日常生活,并送去贴心提醒。
举个栗子,当你预定了出差的酒店并收到预定信息后,个人助理会读取,并将其列为你的日程。
当老板在微信工作群要求大家参加一个活动时,直接用手把这句话一圈,然后选择「创建日程」。
具体参加时间就录入自己的日程表了。
去医院挂号,收到的挂号信息,直接拖拽到「任意门」中的创建日程,即可一步完成。
对话成片,朋友圈动态全靠它
以后创作视频,就直接动动嘴告诉 YOYO「生成美食的视频」。
AI 便迅根据「提示」从个人图库中选择特定的素材,炸鸡块、菠菜饺子、花式馒头各种与美食相关的图片。
然后,再配上 AI 生成的文案,一个有生活烟火气的视频就做好了。
另外,当你想在相册中搜索有关荷花的照片时,只需把「小荷才露尖尖角」这句抽象的描述或者模糊的诗句告诉语音助手,MagicOS 会自动选取出相关的素材。
相比之下,iOS 却给不出任何结果。
灵动胶囊,一瞥即开
灵动胶囊是每个人再熟悉不过的应用,在 MagicOS 中,你会再次感受到它的魔力。
比如打车时,灵动胶囊会给出车牌,预计到达时间等具体信息。当你想要获取实时状态,只需要盯着几秒,便可自动打开应用。眼神的魅力,就在此呈现。
不仅如此,订外卖、打王者闪回、音乐播放等各种场景,想要了解更多动态,盯着灵动胶囊就可以了。
新内核:模型装进口袋,7B 端侧大模型赋能平台级 AI
在魔法 OS 8.0 这个全新的 IUI 新范式背后,其实是平台级 AI——Magic Live 智慧引擎,在全面使能操作系统。
那么,究竟什么是平台级 AI?
与应用级 AI 不同,平台级 AI 可以作为技术底座,全面使能操作系统,即它是下一代操作系统的「新内核」。
以往,传统的 OS 内核主要负责管理和调度系统诸如 GPU、内存等硬件资源,以确保系统正常运行和高效利用。
但是,随着用户需求的增加,AI 系统需要解析许多与人相关的因子,进而带来真正以人为中心的体验。
对于个人知识库、人的位置和状态感知、人的习惯和画像学习这三类相关因子,传统 OS 无法计算,由此我们需要一个全新的内核。
平台级 AI 强大之处就在于,能够对多种个人因子进行「管理」,以帮助操作系统精准识别用户意图。
这样一来,全新的操作系统便可以为所有人带来「猜你所想,懂你所需」的智慧体验。
这次,荣耀发布了首个自研端侧 7B 大模型「魔法大模型」,正是为全面加持平台级 AI 的能力而打造。
为此,荣耀联合高通攻克了性能和功耗平衡的难题,让自研的 70 亿参数大模型在经过量化压缩后,可以在骁龙 8 Gen3 设备上流畅运行。
另外,端侧大模型还有一个优势——能为用户带来更加个人化、人性化,以及更具隐私保护的全新体验。
就比如,谷歌在去年 12 月祭出 Gemini 一系列多模态大模型中,端侧 Gemini Nano 小模型的参数分别为 18 亿(Nano-1)和 32.5 亿(Nano-2)。
而且,Gemini Nano 已经在 Pixel 8 Pro 上运行,能够为录音做总结,支持 Gboard 中的智能回复,通过对话感知能力提出高质量的回复,节省人们大量时间。
MagicOS 在数据存储方面,采用了荣耀「两锁一芯」的架构,保证模型在端侧安全运行并存储,和端外完全隔离。
与此同时,用户更换手机数据出端的情况下,也会采用 PQC 加密算法护航数据传输,来保证「魔法大模」型对个人数据的安全继承。
值得一提的是,「魔法大模型」还融合了大语言模型、CV模型、跨模态理解模型,具备强大的自然语言理解、文案生成和高效的多模态信息解析能力。
有了「魔法大模型」的加持,便可让平台级AI实现从「感知」到「认知」的跨越;用户理解进化到内容和推理学习;意图决策进化到复杂任务分解,带来了强大的「以人为中心」的场景理解能力。
新生态:「百模生态计划」,凝聚中国AI力量
以「交互变革」为起点,智能设备的架构升级也在不断进化,在这两者双重驱动下,生态边界也在拓展。
每一次都人机交互的发展,都将带来生态的发展。
千万不要小瞧了双击、触摸这些简单的交互方式,交互的本质就是「人与服务的链接」,而它决定了生态的范式。
就拿 Vision Pro 来说,其创新的交互形式不仅让苹果开启了元宇宙的入口,还有可能对元宇宙生态产生深刻影响。
而意图识别人机交互背后,应用服务与系统的关系已经发生了变化,应用形态也可能发生变化,这背后可能酝酿移动互联网生态大变局。
端云协同新生态范式:充分协同端云大模型能力
「魔法 OS 8.0」创新地推出端云协同的新生态范式,以 YOYO 智能助理为载体,可以充分协同端云大模型的能力。
具体来说,端侧大模型作为中控,可理解用户意图,拆解编排任务,高效安全地连接云侧大模型,融合、调度原子化服务,完成跨应用的复杂任务闭环。
基于这种端云协同新范式,用户通过 YOYO 与大模型进行默契对话。而且,还能够确保个人信息不上云,能够保护隐私安全。
手机成为人的思想和思维能力的延伸,端云高效沟通,无需反复确认,给用户带来更便捷安全的服务体验。
「百模生态计划」:魔法 OS 为中国大模型提供入口
另外,开发者大会上,「百模生态计划」正式开启,荣耀构筑了行业首个大模型中控开放架构。
云侧通用大模型和各种行业垂域大模型,可以通过货架化方式融入到魔法 OS 中,为每个用户提供更好的服务分发和任务闭环体验。
就在这次的发布会上,百度智能云千帆大模型平台正式以战略合作伙伴的身份,加入荣耀大模型生态。
针对智慧出行、智慧办公、智能家居、运动健康、影音娱乐多种场景,荣耀正在与各类大模型建立安全高效的连接。
比如,荣耀与航旅纵横正在联合打开通的智慧出行服务:当你需要订票时,端侧大模型根据个人日程安排、到达目的地距离,以及乘机习惯,将个人信息隐藏后,再把需求分解到具体航班时间和航司要求。
接下来,分解出任务后,端侧大模型脱敏后接入航旅纵横千穰大模型,由此便可以获得相应的订票信息。
此外,正如开篇提到的,荣耀与高德也在联合打造的智慧打车功能:一句话即可规划专属于你的最优路线,并自动拉起高德地图一语生成多段行程导航。
综上可见,荣耀正在以开放创新汇聚中国 AI 力量,去构建基于意图识别交互的智慧服务全新 AI 生态。
相信不久的未来,我们将看到中国力量也将成为世界荣耀。
走进 AI 时代 3.0
「魔法 OS 8.0」平台级AI使能的个人化操作系统,以新交互——意图识别人机交互,新内核——端侧平台级AI内核,新生态——大模型服务生态,正探索未来操作系统新范式。
要知道,魔法 OS 8.0 和端侧 70 亿参数魔法大模型的诞生并非一蹴而就,而是荣耀一直以来在技术储备上的积累,并将 AI 布局分为三个阶段。
第一阶段是,2016 年初代 Magic 手机发布,荣耀首次把AI概念引入到手机中,打开手机智慧之门。那时,AI 只是原有应用的辅助。
2021 年之后,荣耀 AI 进入 2.0 时代。「魔法 OS 7.0」操作系统推出,从应用级 AI 升级到平台级AI。
AI 使能的个人化全场景操作系统,能够越来越懂你。
到了 2024 年,把 70 亿参数的 AI 端侧大模型,应用到平台级 AI 上,是荣耀要发展的 AI 3.0。
云侧大模型学习整个人类的知识库后,有着强大的泛化能力,却存在个人隐私的局限性。
由此,荣耀率先提出端侧 AI 大模型的概念。MagicOS 的价值主张是 AI 使能的个人化全场景操作系统,端侧 AI 大模型是平台级AI的进一步传承和发展。
大模型加持下的平台级 AI,能够打造出专属于每个人的系统,可以进行各种多模态分析,基于更多的因素进行决策分析。
在荣耀看来,端侧大模型会让我们拥有更加智能的终端设备。手机能够真正成为用户个人的、智能的助手,处理各种应用的复杂任务。
从「魔法 OS 7.0」到「8.0」的迭代升级,已经突显出荣耀端侧大模型的强大魔力。
除此之外,端侧大模型与魔法 OS 深度融合,革新交互的同时,创造了全新的生态。
我们所看到的任意门,以及端云协同大模型体验,只是意图UI开创的新生态的开端。
未来可期,在操作系统和应用服务的共同努力下,一定还会有许多酷炫得像魔法的场景成为现实。
这一次,荣耀用 AI 大模型重做操作系统,走出了一条不一样的路径,有望成为 iOS、鸿蒙 OS 之外的操作系统第三极!
扫码关注公众号
获取更多技术资讯