HelloKitty • 2024-11-13 16:37
885
本文由 雷科技 撰写/授权提供,转载请注明原出处。
文章来源于:雷科技
作者:钟立磊
AI 眼镜迎来了一位新的挑战者。
11 月 12 日,小度科技 CEO 李莹在百度世界 2024 上正式揭开了小度 AI 眼镜的面纱。
在一副与传统眼镜几乎无异的外形下,小度AI眼镜不仅集成了一副耳机和一个摄像头,更重要的是作为全球首款搭载中文大模型的原生 AI 眼镜,在实现多模态交互的基础上,将支持边走边问、识物百科、视听翻译以及智能备忘等一系列AI功能。
小度的入场,也让「AI 眼镜」这团火烧得更旺了。
从今年伊始,大模型涌入硬件后就迅速催生出大量的 AI 硬件产品,「AI 眼镜」作为这一赛道的热门之一,Ray-Ban Meta 在发售半年后获得了一百万的销量。与此同时,大量科技公司都在尝试进入这个新兴的领域,甚至彭博社在最近的报道中披露,苹果内部也在推进代号「Atlas」的 AI 眼镜项目。
这种热情并不难理解。在 AI 眼镜的火爆背后,其实有着一条非常清晰的逻辑:在满足传统眼镜光学功能的基础上,AI 眼镜还可以集成开放式耳机和摄像头,用更便捷的方式满足了很多消费者的智能化需求。正如从传统手表到智能手表的升级,在满足便捷查看时间的基础需求之上,智能手表加入了更多的智能功能。
不过,AI 眼镜或者说智能眼镜并不是一个突然出现的产品,早在好几年前,华为等其他厂商就一直在推出类似的产品——将耳机或者摄像头集成到传统外形的眼镜中,但始终没有引起消费者的兴趣。而转变背后最关键的变量是:
大模型来了。
简单来说,大模型带来了更聪明的 AI,真正意义上让人与 AI 之间的语音交互、甚至多模态交互变得能用、好用,也让 AI 眼镜的智能化升级有意义。就像如果没有多点触控的支持,初代 iPhone 的智能化也无从谈起。
但大模型到底让 AI 眼镜发生了哪些变化?一副好的 AI 眼镜需要什么样的能力?小度又会在 AI 眼镜的进程中扮演什么样的角色?
大模型涌入眼镜,
AI 重塑智能体验
很多人都需要眼镜,这是一个不争的事实。但当大模型涌入眼镜,会发生什么样的改变?
就拿刚发布的小度 AI 眼镜来讲,不仅省去了一副耳机,还集成了一颗 1600 万像素的摄像头,可以随时用第一视角记录下生活和旅行中的精彩画面。更重要的是,大模型技术的应用让 AI 眼镜能够理解用户的意图,带来革命性的多模态交互,真正超越单一功能设备。
众所周知,大模型带来最大的变化之一就是更强大的自然语言理解能力,用户当然也就愿意跟 AI 进行更高频的交互。正如小度今年初换上了新「大脑」——基于百度文心大模型打造的 DureOS 操作系统,智能水平有了质的飞跃,在 AI 对话聊天中用户跟小度进行多轮交互的次数,比起传统的语音对话,整整提升了 700%。
换言之,基于大模型的「AI 智能进化」奠定了 AI 眼镜把语音作为主要人机交互方式的基础,就算只是语音拍照、录像、播放音乐/播客等体验也会有根本的改进。
更何况,大模型还带来了前所未有的功能和体验升级,尤其搭配摄像头带来的视觉能力。比如小度 AI 眼镜上的翻译和总结功能,出国旅游的时候,不管是机场、酒店的信息,还是在餐厅看菜单,都能让小度“阅读理解”后,为你进行讲解。
在旅游时,遇到一处陌生的建筑或景点,这时候 AI 眼镜就可以作为「AI 导游」,结合视觉、定位以及知识库直接介绍景点。
简单来说,大模型驱动的 AI 眼镜不仅人机交互变得自然、流畅,同时也在从「智能硬件」向「智能助手」转变,让用户能够随时随地,通过 AI 从不同角度、不同深度理解世界。如果还有共享用户视觉的能力,则是更进了一步。
做好一副 AI 眼镜,
关键在哪里?
放眼当下,AI 眼镜变得越来越炙手可热,也有越来越多新品推出,不过总的来看大抵是两类:一类就是在AR眼镜上通过接入大模型获得AI能力;另一类则是基于大模型原生开发的AI眼镜,同时集成了音频和 AI 模块,甚至还有摄像头,但并不搭载光学和显示模块,典型代表就是 Ray-Ban Meta 和小度 AI 眼镜。
这两种 AI 眼镜的差异不仅反映在能力的差异上,更直接关系到它们的日常体验中。
AR 眼镜由于搭载了光学显示模组,虽然有了显示能力,但相对应地,重量和成本都会有明显地增加,续航也面临很大的挑战,很难做到长时间配戴。
而带摄像头的 AI 眼镜,虽然不支持显示,但受益于大模型原生的智能能力,完全可以进行更自然、顺畅的人机交互,同时砍掉光学显示模组,不仅意味着成本的降低以及续航的提升,更重要的是可以设计得更轻薄,实现更长时间的配戴,使用场景更加广泛。
实际上我们会发现,要真正做好一副 AI 眼镜,绝不仅仅是简单地利用供应链资源进行组装,而是涉及方方面面,根本在于软硬件一体化,以及与大模型的深度融合。
这也是 Meta 和小度能做好一副 AI 眼镜的关键基础。小度 AI 眼镜就搭载了基于百度文心大模型的 DuerOS AI操作系统,不仅和 Ray-Ban Meta 一样支持视觉 AI,而且在自然语言交互、多模态感知、拟人化呈现等方面,都有极佳的表现。其次,在软硬一体化优势的产品定义能力上,小度打造了智能屏、健身镜、智能学习机、闺蜜机等各种智能设备,沉淀了非常深厚的硬件能力和供应链资源。
不过另一方面,用户对 AI 眼镜智能化的需求具有明显的本土化特征,语言、文化和使用场景的差异也会在一定程度上决定 AI 眼镜的体验。换句话说,在中国市场,AI 眼镜必须更懂中文,更理解中国用户的使用需求和场景。
在这一点上,国产 AI 眼镜显然更有优势。尤其是小度 AI 眼镜,背靠百度文心大模型这个全球最懂中文的大模型之一,在中文环境下能够更准确地理解我们的意图,生成更高质量的回答。另外小度还能无缝接入百度及⾏业伙伴丰富的数据、应⽤⽣态,进一步扩展AI眼镜的“软实力”。
同时小度也更懂国内用户。正如前文所提到的,小度旗下设备众多,并且都取得了不俗的成绩。按照官方给出的数据,小度各类智能设备目前已经覆盖了超过 4600 万家庭用户。
这也正是小度 AI 眼镜的本土化优势所在,再加上小度、百度以及行业生态的应用支撑,让用户在出行、学习、办公、娱乐、健康等与眼镜紧密相关的场景下也能享受到全面的服务。
一言以蔽之,通过深耕中文大模型和中国用户的实际场景需求,充分发挥自身的内容和生态优势,小度 AI 眼镜可以更加灵活、精确地满足国内市场的多样化应用场景。
市场爆发前夜,
AI 眼镜需要新的破局者
作为一种新品类,随着产品的出圈、市场热度的攀升,AI 眼镜可以说已经有了一定的用户认知。但 AI 眼镜想要在国内市场普及到更广泛的用户群体,仍然还有很多方面需要攻克和改进。
重量、续航、影像、音频……还有更多的功能和更强的智能,它们共同构建的功能和体验,每一个方面都关乎用户对于 AI 眼镜这个新品类的认知和接受度。这些改进当然不简单,尤其是要在保持 AI 眼镜轻便、长续航的同时,对软硬件以及大模型都提出了严苛的要求。
所以,AI 眼镜行业需要新的破局者,尤其是在国内市场,通过垂直整合软硬件以及大模型的能力,解决用户在使用中的痛点、痒点,打造一副打动中国消费者的 AI 眼镜,从而带动整个市场向前发展。
从这个角度来看,小度的入场不仅是自身「AI+硬件」战略的延续,以及 AI 眼镜的产品升级,也是在探索中国 AI 眼镜的产品范式,推动整个行业的迭代优化。
扫码关注公众号
获取更多技术资讯