HelloKitty • 2023-02-10 17:28
964
本文由 量子位 撰写/授权提供,转载请注明原出处。
文章来源:量子位
看完谷歌的最新直播,我感觉,微软被“诈骗”了。
谷歌 CEO 劈柴哥前脚刚发文说要推出 ChatGPT 竞品 Bard,又有各种消息暗示 2 月 8 日晚上的发布会会有“新消息”。
不到 24 小时,微软就连夜上线了 ChatGPT 版搜索。
微软 CEO 纳德拉还非常重视地表示:竞争才刚开始。
然鹅,就在外界早已搬好板凳坐等“搜索引擎变天”、一众厂商也纷纷宣布跟进之际,谷歌却是千呼万唤没出来:
这个在巴黎召开的最新直播中,传说中的谷歌版 ChatGPT 露面了,但又没完全露面。
怎么说呢……释出的信息,就等于把劈柴哥的文字稿又给念了一遍……
甚至官方浅浅展示的 Demo 里,还被扒出了至少2处错误。
更多 Demo 示例,没有。技术讲解,没有。上线日期,更没有……
翻译一下,就是 Bard 内测中,将来会整合到搜索里。饼就是这么个饼,好不好吃就不多说了。
这把我和同事们的脸,打得是啪啪响…
群里“退钱”的呼声那是此起彼伏。
这不,直播还没结束,已经有网友坐不住了:敢情大家关心的信息咱一点也不多说呗?
还有网友犀利吐槽:用真正的 Bard 的话来说,谷歌就是在“无事生非”(莎士比亚作品)。
直播一结束,谷歌的股价就呈现出了一条醒目的下降曲线,收盘时已跌超7%,市值一夜蒸发 7000 亿。
还带跌了一众中概股,甚至连微软也没能幸免。
这一波啊,怕不是谷歌下的一盘大棋,既唬住了微软,又给过热的市场当头浇了一盆冷水。
Bard 与 ChatGPT 同题 PK
虽然这场发布会没有公布 Bard 太多细节,但网友们来都来了,自然不会空手而归。
没有内测资格,还可以反向测试,拿 Bard 演示中出现的问题去问ChatGPT,就给了它俩一对一 PK 的机会。
关于詹姆斯韦伯望远镜的新发现,有什么可以告诉我九岁孩子的?
ChatGPT 由于训练数据停留在 2021 年,回答的都还是将来时,对可能发生的情况做预测。
Bard 的消息就明显灵通一些,列举出三个新发现。末尾还贴心地附上一句“这些发现可以激发孩子对宇宙中无穷奇妙的想象”。
这是由于 Bard 背后的对话语言模型 LaMDA——是让谷歌工程师“走火入魔”,认为它有人格的那个模型。
除了神经网络外,LaMDA 还内置了一套工具箱,包括计算器、翻译器和访问搜索引擎获取外部信息的接口。
然鹅,Bard 的这段回答被指出至少有2处事实性错误,成了股价大跌的导火索。
第一条,詹姆斯韦伯望远镜发现“绿豌豆”星系并不是在 2023 年,而是 2022 年 7 月。
第三条,第一张系外行星照片不是由詹姆斯韦伯望远镜拍摄,而是欧洲南方天文台的甚大望远镜早在 2004 年就拍下。
路透社就援引分析师观点,指出谷歌作为 AI 领域的领军企业,在 ChatGPT 这项技术上却“睡着了”。
谷歌匆忙宣传,才导致了演示视频里出现错误答案的尴尬混乱。
而 The Verge 则发文表示,谷歌仍然在把 AI 技术滴灌到搜索、地图和翻译中,并同样把股价下跌归因于“谷歌的失误可能把投资人吓跑了”。
虽然 ChatGPT 出错闹的笑话也不少,但谷歌这样错误出现在官方宣传视频上全球上百万人围观,还是尴尬了点。
咱只能说,大家还要忍受很久 AI 的“一本正经胡说八道”了。
搜索引擎重回风口浪尖
虽然总的来说谷歌开了一场尴尬的发布会,但无论如何,围绕 AI 的一场搜索引擎大战还是打响了。
微软必应算是赢下这一场,国内百度也有了全线产品接入类 ChatGPT 产品“文心一言”的风声,甚至最老牌的雅虎也有了动作暗示重返搜索领域。
毕竟 ChatGPT 诞生不到 3 天,就有网友发现在不少情况下,它比搜索引擎更好使。
Gmail 之父当时还感叹:谷歌距离被全面颠覆可能只有一两年的时间,搜索引擎的结果页面被干掉,最赚钱的广告没有地方可放了。
搜索引擎,曾经是一个时代的王者,最大的流量入口。
后来渐渐被社交网络和信息流应用抢走了风头。
在这期间,谷歌搜索也有数次大更新,其中不乏 AI 技术的参与。
2012 年,谷歌发布大规模知识图谱,从文本搜索进化到语义搜索,并可以直接呈现一些简单问题的答案。
2015 年,机器学习算法 RankBrain 投入使用,可通过预测来处理之前从未有过的查询。
2019 年,预训练模型 BERT 加入,可根据上下文理解整个句子、绕过拼写错误,上线一年后参与了几乎 100% 的查询。
可以看出,这些更新的重点都在提升理解用户意图的能力,对使用体验有不小提升,但都还算不上颠覆性的变化。
以 ChatGPT 和 Bard 为代表的生成式 AI,更大的意义在于从“寻找问题的答案”跨越到“直接完成任务”。
正如谷歌演示中,特别强调了 Bard 可以回答“没有唯一答案”的问题。
微软新版必应提供的的示例也多是“规划一次旅行”、“写一首押韵的诗”这样的开放式问题。
答案此前并不存在,搜索的瞬间由AI生成出来,也就是 AIGC(AI 生成内容)的含义所在了。
但一波热潮之下,也有冷静的人指出新模式的潜在问题:
归根到底内容还是人类生产的,AI 只是能够从训练数据中学习、提炼、模仿。
如全球最大的编程问答社区 Stack Overflow,在人们发现 ChatGPT 能够写代码、给代码写注释还能修复 bug 之后,正在经历流量的骤降。
谷歌又赶个晚集,但并非没有后手
谷歌第一次被吐槽“赶了个晚集”,是在 12 月底的公司会议由内部员工提出。
毕竟逼得各家竞相出手的 ChatGPT,后缀 GPT 里的“T”——Transfomer,还是谷歌发明的。
6 年前,Google 在论文《Attention is All you need》中首次提出 Transformer 模型,它使用自注意力机制,取代了在 NLP 任务中常用的 RNN 网络结构。
谷歌官方博客上提到这点的说法还被网友看出“挺酸的”:
网友不是没有解读出谷歌官方心里的小九九,各种调侃逗乐在互联网上蔓延。
有人拿今日的谷歌比作当年的柯达:
Transformer 是你的项目又怎样,柯达还发明了数码相机呢!
还有梗图画尽了谷歌宝宝心里的委屈:
Bard 背后的对话模型 LaMDA,两年前的谷歌 I/O 大会上就已亮相,去年进化到 2.0。但 LaMDA 一直处于内测之中,并不是所有人都能畅快玩耍。
不过话说回来,谷歌不慌不忙,倒也不仅仅是因为“优势在我”,不想太过主动革自家搜索引擎的命。
浅浅对比一下——
哪怕是接受了两个多月的外部测试反馈和内部调试,ChatGPT 仍然会不受控地口出狂言,发表一些政治偏向或种族和性别主义歧视言论。
需要强调的是,越大的公司对声誉和社会责任的顾虑越多。
去年 11 月,Meta 具有 1200 亿参数语言模型 Galactica,在生成内容里引用文献时,发生作者真实存在但文献虚构,以还存在一本正经胡说八道的情况。
事态引起舆论哗然,短短3天后,饱受争议的团队无奈宣布 Demo(暂时)下架。
无论何时都需要从公司整体战略部署行动,谷歌的考虑不外如是。
这样看来,谷歌现在表现出的不紧不慢,也未必没有更深层次的考量。
但大公司的谨慎小心,在这波 AIGC 浪潮里,多少是束缚住了科技巨头的手脚,让他们总显得慢了那么一拍。
前车之鉴,就是 2022 年同样爆火的 AI 绘画。
玩得最开的,当属 Stable Diffusion 背后的公司 Stability AI。
虽然用户在用其进行 AI 绘画时得按需付费,但它开放源代码,开发者可以完全免费下载底层代码来训练自己的模型。
开放性像一柄双刃剑,让 Stability AI 陷入了版权、监管等诸多争议之中。
但如其创始人兼 CEO 相信的那样,“开源 AI 技术释放人类的创造力”,并带来了巨大的关注和收益。
另一边,伦理、版权多重顾虑缠身的 OpenAI 旗下 DALL-E2、谷歌 Imagen,在藏着掖着地隔岸观望后,才下场公测。
结果么,两家都跌了跟头。
2022 年上半年发布模型后,它俩磨磨叽叽,在 11 月才先后向公众开放。话题度、使用量都明显不如前者。
也正因如此,OpenAI 才痛定思痛,推出 ChatGPT 来抢占先机。
ChatGPT 背后的 GPT3.5 对 OpenAI 来说是两年前的旧玩意。
为了不再被抢风头,做第一个吃螃蟹的弄潮儿,仅用 13 天,ChatGPT 就迎来诞生,并迅速火遍地球。
不仅抢先将对家逼到墙角,ChatGPT 的用户反馈还能帮助收集反馈,以改进新模型。
危急存亡之秋,谷歌被逼打响搜索引擎保卫战,被迫出手 Bard,行动部署里却还残留一惯瞻前顾后的影子:
只给“值得信任的测试人员”内测。
好在谷歌不是没有反将一军的能力。
首先,多年的技术积淀为底。
不仅论文发布数量最多,思维链路提示(chain-of-thought)、大模型涌现现象的研究也走在前面。
其次,一旦开放,谷歌可以利用自身保有的巨大优势:
谷歌搜索的基础用户量大,反馈迭代快。
李飞飞之徒、英伟达 AI 科学家 Jim Fan 在推特预测,Bard 背后,有谷歌 10 亿用户的流量池。
这是谷歌手握的另一张重量级的王牌。
但没有人知道,谷歌搜索的忠实用户,会有多少转化成为 Bard 的拥趸。
那么现在,Bard 依然半掩面,你觉得谷歌还能反将一军吗?
扫码关注公众号
获取更多技术资讯