OpenAI,为什么没敢推 AI 搜索

zhaoling 2024-05-14 16:28

扫一扫 在手机阅读、分享本文

906

本文由 极客公园 撰写/授权提供,转载请注明原出处。

文章来源于:极客公园

作者:今夜科技谈

本周,OpenAI 搞了一个大花活。

整整一周,不断有外媒获得最新消息,报道 OpenAI 即将推出搜索产品,甚至前几天,已经有媒体拿到了 ChatGPT Search 的提前体验版本——界面仍然是对话交互,但 GPT 回答时会使用网络信息进行回答。

不过,在预热了一整周后,5 月 11 日最新消息,OpenAI 在下周将举行发布会,但将不会发布 GPT-5,也不会发布 AI 搜索引擎。

AI 搜索目前是海内外 AI 创业团队的重要方向之一。在海外,主打 AI 搜索的 Perplexity 目前估值已经超过 10 亿美元。

OpenAI 为什么会选择这个时间点做了一波这样的宣传?如果 OpenAI 真的入局搜索,会对搜索格局带来什么影响吗?对于创业者来说,AI 搜索是一个好的方向吗?

5 月 10 日,极客公园创始人&总裁张鹏、推出国内第一款融入大语言模型的搜索引擎-天工 AI 搜索的昆仑万维董事长兼 CEO 方汉,和投资了最近几个月数据飙升的秘塔搜索的猎豹移动董事长兼 CEO、猎户星空董事长傅盛,在极客公园「今夜科技谈」的直播中,共同聊了聊这个话题。

两位嘉宾都是经验丰富,身经百战的创业者,在外媒传出确切消息之前,就明确指出了 OpenAI 此次传出要推出 AI 搜索引擎的消息,大概率并不是要在此投入巨大的精力,做成一项惊人的产品,而更多的是一场 PR 战术。

两人共同对 AI 搜索背后所需的技术储备、AI 搜索的成本结构和商业模式进行了分析,并对 AI 搜索的未来进行了展望。

极客公园对此次直播进行了整理,分享如下。

OpenAI 做搜索,能做出什么新的花样?

极客公园:OpenAI 为什么在这个时间点上,传出要推出搜索引擎?

傅盛:前天我和朱啸虎一起参加了投中的论坛,他当时有一个观点就是觉得 OpenAI CEO Sam Altman 是一个非常能吹牛的人。我觉得无论怎么说,我们要意识到,Sam Altman 的 PR 能力确实是非常强的。

从历史上来看,他每一次 PR 的时间点都拿捏地非常准确。当时发布 Sora 的时间点,就是 Anthropic 的 Claude3 和其他几个大模型上线的时刻。它们在文本能力上突进地很快,那 Altman 立即给你升维一下,说你看你还在讲陆军的事,我都到空军了,然后立即舆论又都在关注 Sora,OpenAI 又成了业界唯一的明星。

其实你现在回头想想,Sora 从头到尾就是一场 PR,现在都五月了,还是没有开放给公众使用。

1.png

传闻中的 OpenAI Search 测试界面 | 图片来源:赛博禅心

我的观点是,GPT-5 的研发,肯定遇到了一些问题。如果不是这样,直接上 GPT-5 就好了。科技企业,永远都是能早一天就早一天,绝对不能晚的。GPT-5 要不就是性能没有提升地那么惊艳,要么就是成本上特别高。

但以我对 OpenAI 的理解,即使成本再高,只要效果特别惊艳,它一定会往外放,先震你一下再说,哪怕 GPT-5 一天就能用 5 条,那也让你先用一下,让所有的人的目光都过来。所以我觉得 GPT-5 的研发可能还是遇到了一些问题,不管是成本,还是所谓安全性问题,或者幻觉问题,反正多少遇到了问题。

作为 OpenAI 来说,现在这么烧钱的情况下,用户量增长就是它的核心命脉,一旦不增长,融资下笔钱的时候,估值上不能再上一个台阶,就会很麻烦。

所以我觉得这次说要做搜索引擎,就是围魏救赵,我最近经常唱衰 OpenAI,因为我觉得,从一个商业公司角度,其实 OpenAI 走到这里,现在有点骑虎难下。

方汉:我首先非常赞同傅盛老师一个观点,就是 Sam Altman 的确是一个 PR 高手,而且是是绝顶高手。

我认为在 OpenAI 里面,权力最大的其实是 PR 团队,或者说负责去融资的团队,其次是技术团队,再其次是产品团队。我认为这个排序导致了 OpenAI 做出了种种行为。

GPT-4.5 和 GPT-5 为什么迟迟不发?根据我得到的消息,OpenAI 已经训出来了,也不是能力不行,但是它现在没有把握在工程上把这个东西效益最大化。

这个的意思是什么?刚才我们也聊到了,用户涨不上去是 OpenAI 现在最头疼的事情。如果发布了一个新的大模型,它没有把握一次性、瞬间获得足够多的用户,那它就不会上,这是它根本性的原因。

那么发搜索产品呢?我们目前看到的产品形态上来讲,OpenAI 的搜索产品,并没有对海内外所有的搜索引擎产品,形成碾压,形成 SOTA(state-of-the-art,最佳表现),发布这个产品,可能会让用户有一点增长,但不会让用户翻倍增长。所以我认为,这是在 Google I/O 前一周对谷歌的一次战略狙击,它的根本战术上,还是在等待和筹备 GPT-4.5。

极客公园:OpenAI 如果推出搜索引擎,会解决 OpenAI 的什么问题吗?会使搜索引擎的格局有变化吗?

方汉:我觉得它应该能提升用户使用上的体验,但是对大盘影响不大。

最早 Bing 推出 new Bing 的时候,把谷歌都吓死了,但最后对于 Bing 的大盘其实没有什么影响,谷歌过了半年一看市场份额好像没什么变化。我觉得搜索引擎对于 OpenAI 的用户增长也不会有根本性的变化。

傅盛:我还没看到它的具体页面会是怎么设计,但我觉得如果它变成一个默认功能的话,还是多少会增加一些用户的这个感知点的。未必是能带来多少新用户,但是老用户的留存活跃这件事可能能够变得好一点。

2.png

OpenAI Search 测试界面 | 图片来源:赛博禅心

搜索这个功能,对于用户日常将其从好玩,变成当作生产力工具使用,是非常重要的。我其实之前一直不明白为什么 ChatGPT 在发布之初没有增加这个功能,我怀疑,原因可能在于成本。

它本来成本已经很高了,也一直在努力降成本。不加搜索时,本来用户问一个问题,然后模型去预测下一个字,都需要这么多推理成本。

如果加上搜索后,用户问一个问题,你先去啪啪啪搞出几十个网页,抓取下来几千个字,传给模型再让模型总结,那这个成本就高很多了。

极客公园:在部分灰度用户的测评中,我们看到此次 OpenAI 所说的搜索产品,其实产品形态和现有的搜索产品很接近。是不是 AI 搜索的产品形态,没有太多的创新空间了?

傅盛:现在这个形态的 AI 搜索,我觉得创新空间不大。

AI 搜索,是让用户省去了去点网页、选网页以及看网页的过程,而把这个过程用大模型,用 AI 去替你做这件事情。

这里面涉及两个技术问题,一个是把网页收集回来,一个是把网页内容传递给大模型让大模型进行总结。

前者涉及到要建立网页索引库,而不是简单地去百度搜几个网页,然后拿回来加工——百度肯定是不让你这么干的。秘塔搜索也是自建了索引库。而后者涉及到 AI 算法和模型能力。

我觉得形态上大家都是比较类似的,而从模型能力角度讲,目前看来,整理网页内容把它输出出来,需要的 AI 能力,其实也不是那么高,百亿参数的模型已经够了,那后面就是涉及到,谁能把工程化、产品化做的更好。

工程化是什么意思?

技术,我们指的是算法啊等等的进步。比如原来是用牛、马来进行运输,那我现在在算法层面,做出一个超级算法,相当于我做了一个蒸汽机,把这些东西统统搞定,仍然能保证有很强的运载力。

而工程化,指的是,有时候现在没有这么强的一个技术出来,我们怎么去多搞牛、马,协调这一千头牛、一万匹马,来完成一件事,保证它不出错。

AI 搜索,现在虽然是大一统了,在很多细微的地方,就能看到不同的产品,是不一样的。

3.png

PerplexityAI 的搜索界面 | 图片来源:截图

比如用户在问不同问题的时候,看似在做同一件事,其实不同的搜索产品背后,会用不同的分类策略,对问题先进行分类。哪些问题深度要求高,哪些问题实时性要求高,再做对应处理,不同的产品就会体现出区别。

再比如一个回答,是从知识库里调出来只是进行回答,还是纯网页的信息整合?那天我问秘塔搜索,第三次世界大战会不会打起来?你会发现它的回答,不完全是忠于网页内容做出来的报告,它给了我三种可能:打、不打、说不清楚。但是同时它搜了很多网页,为选项做了支撑。这个如何保持一定的客观性,分配权重,是很细的活。

再比如,AI 搜索引擎怎么去做排序?这也是一个点,而且可能未来和传统搜索引擎的点完全不一样。比如传统搜索引擎,一般不会把一篇很专业的,非常长的论文,直接推到用户面前。但是在 AI 搜索下,为了提供更准确的回答,它在搜索引擎所依赖的背后内容的排序上,可能反而是很靠前的。

所以我觉得,未来 AI 搜索产品,拼的应该不是谁的技术特别牛,拼的是如何让搜索结果能够更忠于网页内容,如何做出更体系化的整理这种工程能力和产品设计能力。

方汉:我认为现在的 AI 搜索的产品形态只是一个暂时的一个形式,为了让传统搜索引擎用户,能够很顺畅地迁移到新形态的 AI 搜索上去。但是随着技术和产品的迭代,我相信新的交互形式、新的产品形式都会在 AI 搜索上展现。

比如我们可以看到这次 OpenAI 的搜索 GPT,里面含了一个功能叫 wikis,我认为可能就是用 GPTs 这种 agent(智能体)来实现的。在搜索的时候,可以调用各种各样的模型解决用户的问题,将是 AI 搜索的上限所在。

也就是说,根据用户的特定需求,我可以调用各种各样的模型,我可以调用翻译模型,我可以调用总结模型,我还可以调用 tts 模型,把它转成语音输送给你。如果用户想在论文方向搜索,我专门做一个论文的智能体,调用这个智能体来回答你的问题,这个上限我觉得是非常高的。

在我们的实践过程中,我们的天工 AI 搜索里面已经集成了大量的官方的制作的智能体来提升 AI 搜索的效果,且推理成本其实还是可控的。

但是我这里要吐槽一下 OpenAI。因为我看了 OpenAI 的使用界面之后,我心里的想法是,他们的技术话语权远远超过产品的话语权。

4.png

search.chatgpt.com 的网页存档 目前该网站无法打开 | 图片来源:X 用户 Tibor Blaho

为什么这么说?

它们的产品里,要搜索,首先要选模型,两到三个模型,还要选是否使用图像搜索等等,我觉得复杂度比谷歌还高。我一个做技术的人,我看没有问题,但很多用户一定是用不明白的。他们的所有技术细节都没有藏起来,我开个玩笑,这样做产品的,在张小龙手下,一定活不到第二天。

所以总的来说,我认为 AI 搜索的形态仍然有非常大的进化空间,但具体怎么变,说实话我也很难预测。

OpenAI 也没有带来太多产品形态方面的惊喜,最多就是这个 GPTs,但我觉得在国内的人看来,比起我们熟悉的微信小程序什么的,看起来也还是挺落后的。

AI 搜索好在哪?从设计原理上解决幻觉问题

极客公园:AI 搜索相对于传统搜索引擎有哪些区别,有哪些优势?

方汉:传统的搜索引擎是通过爬虫,把互联网上所有的网页都抓取回来,然后经过清洗跟排序,最后在用户打出查询词的时候,搜索引擎按照自己的逻辑,对网页进行排序,给到用户。整个过程,用户需要自己选点那个网页,点开之后也要自主去看。

而 AI 搜索,让用户省去了去点网页、选网页以及看网页的过程,你直接看到的,就是它对现有网页的一个总结结果,相当于一个搜索小秘书。

它最大的作用是什么呢?是降低了用户的搜索时间,以及提高准确性。

我们都使用过传统搜索引擎。要去打开网页看内容,看完了靠人脑去总结,耗时其实是蛮长的,基本上都要几分钟,但现在大模型替你做这个事情,它可以在几秒钟之内就可以给你一个总结,基本上天工搜索的用户基本上都会反映它极大地提高了大家的工作效率,甚至它一些总结,包括脑图 PPT 你可以直接用。

5.png

天工 AI 搜索的增强模式(共有简洁、增强、研究三个模式)| 图片来源:截图

在传统搜索引擎中,最早谷歌搜索引擎除了搜索按钮以外,还有另外一个按钮 I feel lucky,点一下就直接进入第一个搜索结果,实际上是传统搜索引擎降低交付的走成本的一个尝试。本质上我们现在所有的 AI 搜索就是 I feel lucky 那个按钮所起到的作用,只不过我们做的比他们要好得多。

另外就是准确性。AI 搜索解决了大模型的幻觉问题。大家一开始用 ChatGPT,其实很多人是把它当搜索引擎用的,但实际上它是会经常一本正经的胡说八道。AI 搜索通过 RAG 这些技术,先找到事实,12345,限制大模型根据以上事实来回答问题,能极大地抑制甚至彻底消除大模型的幻觉。

傅盛:我们一定要意识到一点,就是搜索用户在搜索的时候,其实抱着非常多的目的。有的搜索,就是寻址,我懒得记一个网页的网址,我要去那个网页,我就去搜索引擎上搜索一下。不知道大家知不知道,以前百度搜索的第一名,是 Hao123,是一个汇集其他网址的导航网站。

还有一些搜索,只需要一些及时的简单内容,这种也不太需要 AI 搜索。我觉得现在的 AI 搜索,更侧重于一些特定的搜索需求——在一个相对复杂的问题下,对网络上的结果进行综合分析,更偏向于形成某个东西的一份调查报告那种感觉。

6.png

秘塔搜索的研究模式(共有简洁、深入和研究三个模式)|图片来源:截图

当然它从客观上克服了幻觉的问题,但理解 AI 搜索,一个更好的理解是把它理解为个大模型的一个非常垂类的场景,大模型作为主力,去帮我研究一下比如新能源车最近价格是如何变化的,这个助理就帮你去在搜索引擎上找了一堆的文章,然后给你整理了一份报告。

极客公园:用户愿意信任 AI 搜索吗?AI 搜索是不是只是一小波用户的需求,而不是一个大众需求?

傅盛:用户愿不愿意信任 AI 搜索,AI 产品能做出怎样的体验非常非常关键。

比如秘塔搜索,在产品中,它生成的回答,会列出参考的资料,12345,列给你看,增强你的信任感。我看到有些竞品,也列了 12345,但实际上,引用的不是列出来的最新内容。

7.png

秘塔搜索的深入模式(共有简洁、深入和研究三个模式)|图片来源:截图

所以我觉得,用户的信任,可能是需要通过不断地通过品牌的行为,去强化和获得的。

不产生幻觉,我觉得技术上是完全可以做到的。这时候就要看,是不是因为大家做产品做的比较快,细节上做的不够,另外任何搜索引擎,包括传统搜索引擎,也会出现一些误差,能不能把这个比率控制在不影响体验的范围内。

这也是我前面说,AI 搜索现在是比拼工程化、产品化的时候的原因。不是弄一堆文章过来,整理一下,就算做好了。

对 AI 搜索引擎来说,其实用户对于 AI 不信任的问题,反而是其次的。更多的是,如何去用 AI,满足更多的搜索需求。

比如百分之八九十的搜索,可能不需要用到深度分析,我在传统搜索引擎下,搜一下得到一个电话或者地址就好了。这可能是 AI 搜索需要解决的更大的问题。

不过长期来说,所有的搜索,肯定都是 AI 搜索。包括传统的搜索引擎,他们也在看,也在推出 AI 搜索的功能,大家最后肯定是殊途同归的。

方汉:我认为 AI 搜索首先是没有幻觉问题的,因为从技术原理上来说,它是先搜索再总结,然后再通过智能体去处理。在这个流程过程中,我们从源头杜绝了这个欺诈的问题。

同时传统搜索引擎,要列出更多网页,需要保证这所有网页都不是欺诈网页。而我们只需要把这些网页里面我们认为最可靠的三个,互相交叉验证之后最可靠的三个的内容进行总结,展现在网页上给用户去看,那么一定是可靠性是增强了的。

我们都有能力鉴别一个网页是不是欺诈,但并不是所有用户都这样。我们的父母辈,他们真的是没有能力鉴别这一点的。天工搜索有合规小模型,反欺诈模型来筛选网页,也会从 prompt 端优化让模型输出多数网页认可的价值,那鉴别能力低的用户用 AI 搜索,效果一定是正向的。

我们这些很熟悉技术的人,自己很熟悉传统搜索,能够主动地去合适的网站找到合适的内容,所以有时候觉得一部分需求好像 AI 搜索满足不了。但我们不要忘记,AI 搜索从出现到现在也就一年多的时间,随着时间的推移,我认为 AI 搜索在体验、准确性等问题上都会远远超过搜索引擎,

我们的用户数据里看到,天工搜索的用户的粘度是非常高的,非常信任我们。为什么?因为他们会看我们给出的索引。

比如说体制内的人用我们的搜索帮助写公文,他会发现我们索引,引用的都是官方媒体的,他用了几次之后就会非常信任我们,所以我认为,信任会随着时间的推移而逐渐增强。

8.png

天工 AI 搜索的研究模式(共有简洁、深入和研究三个模式)|图片来源:截图

至于用户群体,我刚才也提一下,new Bing 出现后,Bing 搜索引擎的市场份额只有小幅增加。那是因为它当时的智能体的技术不成熟。

用户上来就是搜一首歌、搜个电视剧、看个八卦什么的,我认为这部分需求用智能体一定是可以解决得非常好的。

有了智能体的技术,用户更多的长尾需求可以得到满足,那么我认为用户量的增长是指日可待的。

我完整的经历了中国搜索引擎的发展过程。当初百度搜索在那个北大燕园资源楼办公的时候,我还去参观过。其实最早用搜索引擎的人,也全是像我们这样的一些技术极客,但慢慢的它就会泛化到全人群。我认为 AI 搜索也是这样。

现在使用我们 AI 搜索的主要用户应该还是白领用户以及技术极客居多。随着时间推移,AI 搜索也一定会逐渐被更多样的人群使用。

AI 搜索的商业前景:成本低于 5 美分就能盈利

极客公园:传统的搜索引擎,用户免费使用而 B 端投放广告,形成了成熟的商业模式。AI 搜索中,用户直接得到搜索结果,会不会改变商业模式?能够盈利吗?

方汉:上个时代的搜索成本,它首先有个固定开销,就是你的爬虫集群的开销,这个爬虫集群,如果索引全球的网页的话,那基本上在 3, 000 台服务器到 1 万台服务器之间,这是个固定开销。

另外一部分成本就是做 page rank(网页排名),这个服务器规模是更为庞大的,且是动态开销。你的用户越多,你这个集群就需要越大。

在这两个开销之外,还有人员成本,还有保护费的成本——比如说谷歌每年要给苹果交钱,让苹果保留使用谷歌作为默认搜索。

所有这些都加起来之后,谷歌每年搜索引擎查询次数是 3.3 万亿次,单次搜索的成本是 0.2 美分。然后整个谷歌搜索广告的收入是 1, 500 亿美金左右,去年可能是 1, 600 亿差不多,可以算出来差不多一次搜索产生的收入是 5 美分左右。

然后再跟大家说一个数字,OpenAI 早期的成本,注意不是现在的成本,早期的成本,一次对话的成本是 36 美分,就是你可以看到这里面有几个数字差,36 美分、 5 美分、 0.2 美分。可以看出来,推理成本,是 AI 搜索商业模式中非常关键的因素。

我再跟大家分享另外一个数据,文生图有一个开源模型,叫 Stable Diffusion。我记得非常清楚,在 2022 年的时候我开始使用它,当时一张 4090 的卡平均是跑 3 分钟出一张图。今天我用 4090 还是同一张卡,我一秒钟能出 100 张图。可以看出,推理的优化速度非常快。我认为跟摩尔定律是有点像的,推理成本的下降速度跟摩尔定律是一样的,非常快。

甚至未来,端侧推理变得足够成熟之后,在端侧去做这件事情,几乎不存在推理成本了。我认为 AI 搜索商业模式应该很快就可以打正,这只是一个时间问题。

在商业模式上来说,最基础的 AI 搜索的商业模式,一定是靠广告信息流,那么这个商业模式也是非常成熟的。实际上国内的单个搜索,能够收到的钱比国外高很多,但基本上也是在 5 美分或者是几十美分这种量级,我们认为这个东西短期内也不会有太大的变化,所以我们也在一直优化,一定要把我们的推理成本打到 5 美分以下,整个商业模式才会成立。

我认为这个现在也不是特别难的事,这一天迟早会到来。

我们还会做智能体,智能体实际上属于 VIP 服务了,还可以收到更高的费用。

傅盛:在商业模式的问题上,首先每次搜索成本的价格必须降下来。

Transformer 那种大架构,如果你千亿参数,你每一个网页你都送进去喂一把,来一下上下文,那最后它就是很贵,搜索成本不降下来,你找用户收钱,每月收你 100 块钱,我还得限制你用多少次呢,商业模式就是算不过来账。

秘塔搜索的创始人是猎豹移动以前专门负责 NLP 的首席科学家。秘塔搜索特别值得一提的是,他们做产品的时候,思路非常清晰,搜索成本一定不能高。

秘塔在搜索背后的这个模型,大概也就是百亿参数,是自己训的一个模型,所以使得秘塔搜索的每次的搜索成本是非常低的。现在有的大模型,几百万字上下文,可能一次搜索的成本要几十块钱。

9.png

秘塔搜索的深入模式(共有简洁、深入和研究三个模式)|图片来源:截图

我觉得由于需求的这个场景越来越明确,然后大家如果在这个网络框架或者算法上去发力,整个行业一起努力,我觉得成本会降得很快,可能最后降到一个和传统搜索成本差不多,或者稍微高一点点的水平,这是我个人一个判断。

而真正未来的商业模式,也许是一个复合模式。比如秘塔搜索里面,有个功能叫深度分析,可能以后那种深度分析的功能就是会员享受的。具体的秘塔商业模式会怎么发展,我不能替创始人回答,只是一个想法。去年秘塔这个团队都是盈利的,它没有像 AI 公司一样去烧钱,是非常务实的团队。

极客公园:AI 搜索是创业者的好机会吗?

傅盛:AI 搜索,我们叫大搜索创业,肯定不适合大部分创业者。竞争对手都是巨头,压力很大。

其实 AI 出现对搜索大厂本身是增强的。

为什么大家现在开始用小红书搜索一些娱乐内容,讲难听点,就是因为今天百度不好意思公开地去抓人家不让抓的数据。但有了 AI,大厂可以偷偷抓,变成自己的内容吐出来,像是洗稿,那其实是增强了它的能力。

而且大厂其实不是没有 AI 的能力,AI 的能力是传统搜索团队的覆盖范围之内的。传统的搜索引擎公司,想做 AI 搜索,核心是成本问题,不是能力问题。创业者尽量不要去打人家火力范围内的事情。

对于大厂来说,它不着急。这波人工智能下,我认为即使英伟达的股价泡沫破灭了,谷歌可能都是比较稳的。它只要不断地做 Gemini,等到整个商业模式变好了,再开始大力推。

只要大厂不犯重大错误,大搜索格局上,很难有大的变化。

但是我觉得 AI 搜索的这个模式,对于很多垂类来说,是可以做的。随着一些基础技术和 AI 的普及,比起以前,创业者做一个垂类搜索的速度快了非常多。

搜索可以无处不在,它不一定要以一个大搜的形式存在,所以创业者可以考虑在你的各种产品当中去加一些 AI 搜索模块。因为 AI 搜索它整个的能力已经上来了,成本也降下来了。做模块可能比以前要简单得多、也会多得多。

方汉:首先我认为 AI 搜索不是创业者一个好的方向。很简单,AI 搜索,如果你要想做到成本最低,你一定要自建搜索引擎索引库,这个成本是非常高的,我不觉得一个小创业者能解决这个问题。

我们公司做这个事情是因为我们原来在海外做 Opera News 这个新闻推荐产品的时候,从 16 年开始就自建了一个比较小的一个搜索引擎,我们当时每天大概索引 5, 000 万个新闻网站,我们整个 AI 搜索的引擎团队是一脉相承的,也就是说我们做这个搜索引擎的集群已经做了有七八年了。

索引库实际上就是爬虫集群和存储集群。比如有做个人站的,你能看到的个人站上,有几个网站带着 bot 的标志来爬虫你的个人站了,你就知道有哪几个公司是有自己的爬虫集群的。

这一块其实是一个比较大的成本,因为如果你没有的话,你就得去买第三方的服务,比如调用 Google 的或者是 Bing 的索引库,给他们钱。那基本上,购买第三方服务就可以把你所有的利润都吃完了。谷歌自己的成本是 0.2 美分,那你觉得它会卖你多少钱它觉得合适?

这个成本远比你的推理成本要高,而且推理成本在迅速地下降。

看未来的话,AI 搜索最后可能不会取代市场上的老大,但它有可能把市场上的老二老三给挤下来。

即使现在有谷歌搜索,其实同时仍然还有很多的搜索引擎。垂类的搜索引擎活得很好,比如 DuckDuckGo。我认为这种引擎反而是未来受到威胁最大的。

另外我反复强调智能体,你的智能体如果能够满足一部分垂类用户的需要,那你这个 AI 搜索就能够长期存在,而这些特定领域,搜索巨头未必能覆盖的到。举个例子,搜论文,谷歌做了一个学术搜索,但是在中国有知网,然后在海外还是有 Arxiv,垂类领域我们认为 AI 搜索通过智能体的赋能空间还是非常大的。

10.png

天工 AI 的智能体广场 | 图片来源:截图

极客公园:未来搜索这个形态本身,还有搜索的市场格局,会发生变化吗?

方汉:一个比较少被讨论的点是,在现在的搜索格局下,谷歌和百度这两个搜索巨头,都在自建内容闭环。谷歌给 Wikipedia 捐了很多钱,20% 的流量落在 Wikipedia 上。百度有百度百科、问答等等。

大模型可能会完全颠覆内容闭环这件事。Wikipedia、百科都需要人工编辑,只要需要人工编辑,维护成本就非常高,而目前看到,大模型是有机会自己去生成 Wikipedia 的。我觉得下一段时间 AI 搜索都会聚焦的一个方向,是内容生成。

包括我们看到,微软的新模型,是使用 GPT-4 生成的教科书来训练的。大模型现在已经可以生成教科书了,虽然这个教科书用来训练模型,我们实际看到其实效果不太好,但仍然可以侧面说明,我们离生成合成数据越来越近了。

传统意义上的搜索,它只是一个很长一段时间最适合我们获取信息的一种方式。然后随着大模型的进步,随着 AI 的进步,我们认为我们有能力给用户提供更方便、更直接的这样一个体验。只要你能够让用户真正的省时间,真正的能提高准确性,变方便,那么你的使用率自然会上升,你的留存自然会变好。

大家都现在都在卷模型的指标。以后当技术进步放缓的时候,我认为产品就会介入。现在这一波 AI 创业中,产品的话语权是远远低于技术的,我认为这个情况是不太正常的,长期来看一定是改变世界的是产品。

未来的搜索市场份额,我认为新产品一定是能拿到的。谷歌这样的大公司,沉没成本太高了,行动速度一定是比新产品慢的。但是能不能守住这个市场份额,以及能不能颠覆这个市场,是不一定的。

11.png

2023 年搜索引擎市场份额 |图片来源 YouTube Data Wrap

可能颠覆市场的是做操作系统的,或者是做别的产品的公司,一下子降维打击,把搜索引擎的市场搞没了。端侧推理和智能体,都可能带来颠覆创新。

傅盛:五年之内,搜索的形态可能会发生一些变化,可能真的会从一个纯服务端的变成本地化的。意思是,我真的不再去打开一个网站了,我就在手机上问我的 Siri 就行了,每个回答给我 20 字,直接满足我 90% 的需求。

我不知道这件事会不会真正发生。但是端上运行的大模型,将变成一个非常重要的变量。

像我刚才讲的,搜索市场本身,在原来的格局下,我看不到第一名被颠覆会有很大可能性发生。234 名可能会有些变化,谁在这个 AI 上怼的快,可能市场份额就上去了。

但是我觉得,明年我们可能会看到一个结果,就是端侧推理,会不会给整个搜索形态带来重大的变化。

苹果六月份就要发布他们涉及到端上模型的方案。当时财报会,有人问苹果公司,你这么大一个公司,买 GPU、卡买的不够多。苹果的回答是我们是混合模型,大模型我们用合作伙伴的,端侧本地模型我们自己研发。它对本地模型是极度重视的。

行业里现在已经分两派了。OpenAI 那派推 7 万亿 GPU 小镇,在扩云端模型。而另一派,就是关注本地。微软,到苹果,到高通,现在都在推 AIPC 了。

12.png

苹果 M4 芯片 强调 AI 功能 | 图片来源:发布会截图

我觉得其实第二派会更快地到来。有可能你的电脑以后就是一个搜索引擎了,那我觉得这个可能对搜索引擎的模式是完全的颠覆。

我本地一个 APP,到百度抓五六个网页,自己回来做分析。你说百度不让我抓?这个没办法不让抓,你也分辨不出来,我就是一个用户。那到时候,搜索引擎的整个商业模式就完全没法成立了。

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章