知乎版GPT正式发布

HelloKitty 2023-04-18 14:39

扫一扫 在手机阅读、分享本文

944

本文由 电商报Pro 撰写/授权提供,转载请注明原出处。

文章来源于:电商报Pro

作者:老电

知乎版 GPT 正式发布

ChatGPT 刮起的人工智能热潮,愈演愈烈,成为互联网大厂竞逐的香饽饽。

在风暴眼中的知乎,也终于坐不住了。

4 月 13 日下午,知乎创始人、CEO 周源宣布,知乎版 GPT“知海图 AI”正式开启内测,同时,基于人工智能的“热榜摘要”开启内测。

此次知乎正式发布的 “知海图 AI”大模型,是由面壁智能与知乎共同训练完成。

1.jpg

具体来说,“知海图 AI”的训练基于面壁智能自主研发的 CPM 企业级大模型 与 ModelForce 大模型系统。基于“知海图 AI”大模型,双方一起尝试探索将大模型能力应用到知乎热榜。

简单介绍一下面壁智能,作为国内最早开展大规模语言模型研究的团队,面壁智能的创始成员主要来自于清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP),拥有深厚的自然语言处理和预训练模型研究基础。

目前,“知海图 AI”实现的主要功能是,针对知乎热榜问题中的所有回答,进行快速的要素抽取、观点梳理和内容聚合,最终生成一个所有回答的梗概。

这项功能可以帮助用户更快、更全面地了解相关问题的讨论热点,以及信息焦点。

与此同时,知乎还将产品的使用效果与 OpenAI 最新发布的 GPT-4 进行了对比。结果显示,两个模型的表现几乎持平。

2.png

值得注意的是,在这个结论前面加了一句限定词,“内容聚合场景”,也就说是上述对比,只针对总结归纳相关回答这一特定场景。

由此可见,知乎版 GPT 的适用范围还有很大提升空间。

实际上,ChatGPT 作为一个以智能聊天形式面向市场的AI大模型,其最主要的使用方法,就是“问答”。

这不免令人想起了问答社区知乎。秉持着“有问题就有答案”的知乎,是互联网场域中最直接面对 AI 冲击的平台。甚至有人认为,ChatGPT 的出现,会最终取代知乎。

对于这个问题,我们此前的观点是,会带来冲击,但却动摇不了知乎的核心。

相较于人工智能冲击的危局,我们认为,这波科技革命浪潮中,更有可能给知乎带来更多机遇。

面对 AI 冲击,如何赶上时代

2019 年,知乎完成总额 4.34 亿美元的新一轮融资时,创始人周源在内部信中这样形容,“知乎所处的环境和阶段,丝毫不容许任何懈怠。快则生,慢则死。”

眼下,人工智能风潮带来的行业转变,比当初的形势更加紧迫。

自去年 11 月 31 日问世算起,ChatGPT 已经爆火了近四个多月。

今年一月以来, ChatGPT 平均每日在线人数达到 1300 多万,比去年 12 月增长了一番,一举打破产品一亿用户的行业最快纪录。

与此同时,在知乎平台上关于 ChatGPT 的讨论热度也持续飙升。

目前 ChatGPT 话题的讨论量达到 29.9 万,浏览量达到 4.9 亿,成为近年来知乎平台上讨论热度最高的话题。

3.jpg

让人们兴奋和疯狂的焦点在于,AI大模型技术就像是一台“万能许愿机”一样,每个人都希望借助它帮助自己处理工作、应付日常作业、快速生成所需要的编码,学习特定人物进行交流,甚至是进行文学创作。

无数人在期待 ChatGPT 带来的美好生活,对于知乎来说也是如此。

相较于技术带来的冲击,如何利用好人工智能技术,追上时代,才是知乎最应该考虑的问题。

目前来看,知乎手里有两张王牌:专业的语料数据、原创问答的社区氛围。

通俗来说,AI 大模型所提供的答案,是从各大数据库中进行“提取加工”,大规模、高质量的资料内容,是它变得“聪明”的关键。相对而言,低质量的语料内容,则会造成大模型的污染,使用效果变差。

而经过十二年来的积累,在中文互联网世界中,知乎已经形成了庞大的问答内容积淀,其内容质量依旧是当前互联网世界中最优质的那一批。

知乎 2022 年 Q3 财报显示,其核心的问答内容已经超过 4.82 亿条,加上专栏等的总社区内容超 5.79 亿条。

4.png

这些精品内容就是知乎版大模型的底层燃料,不仅帮助中文大模型语料库变得更加完善,更加成为各大搜索引擎、大模型的资料来源。

除了优质内容积淀之外,目前的AI大模型还缺乏较强的原创能力,更多是按照一定的行文套路,进行内容缝合。

一个简单的例子是,我们承认 ChatGPT 十分强大,但如何深度使用 ChatGPT 完成工作,实现脑洞,却更多依靠用户的个性化创造。

那么真人问答社区的另一个价值,就是原创和创新能力了。

依靠知乎问答社区氛围的营造,平台正面向更多大众用户开放,对于一些开放性的问题,总有人能给出新颖的观点,这是 ChatGPT 做不到的。

显而易见,只要知乎还能在未来的岁月中持续产出高质量内容,那么会有更多的搜索引擎、大语言模型、对话式 AI 产品优先从中引用信息。这些产品都是为更高效率提供用户知识检索而生。而知乎,也就自然成为这些大模型的“重要食粮”。

值得注意的是,这些利好因素都有一个重要的前提:知乎能够持续产出高质量内容。

聊到这里,我们就明白了问题的关键。

经常使用知乎的朋友可能会发现,相比十年前,现在的知乎内容已经多了很多“水分”,如今热榜上的很多话题,知识性没那么强,很多回答都靠“抖机灵”取巧。

5.png

面对 AI 时代的到来,知乎最需要做的是结合 AI 技术,寻找机遇。但这一切的前提是,好内容。

知乎需要找到答案

从 ChatGPT 问世以来,国内互联行业中,几乎所有抱着创新思想的公司都在寻找向上攀爬的入口,目前国内已有数十家企业相继入局。

最近一个月,百度、阿里这两家最具实力的巨头就相继推出自家的大模型产品,文心一言、通义千问,你争我抢,摩肩接踵。

尤其在 ChatGPT 还未进军中国市场的当下,谁能率先做出同等级的产品,就能在整个行业中拔得头筹。

在这样争分夺秒的竞争格局下,国内 AI 市场迎来了新一轮的爆发期。

典型的例子是红衣教主周鸿祎,在 3 月底的 360 战略发布会上,他亲自测验了 360 正在研发的 AI 大模型,戏称这还是“一个未满月的孩子,还很不成熟,名字都没起。”

6.jpg

如此急切的展示,已经告诉我们行业竞争的焦灼。

但是在火热爆发的市场之下,我们却需要浇一盆冷水:

行业需要的不是催生的早产儿,而是真正潜心做事,关注长期价值的实干家。

同样以 ChatGPT 为例,在 ChatGPT 全网爆火之前,OpenAI 于 2020 年 5 月发表 GPT-3 的论文。

而当时的 GPT-3 已经可以实现编写完整的文章或故事,并且生成人类评估人员难以区分的新闻文章样本。

从 2020 年 5 月到 2022 年 11 月,从 GPT-3 到 GPT-3.5,OpenAI 一共用了两年半的时间。

这样来看,国内的追随者们即使是走在 ChatGPT 已经验证过的道路上,也需要时间,来进行技术攻关、效果优化。

但是我们看到的现状是,很多互联网公司现在就迫不及待地寻找产品落地的应用场景,探索变现和商业化的可能性,这的确有点过于功利了。

对于知乎来说,也是如此。

知乎近些年持续不断进行商业化尝试,包括但不限于:好物推荐(卖货 ,在线教育(卖课)以及盐选会员(卖小说)。

虽然扩大了用户基数,增强了商业化能力,但是却降低了内容质量,原本极佳的社区氛围和用户体验,开始走下坡路。

经过前文的分析,我们已经看到在内容、生态、商业化和AI之间,知乎的真正差异化价值是什么。

7.jpg

而现在,在 AI 技术席卷全网的当下,我们发现知乎最重要的资产,却在过去几年中缓缓流失,这不由得让人感到可惜。

总的来说,在 ChatGPT 掀起的 AI 浪潮下,知乎终于表明态度,拿出了自家的大模型产品,这一点十分振奋人心。

面对全行业的争分夺秒般的竞争格局,我们希望知乎和诸多互联网公司,都能够专注于长期价值,注重技术、优质内容的积累。

有的时候,慢就是快,即使在 AI 全面创作的时代,优质的内容也是稀缺资源。

言尽于此,希望知乎能早日寻到属于自己的答案。

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章