AI时代的微信来了!天工定义了AI超级应用

HelloKitty 2024-05-29 17:29

扫一扫 在手机阅读、分享本文

1305

本文由 罗超Pro 撰写/授权提供,转载请注明原出处。

文章来源于:罗超Pro

作者:罗超Pro

大模型价格战凶猛。

5 月 22 日,腾讯云全面下调大模型价格,混云 -lite 宣布免费。

1.png

随着成本快速下降,大模型全面普及的拐点已经到来。不过,大模型价格战面向的是B端开发者的,对大多数C端用户来说,大模型依然在“只听其声不见其面”阶段,ChatGPT 这一 AIGC 应用鼻祖成了“玩具”,Sora 这样的明星产品无法体验。市场急缺人人能用的大模型应用。

在消费级市场,也有在潜心做大模型产品的玩家,其中来自中国的昆仑万维——天工 AI 就蹚出了一条自己的路。5 月 27 日,昆仑万维宣布,天工 AI APP 日活用户(DAU)已超 100 万,成为极少数进入“DAU 百万俱乐部”的消费级 AIGC 应用,QuestMobile 数据则显示,其月活量已逼近千万。作为大模型C端应用的全能型选手,天工 AI 体验到底如何?

初体验:AI 超级应用,真全能“孤品”

去年 8 月天工 AI 发布了中国第一款 AI 搜索产品,引发四面八方的 AI 产品扎堆搜索领域。随着谷歌发布 Genimi demo,可能就连昆仑万维都没想到 AI 搜索会成为全球 AI 大战的“炸子鸡”应用。

自天工第一款 AI 搜索产品上线已过去 10 个月,现如今的天工 AI 俨然已升级为 AI 搜索为主的多模态全能 AI 孤品。

大多数 AIGC 应用目前还只通过 PC WEB 页提供服务,天工 AI 则支持 PC、App、小程序等多渠道,让用户在不同场景可随时随地免费试用:

. PC 端:www.tiangong.cn;

. APP:在应用商店搜索 App“天工”,支持手机号码一键登录使用;

. 小程序:在微信等平台,【天工AI智能助手】小程序使用也十分简单方便。

2.png

从网站、App 主 界面来看,天工 AI 平台集成了AI搜索、AI 文档分析、AI 画画、做 PPT、音乐生成、视频转绘、AI 写作、AI 语音对话等主流 AIGC 应用,本质就是一个 AI 应用的超级平台。

3.png

天工 AI 支持文字、图片、声音、视频、文档处理等,是第一个真正意义上的多模态 AIGC 产品。可能很多用户对多模态是什么不大了解,其实多模态就是更自然更好用的人机交互,因为人可以任意多种形式(文字、图片、声音、视频)与机器交互,就像跟人和人交互一样自然。

那么,天工 AI 能力到底如何?作为一家新媒体机构的创始人,我每天的工作都有大量场景需要使用 AIGC,我发现常见的AI需求在平台都有对应的服务可以满足,而且完全免费。

刚好我最近接到了一个体验 2024 年新款 iPad Pro 的任务,这个任务串联了天工 AI 的不少核心功能,给大家分享下我的实操案例。

首先,我试着让天工 AI 给我一些小红书的文案建议:

4.png

答案让人惊喜,天工 AI 不只是准确地把握了 iPad Pro 的特性,而且可结合小红书笔记文风加入表情,且每一个表情都不是随意添加的。在文末,天工 AI 还加入了对小红书推荐效果影响很大话题标签,这份文案给人感觉很“走心”,90% 可用。

不过,相较于纯文字而言,小红书用户习惯看图文结合的内容,于是我试着让天工 AI 给我生成一张 iPad Pro 的画报用于笔记。

5.png

结果也不错,画面简洁大方,颜色明亮鲜艳,还真有一点我要求的“金属质感”。

刚好雷科技今天的推文是关于微软 AI PC 的,于是我试着让天工 AI 帮忙制作一张封面图:

6.png

这个图剪裁一下就可以用了——美中不足的是 logo 成了苹果的,但瑕不掩瑜。

如果想要风格不一样的动漫图呢?我试着让天工 AI 智能体下面的二次元漫画给我制图,主题是乔布斯与 iPhone 同步出现,结果也同样能直接用。

7.png

前些年我们新媒体从业者最担心被图片版权机构敲诈勒索,现在有了天工 AI,微信推文的封面图可以自己做了,感觉每年都可以省下一大笔钱了。

除了前面的图片生成功能,天工 AI 最近还上新了一个宝藏功能【AI 视频转绘】,只需上传或者拍摄一段小视频,天工 AI 就能生成很多不同风格的视频,比如动漫、迪士尼等二次元风格,这个功能可太适合内容创作者了。

在白云机场,我拍摄了一则机场忙碌景象的小视频,想用来制作旅行 Vlog。将视频上传到天工 AI 后,我只需指定“日漫”风格,它就能生成一则格调别致的小视频,还挺带感的:

8.png

天工 AI 让人惊喜的功能,不只是图片生成和 AI 视频转绘,它的 AI 音乐生成功能同样堪称惊艳。

让每个人都能创作歌曲的 Suno 一度很火,但 Suno AI 已开始收费,天工 AI 则支持免费创建音乐,且体验更接地气,支持选择不同曲风与情绪,一次可生成三个版本,均可免费下载。

9.png

特别值得一提的是,天工 AI 音乐不只是创作工作,也是 AI 音乐分享与发现社区,AI 创建的歌曲可一键投稿到平台,参与相应的激励活动,说不定哪天你也可以作为 AI kol 在天工上变现了。

据了解,天工 AI 音乐生成大模型是完全自研的,当前 AIGC 音乐在国内外都没有公开可用的开源模型,suno 也没公开任何技术架构。天工 AI 音乐生成在 4 月 17 日上线时,就对外公开了技术架构。

10.png

「天工SkyMusic」自研AI音乐大模型技术架构

「天工 SkyMusic」是中国首个音乐 SOTA 模型,在人声 &BGM 音质、人声自然度、发音可懂度以及综合评分上超过 AIGC 音乐鼻祖 Suno V3,这是中国自研大模型技术第一次在 AIGC 领域领跑全球。

11.png

在写作时,我经常需要阅读一些专业报告并快速提炼出信息,这是让人十分头疼的活儿,因为阅读一份报告需要很长时间,甚至比写稿本身的时间更多。使用天工 AI 的文档解析功能,我可以快速得到文档梗概重点,且可以生成脑图,这比传统目录更一目了然。

12.png

更强大的地方是,天工 AI 还能精准回答“手机相关内容在报告哪一页”这样的内容,我写稿要用到对应内容直接到对应页码精读即可,当然如果你不想自己精读,天工 AI 也支持一健 AI 速读。有一说一,天工 AI 的文档解析确实可以大幅节省编辑、记者、公关、研究员、分析师等人群的时间。

13.png

除了可以解析 PDF 等文档外,天工 AI 生成 PPT 的能力也不俗,比如我最近准备在公司内部展开一个新媒体内容风控的培训,它直接给我生成了一个框架,我还可以选择不同模版一健生成 PPT,整个过程不到两分钟,基本覆盖我要培训的维度,我根据个人经验补充对应内容即可。

14.png

体验后我觉得天工 AI 算得上是真正意义上的全能AI助理。在搜索、写作、对话、文档分析、画画、音乐生成等基础能力外,它通过智能体整合 AI PPT、翻译、百科、口语陪练、旅行规划、内容推荐、编程助理、AI 识图、漫画、数据分析等应用,实实在在地帮用户解决工作、生活与学习中的诸多问题。

在全球范围内,AIGC 产品百花齐放,ChatGPT、Midjourney、suno、Copilot、kimi、文心一言……有的擅长对话聊天,有的深耕办公场景,有的专注长文本。但对用户来说,不同类型的 AIGC 产品分散各处,需重复注册与付费,要解决一个问题则需在不同应用间切换,要用好 AIGC 往往需要系统的学习培训,这在无形中影响了大模型应用的普及。

天工 AI 让 AIGC 产品碎片化的问题迎刃而解。集成如此多 AI 功能、支持多模态的消费级 AIGC 平台,也只有天工 AI 一家,说其是“大模型孤品”不夸张。

天工 AI 让我想到了一个概念:“AI 时代的微信”。

微信在移动时代扮演着“超级 App”的角色,它像一个超级容器,基于小程序等应用形态,让用户可在平台内通信、社交、阅读、开会,还能玩游戏、支付理财、订机票、点外卖、购物。同样,天工 AI 也是一个真正的多模态 AIGC 应用平台,在这里用户可一站式获取所有主流 AIGC 服务,无需在不同 App 间跳转就能解决生活与工作中的诸多问题。

而且跟微信一样,天工 AI 将 AIGC 的使用做到了前所未有的简单:我体验的所有功能都是免费的,没有使用次数等额度限制,而且连注册登录都不需要。

移动互联网的普及微信功不可没,天工 AI 在 AIGC 走向亿万用户中也将发挥一样的作用,其将极大地降低 AIGC 应用的使用门槛,也将有望成为通用型 AI 时代的超级应用,成为“AI 时代的微信”。

AI 搜索鼻祖,如何重新定义搜索引擎?

搜索引擎建立在数据、知识与算法基础之上,与 AI 有着密切的关系,在深度学习阶段,谷歌、百度等搜索巨头就曾是主力玩家。

大模型给搜索带来的变革更加彻底,AI 搜索也成了谷歌、百度等巨头的关注点,而在巨头外,还有 AI 搜索鼻祖【天工 AI】这种基于自研大模型和自研搜索引擎的实力派产品。

2023 年 8 月,天工推出中国第一款 AI 搜索产品——天工 AI 搜索,如今 AI 搜索依然是天工 AI 的核心功能。天工 AI 的搜索界面,跟百度、谷歌等传统搜索引擎截然不同。作为 AI 搜索引擎,其支持简洁、增强和研究等不同搜索模式。“搜索框”变大了不少,这是因为用户使用天工 AI 不再需要学习 Query 等搜索技巧,可直接用自然语言输入任何需求。

15.png

传统搜索引擎要求用户只能输入数十个字,天工 AI 支持长文本输入,且可以给出更加清晰的答案,比如我让天工 AI 与百度分别做一个数学题,天工 AI 不只是得到了正确答案,还给出了解题思路和延展问题建议:

16.png

百度最多只支持 38 个汉字,且只给出了数学题答案:

17.png

我的工作需要关注所有科技行业的发布会日程,团队小伙伴每个月也会手工制作科技行业活动日历,我试着让天工 AI 帮我做这件事情,Bingo!它给出的答案竟然全部正确,信息整理能力完全不输实习编辑,且还贴心地给出了“参考链接”让用户二次确认。

18.png

我是重庆人,喜欢吃面食,我让天工 AI 帮我对比一下重庆小面与兰州拉面,它直接提炼出了对比表格,图文并茂,结果超预期。我特意去看了参考链接里面的内容,都没有对比表格,可见这表格是天工 AI 自行提炼的结果。

19.png

ChatGPT、文心一言等大模型助理也可以回答以上问题,天工 AI 还有什么看家本领呢?

第一个让我种草的是“更强的时效性”。

此前 ChatGPT 等大模型应用因结果过时被诟病——很多大模型预训练数据是一年前半年前的,因此输出的结果无法与时俱进,不可用。天工 AI 则是国内唯一能够支持实时天气、股市、星座运势等信息查询的 AI 产品,能够同时生成特定卡片和对应文本分析,满足用户的高频需求。

比如我最近在关注贵州茅台,天工 AI 可给我最新的股价数据,且通过卡片展示 K 线图:

20.png

第二个超出我预期的是搜索增强。

在启动天工 AI 的“增强模式”后,我体验到了一种前所未有的“增强搜索”:它可以对我的复杂需求进行拆分再推理,通过引导提问摸清楚我的需求,再整合全网海量内容给出我最需要的结果。

比如我在计划去越南旅行时,在天工 AI 输入“越南旅游”这样的模糊需求时,它会推理我可能的需求,问我是想了解签证还是航班抑或是酒店?(图左)。当我明确要查询越南签证办理方式时,它给出了准确的总结(图右)。

21.png

更超出我预期的是,天工 AI 的增强搜索还支持“追问”,当我再问“哪一种签证更快,适合紧急出行”时,它同样给出了准确的答案,堪比专业导游:

22.png

在前几天的 Google I/O 上,谷歌展示了 Gemini 可以给用户规划旅行计划、给出健康食谱,这被一些媒体报道成是很“炸裂”的成果,其实天工 AI 早都实现了,且做得更好,比如针对我的越南旅行,天工 AI 除了可以回答签证等专业问题外,也能给出具体的行程规划,图文并茂,路线科学,基本可直接用:

23.png

很遗憾,国内科技(自)媒体对硅谷公司的科技成果习惯“炸裂式”报道,对国内科技公司的成果却往往视而不见,这种“偏见”真得改改了。

其实 ChatGPT 最初最被外界看好的也是“下一代搜索”,不过它想做全能 AI 助理,看上去什么都可以做,但却没有针对搜索、问答、文档解析、漫画、音乐等等场景进行优化。结果就是,在搜索上,ChatGPT 存在训练数据与结果过时的问题,搜索结果存在较大不确定性,体验很不完整。反倒是天工 AI,针对 AI 搜索进行针对性的设计优化,推出搜索增强模式,提高结果时效性,支持多模态交互,免费零门槛使用,快速构建了先发优势,在巨头入局 AI 搜索时构建起“人无我有、人有我强”的优势。

天工 AI 搜索让我体验了全新的搜索模式,也看到了搜索引擎的全新可能。

搜索的核心价值是加速信息的流通,精准地匹配人与信息/知识/服务。

传统搜索引擎基于 PageRank 算法对海量内容进行匹配再排序,核心比拼的是“排序”能力。

AI 大模型本质是真实世界模拟器,其具备极强的认知能力,可更准确地理解用户需求、更自然地与用户交互、更好地理解内容,进而可对搜索结果进行整理、组合、过滤、筛选、排序乃至再创作等“增强”,基于此,用户不再需要在大量搜索结果中再筛选比对,而是可一步到位得到所求。AI 搜索引擎比拼的将不再是“排序”,而是“需求理解、内容认知与结果生成”的综合较量。

假以时日,AI 搜索将取代传统搜索引擎,成为人们获取信息与服务的新入口。

天工会成为 AI 搜索时代的谷歌吗?

当古老的搜索引擎市场爆发AI战事时,下一个谷歌正呼之欲出。

取代 QQ 的不是飞信而是微信,颠覆淘宝的不是京东而是拼多多。虽然 ChatGPT 曾被视作将颠覆谷歌,但从产品形态与市场反馈来看,针对搜索进行特定设计与优化的 AI 全能助理,将更有希望赢得下一轮搜索大战。

当前市面上出现了不少 AI 搜索引擎,但要么是自研大模型+套壳搜索引擎——其中大多是微软 Bing 接口,随时可能被掐断,要么是套壳大模型+自研搜索引擎,甚至还有大模型与搜索引擎都是“套壳”的,只有百度、字节和昆仑万维的天工 AI 走的是大模型与搜索引擎“双自研”路线。

AI 搜索比拼的是大模型的真实世界认知能力与搜索的产品化能力,赢得 AI 搜索大战的一定是“双自研”的玩家。而在屈指可数的“双自研”玩家中,天工 AI 已构建独特的优势:

首先,搜索基础好。天工 AI 出自昆仑万维,依托 Opera 等业务有着多年的内容与搜索服务沉淀;

其次,AI 基础技术强。2023 年 4 月,天工 skywork 首款国内自研大模型上线,与文心一言、通义千问、讯飞星火并列前四,是国内第一批双千亿级大模型;2023 年 9 月,昆仑万维推出多模态大模型 Skywork-MM,在多模态大语言模型测评 MME 中综合得分排名第一;AI 产品化早。早在 2019 年昆仑万维就已在全球布局 AIGC,在海外有多款成熟 AI 产品;

最后,布局 AI 搜索最早。2023 年天工 AI 推出 AI 搜索,率先构建多模态的搜索能力并延展成全能 AI 助手,在产品完整度、体验与技术上均已形成先发优势。谷歌在 I/O 大会上展示的“炸裂级”AI 搜索能力均是吃天工AI的“剩饭”,多模态搜索、图文并貌的结果以及搜索增强理念,天工 AI 早已具备,且还拥有结果实时性、中文理解能力等差异化优化。可以说,天工AI搜索已具备世界级竞争力,其将有望在新一轮的搜索大战中脱颖而出,换道超车。

从 AI 全能助理角度看,天工 AI 是 AIGC 时代的消费级超级应用平台,堪称 AI 时代的微信;从 AI 搜索的维度看,天工 AI 则有望成为 AI 时代的谷歌。不容回避的是,天工 AI 依然面临一些挑战:

第一是商业模式。当前天工 AI 可免费无限次使用,AI 搜索结果纯净无广告,暂未商业化。此前 Google 母公司 Alphabet 董事长 John Hennessy 曾表示,基于大型语言模型的搜索的成本可能是标准关键词搜索的 10 倍,如今大模型成本指数级下滑,但 AI 搜索商业化仍是行业待解难题,其结果高度精准,很难再像传统搜索一样在结果中插入广告。

第二是内容生态。算法与内容是搜索的基础。PC 时代,基于入口地位与“爬虫”协议,搜索引擎不缺内容;移动时代,腾讯、字节通过超级 App 聚拢海量优质呢日,百度一度因内容匮乏“无源可搜”,因而不得不战略布局百家号、并投资知乎、快手等平台来充实内容生态;AIGC 时代,内容(包括人工创作内容与 AIGC 内容)同样是互联网的基石,天工 AI 基于 Opera 等业务有一定的内容生态积累,但当前结果也依赖对全网内容的聚集,其需要对内容生态进行前瞻布局。

第三是竞争激烈。虽然天工 AI 已占据 AI 搜索的先发优势,但 AI 搜索以及 AI 助理已被行业看好,微软、谷歌、Meta 以及国内的百度、字节等巨头均押下重注。天工 AI 被市场验证的一些产品形态,也正在被巨头们跟进。因此,天工 AI 要持续保持先发优势绝非易事。

在天工 AI 推出后,其母公司昆仑万维股价一骑绝尘,一度进入市值百亿美元俱乐部,由此可见,投资者对天工 AI 的前景还是很乐观的,一方面是看好其有望赢得新一轮 AI 搜索大战;另一方面则是期待其可在 AI 大模型时代成为 AIGC 版的超级应用平台。不论是 AI 搜索的谷歌还是 AIGC 应用的微信,无不都是十分性感的故事,天工 AI 正在用不断迭代的技术与产品证明自己。

(注:本文封面图由天工 AI 智能生成)

24.png

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章