HelloKitty • 2023-06-08 15:33
2721
本文由 猎云精选 撰写/授权提供,转载请注明原出处。
文章来源于:猎云精选
作者:王非
“我们也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”
在腾讯 2023 股东大会上,马化腾针对大模型“低调、憋大招”这一问题,作出了上述回答。
掌舵者“不急”,腾讯上下自然“低调”。自研“混元大模型”之外,对外投资亦是如此。
就在刚刚过去的周五,一天之内,腾讯接连被爆投资两家大模型创企。“首次投资”来源于市场消息,第二次则来源于白纸黑字的工商变更。
伴随腾讯大手笔投资,前者据传已成为“独角兽”,后者也相差不远。
依然是熟悉的感觉,腾讯这个“超级 VC”,又回来了!
4000 万美元投向 MiniMax,催生 AIGC 独角兽
大模型热潮之下,被冠以“腾讯首次投资”的创企,名为 MiniMax。
6 月 1 日,据路透社报道,国内通用大模型初创企业 MiniMax 完成了超 2.5 亿美元新一轮融资,目前公司估值超 12 亿美元。在本轮融资中,有腾讯有关联的实体参与,参投资金或为 4000 万美元。
此前,MiniMax 已完成两轮融资,投资方包括米哈游、IDG 资本、高瓴创投、云启资本、明势资本等。云启资本曾在 4 月份发文确认,该机构于 2021 年投资 MiniMax,是天使轮中唯一的早期投资机构。
来源:天眼查
公开资料显示,MiniMax 隶属于名之梦(上海)科技有限公司,该公司注册成立于 2021 年 11 月。MiniMax 联合创始人为前商汤科技副总裁、通用智能技术负责人闫俊杰,也曾担任商汤研究院副院长。
MiniMax 法定代表人、技术合伙人杨斌于 2014 年在中科院自动化所第一次参与深度学习相关的项目,2016 年前往加拿大多伦多大学攻读博士学位。在海外留学期间,他先后作为创始团队成员在 Uber ATG 研究院、自动驾驶初创公司 Waabi 等团队供职,拥有多年研发经验,对基于数据驱动的端到端系统问题颇有研究。
今年 2 月 16 日,MiniMax 在北京举办的小型媒体沟通会上曾透露,团队人数已过百,公司核心技术研发成员均来自全球知名高校和全球顶尖科技公司,拥有世界顶尖自然语言处理、语音、计算机视觉、计算机图形学等工业界和学术界经验,1/3的团队成员拥有世界顶尖技术实验室的博士学位。
据介绍,MiniMax 直接从底层的基础模型做起,自研了三个 foundation model(基础模型)——文本到视觉(text to visual)、 文本到语音(text to audio ),文本到文本( text to text)。
杨斌表示,MiniMax 可能是国内第一家同时拥有三个模态大模型能力的创业公司。“只要做好这三个模态的基础大模型,就能提供非常好的内容生成能力。”
而在三个基础模型之上有一个计算推理平台,将三个基础大模型的能力以一种低成本、高鲁棒性的方式释放给用户。
目前,基于该推理平台 MiniMax 在去年 11 月推出了第一款 to C 的用户产品 Glow,是一款能够让你与 AI(人工智能)技术创造的“智能体”实时交流、沉浸互动并建立情感羁绊的应用。上线四个月后,其注册用户数量已达近 500 万。
来源:官网截图
Glow 官网显示,该产品隶属于北京稀宇科技有限公司,注册成立于 2022 年 9 月,法定代表人为周彧聪。作为 MiniMax 核心成员之一,周彧聪也被证实是商汤科技早期员工之一,曾经在商汤科技研究院带领算法团队。
杨斌还表示,MiniMax 的初心是实现通用人工智能,而这必须要靠一个开放的生态。所以从今年开始,MiniMax 会逐步开放 API,让更多的个人用户和企业用户基于多种模态的大模型构建自己的应用。
于是在 3 月份,MiniMax 就推出了面向企业用户的 API 开放平台,支持文本和语音模型的服务调用。
4 月 18 日,金山办公发布生成式 AI 应用 WPS AI,接入的正是国内合作伙伴 MiniMax 的自研大模型。基于 MiniMax 三个模态的基础大模型,WPS AI 目前已提供文档的起草、改写、总结、润色、翻译、续写等功能,并将在人机交互问答方向持续优化。
除 WPS 外,MiniMax 还与国内游戏、社交网络等多个行业内的头部公司达成合作,国产自研大模型正在迅速成为生活中的基础设施,为人们的生活和工作带来便捷和高效。
值得一提的是,在大模型对战平台 SuperCLUE 琅琊榜首发排行榜上,MiniMax 模型以 1188 分登顶国服,全球位列第二。
位列第一的是 Anthropic 公司开发的 Claude,紧随 MiniMax 其后的是 1171 分的 GPT3.5。
这是国内大模型首次在公开测评中超过 GPT3.5。
腾讯好未来“捡漏”入股,王慧文曾有意收购
天眼查 App 显示,5 月 31 日,北京深言科技有限责任公司发生工商变更,股东新增腾讯旗下广西腾讯创业投资有限公司、好未来旗下公司欣欣相融教育科技 (北京)有限公司等,同时,注册资本由约 131.6 万增至约 183.5 万元。
所以,从时间维度,以及工商变更的确定性上,深言科技才是腾讯“首次投资”的大模型创企。
有意思的是,此次腾讯好未来入股深言科技,颇有“捡漏”的意味。
作为最早一批入局大模型的互联网大佬,王慧文在招兵买马上速度惊人。“带资进组”的他,自然可以用“买买买”来换取时间。
潜在的收购目标,至少有三家:一流科技、面壁智能、深言科技。最终,王慧文成功并购了一流科技,对另外两家清华 NLP 校友公司“很感兴趣”的消息,也在市场上流传一时。
据称,王慧文确实与面壁智能团队有过接触和交流。经综合考虑,这家公司还是决定独立发展,并在后续获得了知乎投资。
此前,深言科技已“低调”完成两轮融资,并未官宣,投资方包括奇绩创坛、英诺天使基金、红杉中国等。据传,该公司完成第二轮融资时,估值已达 1 亿美元。
可能是因为发展势头迅猛,王慧文为光年之外挑选潜在并购对象时,才会考虑过深言科技。也或许是后者估值已然较高,才让两者“遗憾错过”,最终“成全”了腾讯和好未来。
股权结构图显示,深言科技创始人兼 CEO 岂凡超作为实际控制人,最终受益股份达 61.28%,马化腾最终受益股份为 4.04%,张邦鑫则为 2.54%。
来源:天眼查
深言科技创始人兼 CEO 岂凡超,清华大学电子工程系 2013 级本科,计算机科学与技术系 2017 级博士,主要研究方向为 NLP,曾在 EMNLP 等顶会发表论文 30 多篇。
据岂凡超介绍,深言科技团队孵化自清华大学自然语言处理实验室(THUNLP)和北京智源人工智能研究院,由欧洲科学院院士、清华大学计算机系教授孙茂松领衔担任公司首席科学家。目前,团队已发表顶会顶刊论文数百篇,获得各类知识产权数十项。涵盖文本理解、文本生成、知识图谱等多技术方向,拥有自研可控文本生成大模型以及相关数据清洗、处理技术专利。
值得一提的是,THUNLP 是国内第一个开展 NLP 研究的科研单位,早在上世纪 70 年代就已经成立。
基于此,岂凡超在第三届“清华大学国强研究院杯”双创大赛上底气十足,“我们的团队来自国内最早做 NLP 的研究机构,在 NLP 领域深耕 30 年,有国内最多的中文大模型训练经验。”
ChatGPT 爆火后,深言科技发现了该产品的局限性:由于天然的语言差异和中英文屏障,国外的英文大模型无法较好地用于中文文本信息处理场景,存在中文领域知识掌握不足等问题。而中文大模型的研发远未成熟,实际性能相较英文大模型仍有不小差距。
深言科技希望以自研的中文超大规模预训练模型为核心构建工业级中文信息处理引擎,并研发最优秀的产品,引领中国的文本信息处理智能化革命,为中国的 3 亿脑力劳动者和数千万信息密集型组织重塑信息处理全流程。
在路演环节,岂凡超也公布了深言科技的部分成绩,“我们的大规模预训练模型在续写、改写、扩写、摘要 4 类文本生成任务和 6 个数据集上均超过现有其他中文模型,达到了当前最好的中文文本生成效果。”
最终,深言科技的“基于超大模型的新一代语言理解与生成平台”,斩获技术创新赛初创组一等奖。
深言科技创始人岂凡超(右) 来源:清华大学国强研究院杯双创大赛
巧合的是,正是在今年 1 月 13 日,深言科技获得上述奖项的同一天,奇绩创坛、红杉中国、零以资本完成了对该公司投资的工商变更。
投研并进,腾讯“不急”
自研+投资,一直被认为是企业发展的两条腿。
腾讯,也不例外。
早在 2019 年时,马化腾就对外表示,腾讯已建立四大 AI 实验室,涵盖 AI 从全面基础研究到多种应用开发。
2022 年 4 月,腾讯首次对外披露旗下混元 AI 大模型的研发进展,该模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。
随后,腾讯于 2022 年 12 月推出了万亿中文 NLP 预训练模型 HunYuan-NLP-1T(混元 AI 大模型),是目前国内首个低成本、可落地的 NLP 万亿大模型,且登顶自然语言理解任务榜单 CLUE。目前,该模型已成功落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。
在 5 月 17 日一季度财报会上,腾讯高管也回应称,混元大模型“进展很不错”。
具体来看,数据方面,一方面是来自互联网公共数据,一方面是腾讯内部数据,后者相对公共数据具有更高价值;模型序列方面,也正在增加训练量;基础设施方面,云和高性能计算集群,增加了训练模型的效率,这是腾讯的优势。
针对传闻中“腾讯针对类 ChatGPT 对话式产品成立‘混元助手’项目组”,腾讯也曾作出回应:相关方向上已有布局,专项研究也在有序推进。
据职场 Bonus 消息,这个项目组的负责人正是腾讯史上最高职级拥有者——张正友(腾讯首位 17 级研究员/杰出科学家)。
除了与大模型相关的直接消息,在间接层面,腾讯方面也在陆续释出动态:
3 月 30 日,腾讯发布了全新的 AI 智能创作助手“腾讯智影”,推出了智影数字人、文本配音、文章转视频等 AI 创作工具。
其中,智影数字人能实现“形象克隆”和“声音克隆”,创作者通过上传少量图片、视频和音频素材,就能得到自己的数字人分身和定制音色,进而快速生成自己的数字人播报视频。
4 月 14 日,腾讯云正式发布面向大模型训练的新一代 HCC(High-Performance Computing Cluster)高性能计算集群。该集群采用腾讯云星星海自研服务器,搭载英伟达最新代次 H800 GPU,服务器之间采用业界最高的 3.2T 超高互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。
据腾讯介绍,实测显示,新一代集群整体性能比过去提升了3倍,是国内性能最强的大模型计算集群。
5 月 16 日,AI 绘图工具 Midjourney 也选择以 QQ 为载体,开启官方中文版内测……
对于 AI 的重要性,马化腾在股东大会上掷地有声,“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得(AI)非常重要。”
所以,“对于工业革命来讲,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要的。”
也因此,马化腾“不急”,“我感觉现在有很多公司太急了,感觉是为了提振股价,我们一贯不是这种风格。”
(首图来源:Unsplash)
扫码关注公众号
获取更多技术资讯