HelloKitty • 2023-04-07 18:07
2598
本文由 甲子光年 撰写/授权提供,转载请注明原出处。
文章来源于:甲子光年
作者:简春燕、刘杨楠
编辑:栗子
ChatGPT 带来的 AI 热潮仍在持续。
上周,英伟达、Adobe 紧跟浪潮,加码生成式 AI;OpenAI 更是重磅推出 ChatGPT 插件,点亮“AI 的 AppStore 时刻”。
然而,在拥抱新世界的热情之余,一些面对未知的恐惧、不安也开始涌现。
一边是巨头们逐渐争红了眼——谷歌牵手 Replit 与微软 GitHub Copilot X 展开正面竞争;Meta AI 首席科学家 Yann LeCun 持续输出,抨击 ChatGPT;Databricks 发布开源模型挑战 ChatGPT 统治地位;百度快马加鞭发布大模型云服务套件,价格比 ChatGPT 更便宜。
一边是人们关于 AGI 的恐惧逐渐盖过好奇——未来生命研究所(Future ofLifo Institute)公布一封公开信,呼吁所有 AI 实验室至少在未来 6 个月内暂停训练比 GPT-4 更强大的 AI 系统,公开信一出,舆论迅速发酵;Altman 在访谈中称人工智能确实可能杀死全人类;意大利个人数据保护局宣布,3 月 31 日起禁止使用聊天机器人 ChatGPT,并限制开发这一平台的美国人工智能公司 OpenAI 处理意大利用户信息。
此时此刻,电影《星际穿越》中的那句告诫正在走入现实:“不要温和地走进那个良夜。”
「甲子光年」整理了过去一周在 AI 领域的新鲜事,以记录下一个 AI 时代风起云涌的开端。
以下为详细内容:
3月27日,周一
“搜狗输入法之父”加入王慧文 AI 团队,打造中国 ChatGPT
有着搜狗输入法之父之称的马占凯日前在即刻宣布,自己将加入王慧文的光年之外公司,共赴 AGI 通用人工智能的伟大征程。
马占凯表示:“大模型为基础的 AGI 开启了第四次科技革命,这将是一个多层次多波次的大浪潮,最终会改变一切,我必须参与其中。我用一个月写了本关于 ChatGPT 的书,这既是向大众普及 ChatGPT,更是强化我自己学 ChatGPT。在面向 AGI 的伟大探索中,我们每个人都要在学习中创造,在创作中学习。我从 2010 年起就是美团的产品顾问,光年之外的联创团队让我又看到了像美团初创时朝气蓬勃的景象,这让我倍感信心,希望自己在加速 AGI 普惠人类的路上也能做出一点微小的贡献。”
王慧文团队与国产 AI 框架 OneFlow 达成并购意向
36 氪独家报道称,王慧文团队光年之外与一流科技已达成并购意向,交易将以换股形式进行。
一流科技 OneFlow 是目前国内市场最受瞩目的 AI 框架公司之一,也是现在已知唯一一家以创业团队公司研发通用深度学习框架的团队。公司曾获九合、高瓴等在内近亿元融资。成立以来,一流科技推出了异构分布式深度学习框架 OneFlow、MLOps 全生命周期管理平台 OneBrain、AI 实训平台 OneLab。
公司创始人袁进辉,2008 年 7 月自清华大学计算机系获得工学博士学位,获得清华大学优秀博士学位论文奖;2013 年加入微软亚洲研究院从事大规模机器学习平台的研发工作;2015 年至 2016 年底,专注于搭建基于异构集群的深度学习平台,项目荣获微软亚洲研究院院长特别奖 (top 1%);2017 年创立北京一流科技有限公司,致力于打造分布式深度学习平台。
目前双方均暂未回应并购事件。
马云回国,谈及 ChatGPT
近日,有网友在杭州文一路隧道中目击阿里巴巴集团创始人马云,后经确认,车内人士分别为马云、阿里巴巴集团董事会主席兼首席执行官张勇以及蚂蚁集团资深副总裁邵晓锋。
3 月 27 日下午,《云谷教育》发文称,马云在云谷学校与校长们讨论了教育行业未来的发展,并谈及 ChatGPT 对教育行业的影响。马云表示,ChatGPT 这一类技术已经对教育带来挑战,但是 ChatGPT 这一类技术只是AI时代的开始。“我们要用人工智能去解决问题,而不是被人工智能所控制。虽然人的体力、脑力比不过机器,但机器只有‘芯’,而人有‘心’。”
OpenAI 投资机器人公司
近日,挪威人形机器人公司 1X Technologies 宣布,已获得由 OpenAI 领投的 2350 万美元 A2 轮融资,目的是打造名为 NEO 的新型两组机器人模型。1X Technologies 成立于 2014 年,主要生产具有类人运动和行为能力的机器人。
1X Technologies 的首席执行官兼创始人 Bernt Øyvind Børnich 表示:“1X 很高兴能让 OpenAI 领导这一轮,因为我们的使命是一致的:将新兴技术融入人们的日常生活。在投资者的支持下,我们将继续在机器人领域取得重大进展,并扩大全球劳动力市场。”
此外,OpenAI 这笔投资也为 AI 大模型的落地指明了一条可能的方向。
百度发布大模型云服务套件,价格比 ChatGPT 更便宜
3 月 27 日,百度智能云临时举办了面向首批文心一言邀约测试企业的闭门沟通会,并在会上发布了文心大模型和智能云结合的相关服务和产品。
文心千帆大模型平台是面向企业开发者的一站式大模型开发及服务运行平台,会作为企业用户使用百度文心大模型服务的唯一入口。文心千帆大模型平台服务能力包括推理、微调和托管,可以为不同的企业提供数据管理、自动化模型定制微调以及推理服务云端部署一站式大模型定制服务。其中,推理云服务按量后付费,企业可以直接使用或云服务调用。会上,百度只公布了推理云价格,调用单价为 0.012 元/千 tokens,这个价格比 ChatGPT 便宜了 0.0003 美元。
百度在现场分享称:“我们是全球首个一站式企业级大模型平台。”
华为将发布盘古大模型
近日,华为宣布即将推出其最新的盘古大模型。盘古大模型由 NLP 大模型、CV 大模型、多模态大模型、科学计算大模型等多个大模型构成。通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题。而根据华为云官网显示,华为即将上线的盘古系列 AI 大模型分别为 NLP 大模型、CV 大模型、以及科学计算大模型(气象大模型)。
其中,盘古 NLP 大模型是业界首个千亿参数中文语言预训练模型,是最接近人类中文理解能力的 AI 大模型。盘古 CV 大模型首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。而盘古气象大模型已经在国内外多个领域得到了广泛应用,例如天气预报、农业生产、智慧城市等等。
微软禁止竞争对手用 Bing 训练人工智能
近日,有消息称微软指责竞争对手采用 Bing 搜索引擎数据开发人工智能聊天产品的行为,违反了合同条款。
据悉,微软方面表示,如果竞争对手不停止使用 Bing 搜索引擎数据作为自己的人工智能聊天产品的基础,它将切断对这些数据的访问。根据知情人士透露的信息,微软目前至少已经告知两家公司其行为违反了合同条款。
高盛:生成式 AI 或导致全球三亿人工作被取代
投行高盛发表的一份最新研究显示,ChatGPT 等生成式人工智能系统的最新突破,将给全球劳动力市场带来重大颠覆,全球预计将有 3 亿个工作岗位被生成式 AI 取代,律师和行政人员将是最有可能被裁员的岗位。
这项研究结论是高盛分析师 Joseph Briggs和Devesh Kodnani 根据数千份职业通常执行的任务数据得出的。他们的模型计算显示,美国和欧洲大约三分之二的工作,在某种程度上将受到人工智能自动化的影响。
3 月 28 日,周二
Yann LeCun:GPT-4 的研究路径没有前途
“从现在起 5 年内,没有哪个头脑正常的人会使用自回归模型。”最近,图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而自回归正是当前爆红的 GPT 家族模型所依赖的学习范式。
当然,被 Yann LeCun 指出问题的不只是自回归模型,他认为当前整个的机器学习领域都面临巨大挑战。
这场辩论的主题为“Do large language models need sensory grounding for meaning and understanding ?”,是近期举办的“The Philosophy of Deep Learning”会议的一部分。会议从哲学角度探讨了人工智能研究的当前问题,尤其是深度人工神经网络领域的近期工作。其目的是将正在思考这些系统的哲学家和科学家聚集在一起,以便更好地了解这些模型的能力、局限性以及它们与人类认知的关系。
Yann LeCun 的核心观点为:"Machine Learning sucks!"(机器学习糟透了)"Auto-Regressive Generative Models Suck!"(自回归大型语言模型没有前途),而他认为最有前途的方向是“世界模型”。
GPT-4 创始人:AI 可能会毁灭人类
OpenAI 创始人兼 CEO Sam Altman 在接受科技博客主 Lex Fridman 的采访时表示,AI 未来的确会出现杀死人类的可能性。
在 Youtube 公布的视频中,Fridman 在访谈中提到了人工智能研究者、LessWrong 研究所创始人 Eliezer
Yudkowsky 的观点。Yudkowsky 此前指出“人工智能可能杀死所有人”,并认为,当人工智能发展为超级智能时,几乎无法与人类站在统一战线上。
对于此,Altman 回应道,“我认为有这种可能性,并且承认这一点很重要,因为如果我们不谈论它、不把它视为潜在的事实,那么我们就不会投入足够的努力去解决这个问题。”“我认为我们必须开发新的技术来解决这个问题……我所知道的解决这类问题的唯一方法就是不断迭代,尽早学习。”
极狐前 CEO 陈冉离职创业,将推出基于大模型的软件定义平台
据 36 氪报道,国内领先的开源平台极狐创始人、前 CEO 陈冉目前已离职创业,计划创立 AI 大模型开源公司 OpenCSG。
陈冉在云计算领域深耕有 20 余年,曾就职于IBM、惠普、Mesosphere 等多家科技公司,从架构师做到企业 CTO。2021 年创业的极狐也在两年内获得多轮融资,投资方包括国内外多家知名投资机构。
陈冉表示大模型将带来前所未有的产业变革和行业巨变,OpenCSG 将提供 MDaaS(Model and Development as a Service,模型与开发即服务)平台,使用自然语言进行大模型开发平台的重塑,为客户提供大模型的开源产品与服务,以降低用户掌握大模型能力的门槛。
3 月 29 日,周三
苹果收购 WaveOne
据 TechCrunch 报道,Apple 近日收购了美国初创企业 WaveOne。
WaveOne 在 2016 年由 Lubomir
Bourdev 和 Oren
Rippel 建立,公司的创立目标是改进已经延续数十年的视频解码技术,通过 AI 模型优化视频压缩方案。在组建 WaveOne 前,Bourdev 曾是 Meta 旗下 AI 研究部门的创始团队成员,他与 Rippel 曾在 Meta 的算法团队工作,负责研发 Facebook 的内容管理和视觉搜索等功能。
目前 Apple 并未回应收购传闻,但 WaveOne 的官方网站早在今年 1 月就已经关停。与此同时,包括一名合伙创始人在内的多名 WaveOne 员工目前都在 Apple 的机器学习团队就职。
马斯克等千名科技人士发公开信:暂停训练比 GPT-4 更强大的 AI 系统
3 月 29 日,未来生命研究所(Future ofLifo Institute)公布一封公开信,呼吁所有 AI 实验室立即暂停训练比 GPT-4 更强大的 AI 系统至少 6 个月,未来生命研究所的这封公开信题为“暂停巨型 AI 实验:一封公开信”,于 29 日解封。
公开信写道:广泛的研究表明,具有与人类竞争智能的人工智能系统可能对社会和人类构成深远的风险,这一观点得到了顶级人工智能实验室的承认。公开信表示,“只有当我们确信它们的影响是积极的并且风险是可控的时候,才应该开发强大的人工智能系统。这种信心必须有充分的理由,并随着系统潜在影响的规模而增加。”
经过网上发酵后,各方声音都已经涌现出来。超过 1000 人签署了这封公开信,包括马斯克、图灵奖得主约书亚本·吉奥(Yoshua Bengio)、美国作家兼纽约大学教授加里·马库斯(Gary Marcus)、《人工智能:现代方法》作者斯图尔特罗素(Stuart Russell)、 苹果公司联合创始人史蒂夫·沃兹尼亚克(Steve Wozniak)等。
而继 LeCun 之后,吴恩达、田渊栋等一众 AI 大牛也发文公开反对“千人联名”。吴恩达表示,在 GPT-4 出现之后要求 AI 训练暂停 6 个月是很可怕的事情:“它(GPT-4)在教育、医疗保健、食品等领域都有很多新的应用,这将帮助许多人。”随后田渊栋也转发并附议,称“我不签暂停令”,并表示:“一旦开始,就没有办法停止或扭转这一趋势,这就是进化的必然。”360 集团创始人、董事长周鸿祎在个人微博表示,“马斯克呼吁暂停 GPT-5 的研发。我自己是做安全的,但我坚定地认为,不发展才是最大的不安全。”
而处于这场讨论中心的 OpenAI CEO Altman30 日也发了一条“展望未来 AGI”的推文,疑似对此做出回应:“一个好的 AGI 应该具备这三个特点:对齐超级智能的技术能力;大多数领先 AGI 之间的充分协调;一个有效的全球监管框架。”
“文澜BriVL”模型设计者、人大教授卢志武:多模态大模型有机会超越 OpenAI
近期,“文澜 BriVL”模型设计者、人大教授卢志武团队借鉴文澜的研究经验,自主研发了多模态对话大模型,并落地了第一款应用级多模态 ChatGPT 产品:“元乘象 ChatImg”。
卢志武教授介绍,“元乘象 ChatImg”好比是“会看图的 ChatGPT”,基于多模态融合模块和语言解码器,目前 Chatlmg 参数规模大概为 150 亿。他表示,大模型的发展不是线性的,意味着我们有机会超越 OpenAI。
谷歌牵手 AI 初创公司 Replit 与微软在编码工具领域展开竞争
当地时间周二(3 月 28 日),科技巨头谷歌与 Replit 建立合作关系,准备将其 AI 语言模型与 Replit 旗下的 Ghostwriter 软件结合起来帮助程序员编写代码,与微软的 GitHub Copilot X 展开正面竞争。
Replit 于 2016 年成立于旧金山,在 7 年时间里积累了 2000 多万开发者用户。Replit 的开发者将通过 Ghostwriter 软件开发 AI,访问谷歌的基础设施、服务及生成式 AI 基础模型,加快在 Replit 上将灵感转化为软件成果的速度。而 Google Cloud 和 Workspace 的开发者用户将获得 Replit 提供的协作代码编辑平台的访问权限,以在线方式创建和共享应用程序。
这一合作伙伴关系,反映出 Google Cloud 正致力于为 AI 代码生成技术构建一个开放的生态系统;对 Replit 而言,此次合作则是达成其“为 10 亿软件开发者赋能”目标的重要一步。
微软推出 Security Copilot
北美时间 3 月 28 日,微软推出一款新的人工智能对话工具 Security Copilot(安全副驾),能够为企业、个人用户提供网络安全、恶意代码防护、隐私合规监控等生成式自动化 AI 服务。该公司介绍说,Security Copliot 使用了目前最强的大语言模型 GPT-4,以及微软拥有 65 万亿个网络安全威胁的安全模型库。
微软强调,Security Copliot 的出现并非取代安全人员的工作,而是要辅助安全分析师更高效地输出价值。
OpenFlamingo
Deepmind 在去年发表了关于他们的 Flamingo 模型的研究,这是一个强大的多模态文本和视觉模型。
现在,Laion 发布了一个用于训练 Flamingo 模型的框架和一个9B参数检查点。
Laion 是一个旨在向公众提供大规模机器学习的模型和数据集的非盈利组织。此前,Laion 发布了名为 LAION5B 的图像-文本数据集,一经发布就成为了世界上最大的公开访问的图像-文本数据集。
如今,其发布的该检查点在 Multimodal
C4 数据集的
5M 样本和来自 LAION-2B 图像数据集的 10M 样本上训练。由于它使用 Meta 的 7BLlama 检查点,因此该模型不能用于商用。并且其在基准性能方面也无法达到 Deepmind 的 Flamingo 的水准。
BingChat 出现广告
推特用户 Deedy 发现,在询问哪款车型最便宜时,Bing Chat 回复了他一条汽车广告(在来源处标注「Ad」字样)。Deedy 认为,看广告在大语言模型中的应用非常有趣。
Bing Chat 中的广告点击率和转化率无法与传统搜索相比,而 Bing Chat 又在蚕食搜索引擎的市场,从根本上减少了千亿美元的搜索广告行业的规模。最终将导致搜索广告的收益减少。
Cerebras 首次推出基于非 GPU 的人工系统训练的大型语言模型
Cerebras Systems 是一家非常低调的人工智能初创公司,团队由顶尖计算机架构师、计算机科学家和深度学习研究人员组成。曾造出世界上最大的芯片。
Cerebras Systems 日前宣布,它已经训练并发布了一系列七个基于 GPT 的大型语言模型 (LLM),用于供研究团体开放使用。这是公司首次使用基于非 GPU 的人工智能系统来训练多达 130 亿个参数的 LLM,并通过行业标准 Apache 2.0 许可证共享模型、权重和训练方法。所有七个模型都在 Cerebras Andromeda AI 超级计算机的 16 个 CS-2 系统上进行了训练。
Cerebras 的研究人员在 Andromeda 超级计算机上首次训练了 AI 硬件公司中的七个 GPT 模型,这些模型具有 111M、256M、590M、1.3B、2.7B、6.7B 和 13B 参数。由于 Cerebras
CS-2 系统具有高吞吐量和片上内存,这些复杂的工作在短短几周内就完成了。这些结果表明,Cerebras 的系统可以训练当今最大、最复杂的 AI 工作负载。
3 月 30 日,周四 腾讯高级执行副总裁汤道生:腾讯正研发类 ChatGPT 聊天机器人
3 月 30 日,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生向记者表示,腾讯正在研发类 ChatGPT 聊天机器人。对于腾讯的聊天机器人是集成到 QQ、微信,还是通过腾讯云向B端用户服务,汤道生说:“都会有。”
如何看待全真互联网、元宇宙似乎正逐渐褪去,汤道生表示,XR 只是元宇宙的一个形态,这里面还有很多不同的应用,不是带着头盔挡住眼睛才叫元宇宙。
首个教育场景下类ChatGPT模型“子曰”将推出
网易有道在博鳌亚洲论坛上宣布,其自研的教育场景下类 ChatGPT 模型“子曰”将于近日推出。基于“子曰”研发的 AI 口语老师和中文作文批改 DEMO 已完成,近期将开放内测。这也将是国内企业推出的首个教育场景下类 ChatGPT 模型。
美国科技伦理组织要求 FTC 调查 OpenAI,禁止发布商业版 GPT-4
北京时间 3 月 30 日晚间消息,美国科技伦理组织“人工智能与数字政策中心”(CAIDP)要求美国联邦贸易委员会(FTC)禁止 OpenAI 发布新的商业版 GPT-4。CAIDP 在提交给 FTC 的一份投诉中称,GPT-4 存在偏见和欺骗性,对隐私和公共安全构成了风险。
3 月 31 日,周五 彭博社重磅发布为金融界打造的大型语言模型(LLM)——BloombergGPT
根据彭博社最新发布的报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的 LLM,开发了拥有 500 亿参数的语言模型——BloombergGPT。
报告显示,该模型经过彭博社大量的金融数据专门训练,构建了一个 3630 亿个标签的数据集,以支持金融行业内的各类自然语言处理(NLP)任务。该模型在金融NLP任务上的表现优于现有的类似规模的公开模型,在一般 LLM 基准上也有不俗表现。
意大利即日起禁止使用 ChatGPT
据财联社消息,3 月 31 日,意大利个人数据保护局宣布,即日起禁止使用聊天机器人 ChatGPT,并限制开发这一平台的美国人工智能公司 OpenAI 处理意大利用户信息。
同时,意大利个人数据保护局指出,3 月 20 日 ChatGPT 平台出现了“用户对话数据和付款服务支付信息丢失”的情况。此外,该平台没有就收集处理用户信息进行告知,缺乏大量收集和存储个人信息的法律依据。OpenAI 公司“必须在 20 天内通过其在欧洲的代表向意大利个人数据保护局通报公司执行保护局要求而采取的措施”,否则将被处以最高 2 千万欧元或公司全球年营业额 4% 的罚款。
活动报名链接:乘“云”而上 数智AI并行 用数据构建企业出海新路径
扫码关注公众号
获取更多技术资讯