HelloKitty • 2023-03-23 17:45
1957
本文由 量子位 撰写/授权提供,转载请注明原出处。
本文来源:量子位
编辑:Pine
“AI 的 iPhone 时刻已至”,英伟达或成最大赢家。
在 GTC2023 大会上,黄仁勋接连放出大招:
不仅发布了 ChatGPT 专用 GPU,比之前就能实时处理 ChatGPT 的 HGX A100 快了 10 倍;
还公布了其在芯片领域的进展,推出了新的 cuLitho 软件库,使光刻计算速度整体提高了 40 倍。
从老黄的言语中也能得知,当下各种爆红的 AIGC 产品:ChatGPT、Stable Diffusion、DALL-E 等都能见到英伟达的身影。
而去年年末至今,ChatGPT 爆火,也顺势拉动了英伟达的股价,年初至今就上涨 83%。
目前,英伟达的市值为 6471 亿美元。
会上及会后采访中,老黄的言语之中也是透露着对 AI 生成内容的褒奖:
AI 是用人类语言编程的新型计算机,未来每个人都将是程序员。
话不多说,会上具体都有哪些亮点,一起盘点下~
发布 ChatGPT 专用 GPU
会前,网友们对 GTC 的猜测都集中在 ChatGPT 上。
而英伟达,也是毫不吝啬,不止 ChatGPT,AIGC 方面直接一把推出了四种针对 AI 任务的推理平台:
. L4 Tensor Core GPU
. L40 GPU
. H100 NVL GPU
. Grace Hopper超级芯片
其中,H100 NVL GPU 是英伟达这次推出的 ChatGPT 的专用 GPU,它是基于去年已经发布的 H100 的改进版本:配备双 GPU NVLink,将两张拥有 94GB HBM3 显存的 PCIe H100 GPU 拼接在一起。
性能的话,老黄形象地做了个对比:
相较于目前唯一可以实时处理 ChatGPT 的 HGX A100,一台搭载四对 H100 和双 NVLINK 的标准服务器能将速度提升 10 倍,并且还可以将大语言模型的处理成本降低一个数量级。
期间,老黄还展示了自己亲自把首款签名版 DGX 交付给 OpenAI 的画面。
然后再来说下其他三个推理平台:
L4 是专门针对 AI 生成视频设计的一款通用 GPU,它提供的视频性能比 CPU 高出整整 120 倍,能效提高了 99%。
L40 则是用在图像生成上的 GPU,它能对 AI 生成 2D、3D 图像进行优化,相较于英伟达的云推理 GPU T4,性能提升了 10 倍。
Grace Hopper 超级芯片用在推荐系统和大型语言模型 AI 数据库上,图推荐模型、向量数据库和图神经网络都可以选择这款芯片。
更具体一点,通过 900GB/s 高速芯片对芯片的接口,Grace Hopper 超级芯片可连接 Grace GPU 和 Hopper GPU,而 Grace 和 Hopper 正是处理大型语言数据集的理想选择。
到这里,你以为关于 ChatGPT 的相关产品就没了?
大 NO 特 NO。
在 ChatGPT 这块儿,英伟达还致力于下沉市场,联合微软 Azure、Google GCP 和 Oracle OCI 三家云厂商合作推出了 DGX Cloud。
普通企业也能训练 LLM。
也就是说,想要训练像 ChatGPT 的大语言模型,可以直接在网络上租赁 DGX 云服务,这样一来客户就能将英伟达 DGX AI 超级计算机实时接入公司。
英伟达提供的 DGX 服务器,包含 8 个 H100 或 A100 图形处理器和 640GB 内存,A100 层的价格为每月 36999 美元。
而直接购买一个实体 DGX 服务器,就要花费 20 万美元,并且微软当时为了训练新必应也是斥资数亿美元购买了数万块 A100 芯片。
用 cuLitho 加速芯片创新
ChatGPT 等一众 AIGC 产品毫无疑问已经成为当前的AI圈的宠儿,不过在英伟达眼中 ChatGPT 只是一个起点。
GTC 大会上,老黄放出了另一枚重磅级“核弹”,把加速计算引入到光刻领域——推出英伟达cuLitho计算光刻库。
cuLitho 计算光刻库是啥?
一言以蔽之,cuLitho 是一个可以加速光刻基础计算的算法库,能够很大程度上提升光刻计算的速度,并且节省能耗。
老黄表示,目前计算光刻每年都需要消耗数百亿 CPU 时间。而运行在 GPU 上 cuLitho,可以将目前光刻技术的性能提升 40 倍,功耗降低至此前的 1/9。
甚至在某种程度上 cuLitho 还可以为行业 2nm 工艺奠定基础。
目前,英伟达已经与台积电、ASML 和 Synopsys 等芯片厂商达成合作,后续芯片生产中,也会引入 cuLitho 这项 AI 技术。
其中,台积电 CEO 魏哲家称赞,cuLitho 为台积电在芯片制造领域部署反向光刻技术和深度学习等光刻解决方案开辟了新的可能性。
老黄也在会上预告,台积电将在今年 6 月份的 2nm 芯片生产中引入 cuLitho。
ASML 首席执行官 Peter Wennink 也做出计划,让所有的计算光刻软件产品都支持 GPU,同时也表示与英伟达在 GPU 和 cuLitho 上的合作会给计算光刻带来巨大的好处。
Synopsys 公司这边,在 cuLitho 平台上运行了 Synopsys OPC 软件,性能直接得到了从几周到几天的提升。
一些其他亮点
除了上面提到的这些,GTC 大会上,英伟达还公布了一些其他合作项目:
比如说生成式 AI 方面有 Adobe、Getty Images 和 Shutterstock。
医学方面,英伟达宣布了新的合作伙伴 Medtronic,黄仁勋透露,目前正在一起构建一个医疗方面的 AI 平台,涵盖手术引导和机器人辅助手术。
参考链接[1]https://www.theverge.com/23649329/nvidia-dgx-cloud-microsoft-google-oracle-chatgpt-web-browser
[2]https://nvidianews.nvidia.com/news/nvidia-asml-tsmc-and-synopsys-set-foundation-for-next-generation-chip-manufacturing
扫码关注公众号
获取更多技术资讯