一大波RTX AI PC带着磅礴算力袭来,是时候让AI PC 发挥算力优势了

HelloKitty 2024-04-29 16:39

扫一扫 在手机阅读、分享本文

1224

本文由 硅星人Pro 撰写/授权提供,转载请注明原出处。

文章来源于:硅星人Pro

作者:六九的小号

无论你出于什么原因看过去年被热议的电影《芭比》,那么你一定对下面这个经典转场有印象:

1.gif

但你可不要被画面下方的提示“insert coin”误导,以为电影《芭比》被改编成了需要投币的街机游戏。这是一个经过 AI 转绘的作品,AbleSlide 联合创始人、Blender 艺术家、AI 创作者 Simon 阿文将《芭比》电影中的经典过场,通过 AI 的方式转绘为像素风,还原出复古 16bit 游戏的经典美术风格。

Simon 阿文表示:“‘AI 如何塑造我们的工作与生活’ 这个在过去听起来是少数大公司才有资格讨论的问题,但在如今这个问题的答案由 AI 社区和创作者塑造。包括央视春晚AI动画等作品在内,从文字、图像到影像,我的许多探索是基于本地 GeForce RTX 4090 完成的。AIGC 的可能性是一片蓝海,AI PC 是我的帆船。”

实际上,随着图像、建筑、音乐等专业领域的产品与应用陆续落地,AI PC 的形象也正逐渐清晰,并开始悄悄改变我们熟知的生产力形态。

在最近一次 RTX AI 媒体品鉴会上,NVIDIA 向我们展示大量与 AI 相关的技术 Demo,不仅有来自底层硬件厂商视角的观点分享,也带来了各种实机的 Demo 体验。对于“AI PC 具体是如何带来生产力革命的?”“AI PC 如何在本地获得充沛的算力支持?”等问题,我们尝试着在这次活动中寻找答案。

AI PC + RTX 40 系 GPU,生产力呼啸而来

尽管早已在眼花缭乱的 AI 新闻中浸淫多年,但当我看到 NVIDIA 这次展出的技术 Demo,应用层生成式 AI 发展的速度之快,可以说大大超出了我的预料。

要知道,此前虽然我们已经可以自由使用各种 AIGC 生成工具,但往往都是凑个热闹的“玩具”属性,离高效可控的实用生产力依然有一定的距离。而在 NVIDIA RTX 技术的支持下,已经有越来越多成熟的工作流 Demo 被构建,其成果甚至已经进入商用领域。此次 NVIDIA 就带来了大量优秀成果。

在 RTX AI 品鉴会现场,对于 NVIDIA 这样的头部芯片厂商来说,其代表性技术几乎都需要通过合作伙伴的产品搭载来实现,所以本文介绍的这些活动现场的技术 Demo 演示都是通过 AIC 与 OEM 的产品来展示,其中现场用来展示部分 AI Demo 的几台搭载 RTX 40 系笔记本电脑 GPU 的联想拯救者吸引了我们的注意。

2.png

首先是这台联想拯救者 Y9000P 至尊版,其正在展示 AI 证件照 Demo,稍后我们会介绍到。搭载 RTX 4090 笔记本电脑 GPU,支持 175W 性能释放,同时配备了更豪华的大面积 VC 均热板,CPU 部分加入了液金导热,双烤功耗进一步提升到最高 250W。因此在 3D MARK 跑分(DX12)能达到 21883,这也就意味着,市面上那些 3A 大作或者是复杂图形渲染,这台笔记本电脑都可以轻松搞定。

另外,这块屏幕的显示效果非常出色,一块 16:10 黄金显示比例的 16 英寸面板,拥有 2560×1600 像素分辨率,100% DCI-P3 高色域,240Hz 刷新率,500nits 亮度,3ms 响应时间,还支持画面防撕裂技术、杜比视界,DC 调光、防蓝光护眼和 X-Rite 出厂校色等等。这意味着,这块屏幕可以完全满足专业创作者对画面的高标准要求。

3.png

而这台白色的 Y9000X 2024 上展示了来自数字艺术家 & 策展人土豆人 Tudou_man 的 AIGC 作品,他通过 AI 把晚霞做成了毛绒绒的围巾,挂在了武康大楼、外滩钟楼还有和平饭店上,圣诞的氛围拉满。

这台联想拯救者 Y9000X 2024 搭载了 GeForce RTX 4070 笔记本电脑 GPU,延续了精湛的 CNC 一体精雕工艺,全金属机身,ACD 面还采用了 AED 电泳白工艺,视觉上显得更加简约干净,辨识度爆表。最薄处做到了 17.6mm。

活动现场第一个给我带来深刻印象的 Demo 就是:开发者基于 Stable Diffusion 和人像生成控制模型 InstantID,建立起的 AI 证件照生成工作流 Demo。

即便你身穿睡衣、加了一晚上班满眼黑眼圈,只要打开前置摄像头拍一张照片,就可以生成一张精精神神的证件照。不仅画面纯净通透,光影变化明暗自然,还对人像进行了恰到好处的美颜并达到影棚级别的水准。

4.png

立等可取的高质量AI证件照

由于这套工作流对算力与显存都有着更高的要求,最低也要 16G 显存,因此活动现场的 Demo 是运行在了一台搭载了 GeForce RTX 4090 笔记本电脑 GPU 性能强劲的联想拯救者 Y9000P 至尊版上。

当然,光是高水准的出图还不够,为了提升效率,现场还演示了市面上最快的 Stable Diffusion 计算出图方案——在 GeForce RTX 4090 D 桌面端 GPU 上开箱即可享受到高达每秒 8 张图的生成速度。什么概念?要知道笔者用自己两年前配的电脑跑 stable Diffusion 文生图的时候,平均几乎要 30 秒才能生成一张图,看到这我当场想换显卡。

5.gif

此图没有加速处理,一秒八张的图片加特林

这还没完,若是使用 NVIDIA TensorRT,并配合开发者进行性能优化,采用 GeForce RTX 4090 D 的台式 AI PC 最高甚至可以实现每秒超过百张图的生成速度。这不仅仅是速度快的问题,不妨开一下脑洞:要知道比较普遍的视频和游戏画面帧数也才不过 60fps,设想一下每秒 100 帧实时生成的画面,足以一定程度颠覆传统视频和游戏的消费逻辑。

另一个实用的技术 Demo 演示来自于前沿建筑设计师、艾哎集瑟科技联合创始人言萧。在演示过程中,只需要在绘画区按照自己的意愿勾勒几笔,一张兼具设计者表达与实际效果的建筑渲染图就出现了。创作者还可以根据现有图片快速调整,效果极佳。

6.gif

随画即可见的建筑渲染

这对于设计师的工作辅助是非常大的:过往的设计提报往往需要设计师花时间手绘,再约时间开会决定方案,流程相对漫长。但在这样实时生成的渲染图的辅助下,设计师可以在会议中即时作图,确定方向以后再逐步细化,大大加速了推进效率。据说,这里使用的建筑大模型全网下载量超 50W,在专业领域已经逐渐开始创造商业价值。

当然,我们对 AI PC 的期望不光是生产力效率革命,还有使用者的个性化需求,这里的个性化肯定不是用 Stable Diffusion 画小姐姐,而是指将来的 AI PC 作为“私人助理”这个角色存在时,为 PC 用户提供更为私密、个人化的定制服务。

而在活动中 ChatRTX 的技术 Demo 演示,基本可以看做 AI PC 个性化模型的雏形:活动演示中 ChatRTX 搭载的是智谱 AI 的 ChatGLM3-6B 模型,可以读取用户的本地文件,筛选出最符合用户描述的图片,并生成文件夹用以下一步操作。

7.png

导入文件夹,ChatRTX就可以帮你挑出符合你描述的文件

而刚刚这一切都是通过 AI PC 本地资源完成的:ChatRTX 使用检索增强生成(RAG)、NVIDIA TensorRT-LLM 大模型推理加速库和 NVIDIA RTX 加速,将本地生成式 AI 功能引入到支持 RTX 的 Windows 系统中。用户可快速、轻松地将本地文件作为数据集连接到开放式大语言模型,快速查询与上下文相关的答案。

看了这些 RTX AI 技术 Demo 演示不难发现,有了 NVIDIA 技术的加持,AI PC 早已不是停留在概念中的想象。这些具备了极高实用性的 Demo 正转变为创作者手中的生产力高速落地,在工作流中发挥着巨大作用,并给越来越多产业带来本质改变。

AI 大算力如何实现?

从生态的角度来看,目前 NVIDIA 在 AI 领域的全栈生态给 AI PC 带来了极为重要的支持,毕竟这是一个已经耕耘了十多年的生态,即便此前发力的重点并不在 PC 平台这种边缘端,但其积累的各种库、中间件也足以为 AIPC 生态打下基础,比如说,我们今天看到的 TensorRT-LLM for Windows 几乎就可以看做发展有些年头的 TensorRT 在 LLM 上的延伸。

实际上,最早被用来做 AI 计算的 NVIDIA GPU 也正是游戏显卡:近代 AI 发展史知名的 ImageNet 图像识别大赛上,有团队尝试使用 GTX 580 加 CUDA 来跑卷积神经网络,随后就开启 GPU 加速 AI 的新时代。

而今天,在我们看到这些行业领先的 Demo中,NVIDIA 的技术所提供的大算力,几乎是目前 AI PC 体验的核心。

为了让更多创作者、开发者在 AI PC 发展的初期就能得到有效、客观的参考、更方便地选择自己的 AI PC,国内头部 AI 大模型社区吐司/Tensor.Art 联合 NVIDIA 发布了行业内首个《个人用户玩转 Stable Diffusion 的 GPU 配置推荐》。

在这份配置推荐中,吐司/Tensor.Art 聚焦眼下最受关注的 SD 1.5 和 SDXL ,通过第三方测试软件 UL Procyon AI 测试 RTX 40 系列多款型号在 Stable Diffusion 的推理性能表现。

8.png

在UL Benchmark SD1.5和SDXL下,RTX40系显卡的表现

10.png11.png在开启TensorRT后的加速效果

12.png在UL Benchmark SD1.5下,RTX 40系列笔记本电脑GPU表现

其中在 UL Benchmark SD1.5 TRT vs. OpenVINO 的对比测试中,RTX 4090 笔记本电脑 GPU 相对于 iGPU(Arc Graphics)有超过 27 倍的性能提升。

13.png

而在吐司/Tensor.Art 这份性能参考报告之外,NVIDIA 还联合火星时代教育发布了《NVIDIA TensorRT Stable Diffusion 创作加速指南》和使用案例。指南包括安装与设置,加速引擎构建,加速效果对比及 NVIDIA TensorRT 在实际商业创作场景的应用方法——简单来说,这份指南可以帮助 AI 设计爱好者和创作者基于 RTX 40 系 GPU 在创作的各个环节中提升 Stable Diffusion 创作效率。

在活动现场,火星时代教育 AI 设计教研总监吴大吉还分享了 NVIDIA TensorRT 对于 SD 计算时间缩短的对比数据,数据显示 TensorRT 可以让 GeForce RTX 40 系 GPU 的 SD 生图速度最快提升约 1 倍,大幅缩短了创作时间。

14.png

TensorRT可以为RTX 40系GPU的提供非常出色的AI算力提升

看下来不难发现,NVIDIA 过去十余年积累起来的 AI 生态正快速地融入 AI PC,并为无数应用提供大算力支持。

老本行,新花样

在 NVIDIA 的老本行游戏领域,AI 也同样正在重构游戏开发者的生产流程、以及游戏玩家的娱乐体验。

或许你还记得 NVIDIA 在去年曾经展出过一个赛博朋克拉面店的 NVIDIA ACE 技术 Demo,基于玩家与 NPC 的对话,可以让老板提供饮料、更换灯光,甚至可以指着桌子上的东西问 NPC 这是什么,老板则会给你讲这东西的来历和意义。

在这次活动上,NVIDIA 带来了一个全新的 NVIDIA ACE 技术 Demo 演示《Covert Protocol》,相比上次的 Demo 场景规模更大。在这个 Demo 中,三位 NPC 都有自己的性格与故事,玩家想聊什么都可以,他们的回答不仅会带出这个游戏世界的背景世界观,更是会让玩家感受到这个角色、这个世界是真实的、有生命的。对于游戏玩家来说,这是前所未有的虚拟世界代入感。

15.png

游戏中可以与NPC自由对话

实际上,这种技术不仅仅可以丰富游戏的内容,增加真实性。更是可能会进一步改变一部分游戏的叙事方式。

游戏行业有一种高阶叙事手法叫做“离散型叙事”,指将世界观背景与历史、剧情延伸、甚至是主要角色的故事分散并隐藏在 NPC 的对话、收集品、甚至是场景的设计中。让玩家通过互动主动发掘游戏内容。熟悉宫崎英高的各式魂系列作品的玩家想必对这种手法深有体会。

试想这种叙事手段与 NVIDIA ACE 技术结合以后,游戏过程中某一部分关键剧情、某个宝箱的打开方式、某个传奇武器的下落被游戏中某个“活生生”的 AI NPC 知晓着,而玩家需要通过话术找到真相。这种参与感绝非是固定脚本的游戏可以比拟的。

所以,尽管这项技术目前并没有被应用于已面世的游戏中,但它对游戏行业的改变,或许比很多人想得都要深,值得期待。

除了 NVIDIA ACE 之外,饱受玩家欢迎的 NVIDIA DLSS 也正在 AI 的加持下不断进步。作为一项 GeForce RTX GPU 上利用 AI 提高帧率并改善图像质量的功能,过去两年以来,在 DLSS 的帮助下,电脑性能一般的玩家也可以通过开启 DLSS 获得更高帧数的画面,电脑性能优异的玩家更是可以获得极致的视觉体验。

16.png

而最新的 DLSS 3.5 不仅树立全新游戏标准,通过 AI 增强光线追踪表现,备受期待的《黑神话:悟空》和《永劫无间》即将支持 DLSS 3.5 光线重建和全景光线追踪技术,实现画质和性能将进一步获得大幅提升。

可以说,无论是生产力还是娱乐,NVIDIA 都在利用其技术优势,帮助开发者提供充足、全面的开发工具,让更多的人可以低门槛地快速使用 AI,并让更多人有机会从成果中受益。

结语

人人都能自由使用 AI 的时代,正越来越近。

尽管今天 AI PC 产品定义还处于早期,但得益于 NVIDIA 的高起点,其提供的大算力正在成为 AI PC 无数应用的前进的动力,AI PC 的形象正在逐渐清晰,并开始改变我们熟知的生产力关系。据统计,RTX AI PC 目前已经在全球范围内拥有超过 1 亿用户和超过 500 款游戏和应用支持 NVIDIA RTX 技术,并不断联手行业一起定义 AI PC 的新标准。

无论未来 AI PC 产品的走向如何,NVIDIA 显然已经凭借全栈的生态布局取得了先发优势。GeForce RTX 40 系 GPU 在 TensorRT 的加持下带来的大幅性能提升,显然已经使其成为眼下 AI GC 艺术家最合适的选择。曾经天马行空的 AI 幻想,似乎正在变成一个可以期待的未来。

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

1711682390_pic_real.jpg

微信图片_20240313155219.jpg

微信图片_20240207151541.png

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章