HelloKitty • 2024-07-30 15:52
1033
本文由 量子位 撰写/授权提供,转载请注明原出处。
文章来源于:量子位(QbitAI)
作者:鱼羊
前沿 AI 科技,现在已经被用在了奥运会上。并且背后提供支持的,是中国科技力量。
就在巴黎奥运会比赛日正式开始,逐渐点燃观众激情的同时,一支“奥运 8 分钟”短片也受到关注。
不仅国际奥委会主席巴赫力推:“感谢中国 AI 科技,让这些女性在体育运动中的成就焕发新的色彩。”
网友们也纷纷点赞:AI 技术以现代的清晰度将历史时刻带入当下生活。
短片名为《永不失色的她》(To the Greatness of HER),由阿里巴巴和国际奥委会联合推出。
百年奥运史上伟大女性的影响故事在此被浓缩在宝贵的 8 分钟里,旨在致敬一代又一代在奥运赛场上不断实现从 0 到 1、不断突破和拼搏的女运动员们。
值得关注的是,这支 8 分钟短片不仅用上 AI 为历史时刻重赋色彩,其中还有大模型、AIGC 技术的加持。
永不失色的她
不少朋友可能已经关注到了,奥运时隔 100 年再次在巴黎召开,其中一个明显的变化是,100 年前奥运项目罕有女运动员参与,而在 2024 年巴黎奥运会上,男女运动员比例首次达到了1:1。
而另一个显著的改变是,这也是首届广泛应用 AI 技术的奥运会。
△阿里云AI增强视频
阿里云和国际奥委会携手,希望用第二重变化带来的技术变革,向公众展现更多推动了第一重变化的女运动员们历史上珍贵的赛场时刻。
比如苏珊·朗格伦(Suzanne Lenglen),女子网球史上最伟大的运动员之一。
1921 到 1926 年间,苏珊·朗格伦保持了长达 5 年的世界第一。
而在傲人的赛场成绩之外,苏珊还是第一个打破女子网球运动服装保守规定的人——
改长袖为短袖,改长裙为过膝百褶裙,把网球裙的重量从 18 公斤改到了 0.18 公斤。
可以说,是从她开始,网球女运动员们得以挣脱服装的束缚,在赛场上尽情发挥。
又比如首位奥运男女混合双向飞碟女子冠军张山。
在 1992 年之前,女子双向飞碟并非正式奥运比赛项目,双向飞碟比赛是男女混合项,就是说,女运动员被允许参加该项目的男子比赛。
张山之前,这个项目一直由男子选手独揽金牌。而就在 1992 年,张山改变了这一切。
预赛中,张山以 150 靶全中的成绩成功进入半决赛;接着,又在半决赛中平了世界纪录,以 200 发 200 中的成绩闯入决赛。
在决赛中,张山独自面对5名男子选手的挑战。最终,她赢得了比赛,也赢得了全场的尊重和欢呼。
颁奖时刻,分获银牌和铜牌的对手将张山高高扛起。一张经典照片也有中国射击队另一位传奇——许海峰当场记录下来。
还有第一位正式参加波士顿马拉松的女性——凯瑟琳·斯威策(Kathrine Switzer)。
1967 年,19 岁的凯瑟琳“冒天下之大不韪”隐瞒性别报名了波士顿马拉松。在当时,马拉松被认为是“女性不宜”的运动,甚至就在凯瑟琳本人的比赛过程中,主办方工作人员突然出现要撕掉她的号码牌,并冲她大吼:“你给我滚出赛道”。
直至她跑完全程,组委会也不承认她完赛的事实,还痛斥她扰乱了比赛。
“你想证明什么?”
这是当时的记者追问凯瑟琳的问题。
60 年后的今天,凯瑟琳亲自在巴黎的这 8 分钟里给出答案:
不只是我,每个女性都有资格去做她想做的事。
这就是《永不失色的她》影片中的三位主角。为了让属于她们的历史瞬间更加真切、生动地被还原出来,可以看到,阿里云用 AI 修复技术,为老照片和老视频进行了上色和基于生成技术的补全。
该项目主要包含三大处理步骤。
清晰化:借助图像超分辨率技术,将低分辨率的老照片转化为高分辨率的清晰图像。
上色化:通过先进的图像上色技术,为黑白照片添加逼真的色彩。
基于生成技术的视频插帧补帧。
具体涉及的技术方案,包括基于生成对抗网络和卷积神经网络的图像上色、图像去噪和超分辨率,以及可控图像生成技术等。
《她》背后的 AI 技术
听上去,老照片、视频修复并不是什么新鲜事,但实际上当修复的对象变成运动影像,背后的技术难度就大大增加了。
举个例子,苏珊·朗格伦的照片拍摄于 100 年多前,效果是这样的:
一方面,人脸已经看不太清楚了。
另一方面,背景观众众多,增大了修复的复杂性。
阿里云修复团队想到的解决方案,是利用大模型 +Stable Diffusion 等生成式 AI 技术,加入文本引导,让 AI 发挥想象力的同时,对这种想象加以控制,使之不脱离历史本身。
具体来说,技术人员先利用扩散技术对人物面部进行重绘。在重绘过程中,为了保留原始人物信息,会结合真实的史料信息作参考,并采用 ControlNet 等技术,对人物面部的线条、深度等都进行了控制。
对于复杂的背景,由于透视关系,本身就比较模糊。修复团队采用的方案聚焦照片中的重点人物、元素进行修复,对背景则只进行小范围的修复,最后再将前后景拼接起来。
为了让色彩更加自然,阿里云修复团队还结合了历史学家的专业意见,通过对历史色彩库的学习,让 AI 上色的准确率达到了 80% 以上。
另外,在超分辨率方面,阿里云的技术方案能在 1 秒内把 640p 分辨率图像超分到 4k 分辨率,清晰度提升 25 倍。
视频修复方面,阿里云修复团队主要解决了视频前后一致性和连续性问题。
举个例子,修复一段跑步视频,如果只是做逐帧上色,算法有可能把运动员的裤子一会儿上成红色,一会儿上成黑色。
修复团队对此进行了专门的优化,包括对视频进行细致拆分,逐个片段将上色效果、清晰度调整到最佳。
运动影像还有一个特点,是运动变化很快。对此,阿里云修复团队基于生成技术,对老视频进行了插帧补帧,以达到更好的连续性效果。
事实上,由于修复的难度,最后我们看到的巴奥这 8 分钟的成片,是在多轮反复修改后呈现的。
在这个过程中,修复团队一遍又一遍耐心地揣摩,甚至“已经看不出哪一张更像本人了”,核心原因,是在修复的过程之中,技术人员自身也受到了女运动员们的鼓舞:
希望能通过修复这组照片,让更多人了解到历史上的这些重要事件。同时也希望通过修复技术,让凯瑟琳女士等打破障碍、提高竞技标准的女性的精神激励更多人。
这也正是前沿科技对于历史文化遗产的价值所在:
AI 能够让生活在当下的人们更直观、更真切地感受到埋藏在岁月长河里的历史印记。科技力量正在人类人文精神的延续和保护中发挥越来越大的价值。
更多修复工作的细节,请看 VCR:
其实,每一届奥运会不仅给运动员,也给观众们带来了很多感动和泪水。
当故事连点成线,在百年甚至更长的时间维度去观察,这些感动会凝结成更值得传承和铭记的人文精神。
《永不失色的她》是如此。那些赛场上更高、更快、更强、更团结的精神亦是如此。
AI 技术的加持,加强了对历史影像的保护和传播,一方面能让公众更低门槛地了解其中故事和发展。
另一方面,也让大家看到了人文与科技更深层次结合带来的价值。
One More Thing
前面说到,巴黎奥运会是首届广泛应用 AI 技术的奥运会。
如果你也关注了比赛,这样高自由度、“子弹时间”式的回放画面想必并不陌生:
另外,在巴黎奥运会上,云计算正在替代卫星,成为奥运赛事直播的主要方式。超过三分之二奥运直播信号将通过阿里云支撑的奥运转播云,从巴黎传输到全球 200 多个国家和地区,走向数十亿观众。
而云 +AI 的组合,正在给坐在屏幕前的全球观众,带来更多新鲜、酷炫的体验。
奥委会主席巴赫评价:阿里巴巴用云计算和 AI 技术为奥运会和体育的未来作出了宝贵贡献。
在奥运会的技术进程中,现在,中国技术力量成为了舞台中心那一个。
扫码关注公众号
获取更多技术资讯