拒绝「PPTSD」!通义上线PPT新功能,重塑工作学习流

HelloKitty 2024-09-03 17:01

扫一扫 在手机阅读、分享本文

878

本文由 雷峰网 撰写/授权提供,转载请注明原出处。

文章来源于:雷峰网

作者:房晓楠

编辑:马晓宁

作为一名合格的打工人,你是什么时候对 PPT “PPTSD”的?

制作 PPT,当代打工人的“阿喀琉斯之踵”

最近,在一档综艺节目——《脱口秀和 ta 的朋友们》中,选手赵晓卉对着 PPT 进行了长达几分钟的“血泪控诉”。是的,对于“讲脱口秀只是副业、在互联网大厂正经上班儿才是主业”的赵晓卉来说,没有哪个脱口秀演员对 PPT 的“深恶痛绝”能够像她如此这般真情实感了。

“但凡上过班的人,都不会想做 PPT。”

1.png

这简直就是打工人的心声,尤其是互联网大厂人,开不完的会议、写不完的策划、做不完的 PPT。

可以说,在如今的职场中,用到 PPT 的时刻简直就像呼吸一样频繁,日常项目策划要用,月度、季度、年度工作总结汇报要用,开会还要用,简直是随时随地都要用。

可是一份内容扎实、要点明确、设计美观的 PPT 背后,打工人付出的是什么呢?

ta 需要在短时间内构思好 PPT 的大致模样,在短时间内收集、整理、提炼出重点核心内容,在短时间内设计好简洁、美观的页面排版……如此大的工作量,简直对打工人在时间精力等方面都提出了高标准、高要求。

但是几乎没有人会把做 PPT 这件事写在工作日报中,似乎默认它没有时间成本,就应该是拿来即用的东西,而都忽略了背后打工人是如何把工作时间掰开了、揉碎了,在缝隙中来完成这一工作的。

当然,如果你还肩负着为领导做 PPT 的重任,那么这个时间精力可能还要 double 一下……

这就是为什么大家会“谈 PPT 色变”,打工人苦 PPT 久矣。

而听了赵晓卉的这一遭吐槽,通义 AI 直接坐不住了,紧急上线接梗——“别急”,通义 AI PPT 励志要帮助“每一位晓卉”告别 PPTSD,实现快乐上班。

2.png

快乐上班这回事暂且搁置一旁,还是先谈谈 AI PPT,本以为是段子,原来是宣发——通义 AI 真的上线了“PPT创作”功能,主打用 AI 做出更适合打工人体质的 PPT。

其实,PPT 看似是一个很细分的行业场景,可实际上它并非小众赛道。

数据显示,我国目前作为 PPT 重点使用群体的白领人员规模近 2 亿。不止是职场,教育教学也是使用 PPT 的高频场景,而其中的教师、学生数量也十分惊人。公开资料显示,当前我国专任教师总数超过 1880 万人,而高等教育在学总规模达 4763.19 万人,可见,PPT的用户群体是多么庞大。

因此,面对如此迫切的需求,变革传统 PPT 制作方式,已然是箭在弦上,不得不发。

而今年以来,AI 大模型技术迅速发展,大模型落地的呼声也愈发高涨,AI 医疗、AI 金融、AI 教育、AI 搜索、AI 办公等行业领域纷纷变热。既然,“所有的领域都值得用 AI 大模型重新做一遍”,那么 PPT 又岂能例外。

于是,各大厂商纷纷下场,目前 AI 创作 PPT 已然成为当下的一个热门赛道,卷得如火如荼。

去掉“AI 味”,一键生成 PPT

像大多数的“AI+”一样,AI+PPT 的概念很好理解,利用 AI 大模型技术,帮助用户快速自动创建 PPT 模版,其中最核心的优势就在于能够彻底解决用户在传统制作 PPT 过程中费时费力的痛点。

有了 AI PPT 之后,资料搜集、关键信息提取、内容撰写和排版美化等繁琐流程均可由自动完成,再也不用闷头苦想,即便是非设计专业人员也能轻松制作出高质量的 PPT。

另外,相较于以往 PPT 制作过程中,用户往往使用传统PPT工具所提供的模版,风格相对单一、固定,而有了 AI 大模型加持的新型 PPT 创作,与用户的交互方式发生了改变,从想法构思到内容生成、设计美化,用户可以参与其中与 AI 共创。

而新的 PPT 创作流程可以简要概括为“输入主题—选择模板—一键生成—人工修改”,且短时间内生成的 PPT,内容丰富、质量上乘,在制作效率与质量上表现都很亮眼。

因此,越来越多的用户开始尝试转向 AI PPT制作。根据极光旗下月狐数据发布的《2024 年智能 PPT 行业市场研究分析》报告显示,2024 年 6 月智能 PPT 行业用户规模已接近千万量级,行业近 3 月用户规模复合增速达 21%。

而从整个市场来看,面对如此庞大的市场,进入这一赛道的玩家也越来越多,目前来看,国内的传统办公软件厂商、互联网大厂、大模型初创企业,以及聚焦 AI 创作 PPT 的初创企业等,纷纷下场开卷。

金山办公旗下的 WPS AI 可以看作是传统办公软件厂商代表,去年 ChatGPT 爆火之后,金山办公便宣布推出 WPS AI,之后大模型能力嵌入表格、文字、PPT 等四大组件中,可为用户提供内容改写、文档润色以及一键生成 PPT 等功能。

互联网大厂中百度也早早布局 AI PPT 功能。去年 5 月,李彦宏扬言要把百度搜索、百度网盘、百度文库等百度全系产品用大模型重做一遍。其中,百度文库在文心一言的加持下,能部分实现写稿和智能生成 PPT 等功能。

作为大模型初创企业中的翘楚,AI 大模型“六小虎”之一,月之暗面也在 7 月末推出了自家的 AI PPT 功能——Kimi+PPT 助手。

还有一些聚焦 AI PPT 赛道新生代选手,比如 Ai PPT,是一款将 AI 大模型与 PPT 场景深度融合的产品,提出所需PPT的诉求后,就可快速生成一份完整、专业的 PPT。

据了解,Ai PPT 原本聚焦做素材库相关产品,所以他们在设计上具有独特优势,页面美观,但在质量上,由于没有自家自研大模型作为依托,优势不明显。

可以说,目前市场上的这些 AI PPT 创作产品各有所长,也各有所不足,留给大家的改进提升空间还有很大,而各大厂商也在卯足了劲地进行自我升级。

如今,通义也加入了。

据官网介绍,通义网页版上线的“PPT 创作”功能,最核心的优势就在于只需一句话主题生成 PPT,且言之有物、设计精美、智能编排。

3.png

具体来看,通义 AI PPT 创作功能是基于通义千问大语言模型打造的,用户只需要输入一句话,明确所需 PPT 主题,通义就能够自动生成结构合理的 PPT 大纲,相应内容也是围绕着用户需求展开,以此来完成高质量内容创作。

感兴趣的用户可以去体验一下:https://tongyi.aliyun.com/aippt

比如,如今学生开学在即,假定用户身份为教师,想要生成一份关于学生新学期学习展望的 PPT,在输入这一句话后,就能够得到一份新鲜出炉的 PPT。

4.png

当然,“一句话主题生成 PPT”只是其中一种方式,除此之外,还有三种输入方式。

一是上传文件生成 PPT,比如文档、音视频、脑图、PPT等本地文件,甚至是添加网页链接等都可以;二是长文本输入生成 PPT;基于 Chat 中生成的结构化大纲生成PPT。

5.png

假定用户身份为教师,生成一份关于学生新学期学习展望的 PPT

通过这份生成的 PPT 也可以看出来,内容上面,生成的 PPT 大纲和 PPT 内容的信息密度都很高,与用户需求和文档内容的关联性较强,且在遣词造句上非常符合用户的身份,没有像传统的 AI 工具那样,生成的字句晦涩、生硬、空洞,满满的 AI 味,在内容上真的做到了言之有物。

另外,在版面的设计方面,通义也提供多种模版供用户选择,用户可以根据不同场景下的不同需求,选择合适的模版,比如目前通义提供了针对学生、教师、白领、机关单位等各个行业场景的精品 PPT 模板,设计美观好看。

而且,基于通义万相绘画创作模型,在 PPT 创作过程中,还可以提供图片功能,用户可以通过文生图、在图片素材库中搜索、匹配,让配图更符合 PPT 需求。

因此,无论是职场白领,还是教师、学生等用户,都可以在工作汇报、学术演讲,以及日常分享有需求的时候,短时间内创作出一份适合自身需求的 PPT 。

“我们希望通过这些工具帮助用户节省时间,提升工作学习效率,激发无限创意。”通义效率产品经理王晓明向雷峰网说道。

据了解,8 月中旬,通义还在网页版上线了“深度搜索”模式,支持更多内容源索引,搜索结果更加深度、专业和结构化,省去了用户在大量信息中查找内容的繁琐过程,可以直接为用户提供更结构化的答案。

如今,不管是传统办公软件厂商、互联网大厂、大模型初创企业,以及聚焦 AI PPT 的初创企业等,每个细分类别都有了代表,为此,雷峰网梳理了一下各家的产品特点,以更直观的方式呈现出来,供大家参考。

6.png

目前市场上 5 大主流 AI PPT 产品功能对照表

根据表格中可以看出,从生成方式、生成内容、设计排版、用户体验、是否免费、是否自研等多维度表现来看,通义 PPT 创作虽然入局晚,但优势明显,甚至有很多独家核心能力,而这背后的主要原因就是自研的通义大模型能力。

不止于 PPT,通义 AI 重塑工作学习流

言之有物、设计精美、智能编排,这是此次通义PPT 创作功能核心卖点的简要概括,而仔细来看,背后技术实现却要复杂得多。

首先,通义 AI PPT 背后的基础模型来自自研大模型 Qwen 2.5,在理解能力、逻辑推理、指令遵循、代码能力上表现优异,且性能可与 GPT-4 Turbo 相媲美,这也是为什么即便只是简单的一句话主题,前者就可以深度理解用户需求,生成高质量的 PPT。

其次是长文本能力,今年 3 月,在各大 AI 大模型企业在卷超长文本能力时,通义千问宣布向所有人免费开放 1000 万字的长文档处理功能,直接从原先的百万级跳跃至千万级,成为全球文档处理容量第一的 AI 应用,而这也保证了在创作 PPT 时,可以支持超长文档、PPT、PDF、网页等内容输入形式。

另外,在多模态方面,通义 AI 支持输入长达 6 小时的音视频生成 PPT,而这一能力在今年 3 月份就已经实现。彼时,通义听悟在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长 6 小时、一次性上百条音视频内容的理解问答。

还有文生图功能,让配图更符合用户的 PPT 制作需求,则来自于 AI 绘画创作大模型通义万相的能力,这是阿里云在去年 7 月正式官宣的通义大模型家族新成员。

可以说,此次通义上线的 PPT 创作功能,通义大模型家族齐心协力共同努力的成果,为的就是重塑 PPT 制作新模式。

其实,通义此次上线的新功能不仅仅是 PPT 创作。在通义网页版,音视频转文字产品“通义听悟”正式更名为“实时记录”、长文档阅读助手“通义智文”更名为“阅读助手”,与 PPT 创作功能共同合并为通义效率,实现从信息整理、阅读理解到内容创作的完整工作学习流。

7.png

通义想做的是要重塑工作学习流。

具体来看,通义效率-实时记录的应用场景主要聚焦课堂记录、会议记录,主要的功能主要表现在这几个方面:

实时进行语音转文字记录,并且用户还可以边听边划重点、记笔记,方便学习;可区分发言人,还可根据不同发言人的发言整理核心观点,这样就意味着如果需要在会后回顾会议时,也不会分不清发言人发言内容,可以根据标记,轻松找到所需内容。

另外,在录音录制完毕可生成摘要、章节速览、待办事项,还可直接生成脑图,帮助快速掌握会议/课程要点和脉络,这对于不擅长做规划的 P 人来说,简直是太有力的工具了。

据了解,目前通义效率-实时记录可识别中、英、日语,并实时翻译成中文,对于需要上外教课和海外留学生听课来说,更方便。

在收费方面,目前该功能支持每天 20 小时的免费录制撰写时长,感兴趣的用户可以去体验一下:https://tongyi.aliyun.com/live/

而另一个功能,通义效率-阅读助手的应用场景则主要是论文学习、资料整理,以及音视频播客转写文字上,可以说是诚意满满。

首先,它支持超多格式、超大文档,不管是 1000 万字的长文档,还是长达 6 小时的音视频,抑或是播客链接、网页链接等,都照单全收,之后可以对其进行快速精读、形成摘要、总结出核心要点,甚至是论文的优点、方法创新点、未来展望等,这样不管是多大块头的学习资料,用户都可以快速理解、掌握。

据官方透露,目前该功能没有时长限制,免费使用:https://tongyi.aliyun.com/read/

至此,通义效率的实时记录、阅读助手、PPT 创作等三大新功能集结完毕,构成了一个从信息整理、阅读理解到内容创作的三位一体的完整工作学习流,闭环、高效、用户友好。

看来,在重塑工作学习流这件事情上,通义是认真的。

硅谷精神之父凯文·凯利曾在《必然》一书中写过这样一句话——我们都只有“倾听”科技所偏好的方向,并使我们的期待、管理和产品服从于这些科技所内在的基本趋势,才能从科技中获得最大利益。

谁先捕捉到用户痛点,谁就同时抓住了机会。

显然,通义已然找到了那个痛点,并且正在抓住机会。

微信图片_20240802161354.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章