现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震

HelloKitty 2023-11-07 17:28

扫一扫 在手机阅读、分享本文

1836

本文由 硅兔赛跑 撰写/授权提供,转载请注明原出处。

文章来源于:硅兔赛跑

作者:Amelie 蔓蔓周

AI 发展的道路上,需要不畏劳苦勇于攀登的人。

11 月 6 日上午,在旧金山刚刚举办完的开发者大会上,来自全球各地的数百名开发人员和 OpenAI 团队参与其中,预览新工具并交流想法。AI 人工智能市场将采取更加开放的方式,欢迎更多有志之士加入其中。线上直播短短不到一小时发布了许多重磅消息,就如同 OpenAI 的进化速度,越来越快了。

硅兔君从前线发回报道,火速整理了线上和线下的发布会精华,一次快速看完整场发布会亮点。

本次开发者大会意在鼓励企业使用 OpenAI 的技术来构建基于人工智能的聊天机器人和自主智能体,这些自主智能体可以在没有人类干预的情况下执行任务,OpenAI 团队也希望能吸引更多开发者付费访问 OpenAI 模型,并以其模型构建新的AI生态系统。

大会之前,Sam Altman 在 X 平台上说:“会发布一些非常棒的新东西。” 以下是小编的整理——

1.png

GPT4 Turbo发布

. 更强版本 GPT4

Turbo 版的 GPT4 数据已经赶上现在时代了,因为它是利用截至今年 4 月的网上数据构建。

因此,相比只能访问截至 2021 年 9 月数据的原版 GPT-4,Turbo 版更与时俱进了,它不仅已经知道了全球刚经历过的几年疫情或者经济动荡,也了解截至今年 4 月的绝大部分世界事件。

不仅如此 GPT4 Turbo 版还提供 128k 的上下文窗口,也就是说,它可以一次容纳相当于 300 多页文本内容的提示词(很难想象一下子有这么多提示词还能做到不崩溃)。

. 价格更优惠

相比原版 GPT-4,Turbo 版的收费做了大幅下降,其输入 token 的收费价 0.01 美元,便宜三倍,输出 token 的价格为 0.03 美元,便宜两倍。

Turbo 版可供所有付费开发人员通过 API 中的 gpt-4-1106-preview 进行尝试,OpenAI 计划未来几周内发布稳定的生产就绪模型。

. GPT-3.5 同步更新

OpenAI 同时更新了 GPT-3.5,推出 Turbo 版的默认支持 16k 上下文窗口 GPT-3.5,新版支持改进的指令跟踪、JSON 模式和并行函数调用。新版的输入 token 和输出 token 收费也分别比原版便宜三倍和两倍,价格分别为 0.001 美元和 0.002 美元。

2.png

. 更像一个 APP

从大会上发布的内容来看,新 GPT 4 Turbo 看起来更像是一个 ChatGPT iOS APP。

较之从前版本,新版本的交互界面采用了简约的黑白色搭配,用户个人页面可以添加头像、名称、简介等个人信息,也可以自定义起始界面,更加侧重用户的个性化需求。

在功能上,新版本的 GPT 可以浏览网页、分析数据和生成图像,还能更快地访问 DALL-E、 Data Analyst 和自定义 GPT 的高级模式。

GPT Store 将上线

“本月晚些时候,我们将推出 GPT 商店,其中包含经过验证的构建者的作品。一旦进入商店,GPT 就可以被搜索到,并且可能会登上排行榜。我们还将重点关注我们在生产力、教育和‘只是为了好玩’等类别中遇到的最有用和最令人愉快的 GPT。在接下来的几个月中,您还可以根据使用您的 GPT 的人数来赚钱。”

3.png

在这部分里,Altman 介绍说定制版 GPT 可以为用户在日常生活、特定任务、工作或家庭中提供帮助,比如帮助学习任何棋盘游戏的规则、帮助教孩子数学、训练写作或是设计贴纸,还可以与他人分享这种自定义的 GPT。

用户无需编写代码就可以创建自己的 GPT,就像开始对话一样简单,只需要给 GPT 指令和新的知识,然后选择它能做什么即可,比如搜索网络、制作图像或分析数据。用户可以设计它私用,也可以专门给公司内部使用,或者制作大众通用的 GPT。

OpenAI 现在提供示例 GPT 给 ChatGPT Plus 和企业版 ChatGPT 的用户试用,包括 AI 图像生成App Canva 和 AI 自动化集成功能 Zapier AI Actions。OpenAI 计划很快向更多用户提供 GPT。

对于企业版的 GPT 用户,本周三开始,就可以为特定客户、部门或专有数据集创建自己的 ChatGPT。

企业可以授权公司内部的用户无需代码即可设计仅供内部使用的 GPT,并将其安全地发布到自己的工作区,在管理控制台可以选择如何共享这些 GPT,以及是否允许企业内部使用外部 GPT。

4.png

当 App Store 模式已经被证明可视为苹果利润丰厚的资金池之后,OpenAI 开始效仿并试图复制它也就不足为奇了。以后各种 GPT 模式不仅会在 OpenAI 平台上托管和开发,而且还将得到推广和评估。

“我们会将我们收入的一部分来支付那些制作最常用、最有用的 GPT 的人,我们相信,如果你为人们提供工具,他们就会做出惊人的事情。”

这里的包容和开放显然更符合 AI 人工智能的多元化发展。承认“成为他人创造力的首选平台至少与拥有自己的创造力一样有价值”,也是做出伟大公司的胸怀气度。

New GPT Draft

不会编程可以制作 GPT 模型吗?

OpenAI 说,没问题,你完全可以。

现在只需与 ChatGPT 聊聊天,并描述您想要的内容,就可以制作出你想要的 GPT 模型。

“实际上,你可以通过与语言交谈来对 GPT 进行编程,这个很容易定制的行为,让他们做你想做的事——这让他们变得非常容易接近,并为每个人提供代理权。” Altman说。

5.png

他在台上做了个演示,如果你想做一家制作一款机器人的创业公司,让 GPT 给予一套简洁且有建设性并可以马上执行的方案。很快,GPT 就依照这些指示给出了详细的建议。如果你想用 GPT 改良你的菜谱,它会很快告诉你制作一道汤需要什么成分。

全面的 API 助手

应用程序接口,缩写为 API,是一种计算接口,它定义多个软件中介之间的交互,以及可以进行的调用或请求的种类,如何进行调用或发出请求,应使用的数据格式,应遵循的惯例等。

据 OpenAI 公司官网,目前通过 GPT-4、GPT-3.5Turbo 上传 750 词的文档分别需要 0.06、0.003 美元(以最高速度计算)。这次大会上发布的“有记忆功能”的内存存储 AP,可以提高大模型计算速度,降低开发者的 API 调用成本达 95%。

OpenAI 还发布了有专门目的 Assistants API,让开发人员可以更轻松地构建自己的辅助 AI 应用,这些应用可以调用模型和工具实现自己的目标。

6.png

Assistants API 提供了代码解释器、检索以及函数调用等新功能,可以处理以前开发者必须自己完成的大量繁重工作,从而让开发者能构建高质量的 AI 应用。

OpenAI 介绍,这种 API 是为了灵活性设计,用例范围包括基于自然语言的数据分析应用、编码助手、AI 驱动的假期规划器、语音控制的 DJ、智能视觉画布。支持 Assistants API 的功能和新 GPT 产品的相同,都有自定义指令和一些工具,例如代码解释器、检索和函数调用。

7.png

图源:Medium

OpenAI 表示,与平台的其他部分一样,传给 OpenAI API 的数据和文件绝不会用于训练他们的模型,开发人员可以在他们认为合适的时候删除数据。开发者可以前往 Assistants playground 试用 Assistants API 测试版,无需编写任何代码:https://platform.openai.com/playground?mode=assistant

从今天起,所有开发者都可以使用 Assistants API 测试版。定价参见:https://openai.com/pricing

多模态交互

新版本增加了新的多模态功能,包括视觉、图像创建 (DALL·E 3) 和文本转语音 (TTS)。Turbo版 GPT-4 可以接受图像作为 Chat Completions API 中的输入,从而实现生成标题、详细分析现实世界图像、以及阅读带有图形的文档等用例。

OpenAI 计划为主要的 Turbo 版 GPT-4 模型提供视觉支持。视觉输入的定价取决于输入图像的大小。例如,将 1080×1080 像素的图像发送给 Turbo 版收费 0.00765 美元。图像创建方面,OpenAI 提供不同的格式和质量选项,每生成一张图像起售价为 0.04 美元。

针对付费用户开放的新版本 GPT,主要功能更新包括:

1.支持多格式文件上传

旧版本中,用户需要使用“Advanced Data Analysis”等功能完成 PDF 文档上传和信息提取;新版本中,用户可以直接上传 PDF、数据文件等多种格式文件,未来或将支持更多文件类型;

2.一站式工具整合

GPT-4 的不同模式各具优势和功能短板,其中多模态模式可以同时处理文本、图像、声音等多种类型数据,但仅支持图片上传;数据分析模式具备较强的数据处理和分析能力,但不能实时联网;实时联网模式和 DALL-E 则不支持文件上传。旧版本中,用户需要自主进行模式选择;新版本中,GPT-4 将根据用户需求,自动选择和编排多个工具完成任务,向 AI 智能体角色迭代。

目前来看,OpenAI 借由硬件布局从定义模型层到产品应用层的潜在路径已经打开,OpenAI 团队与苹果前首席设计师乔纳森一起研发的AI硬件,很可能就是一款支持 GPT4 甚至 5 的智能眼镜,但对终端芯片的要求更高了。

8.png

图源:知乎

众所周知,OpenAI 已然成为全球顶尖 AI 头部企业,旗下的 GPT 系列活跃用户覆盖面占了全世界人口总数的 20% 近乎 15 亿用户,且用户增速一直在持续中。

现有 ChatGPT 在接近人类水平的语言理解能力之上,已经准备好迭代更新到更人性化的水平,预计新的 GPT 应用将成为近十年来人工智能领域最成功的产品。

基于最新产品 GPT-4 的卓越表现,OpenAI 公司估值水涨船高,相较年初已经翻了三倍,目前估值超过 900 亿美元,成为仅次于 SpaceX 和字节跳动的全球估值 TOP3 的创业公司。

从最初作为一个与 Google 抗衡的非营利性人工智能研究机构,摇身变成估值 TOP3 的巨型商业公司,OpenAI 同样不可避免地要应对商业竞争和自身盈利的要求。Analytics India Magazine 的一份报告中称,OpenAI 仅运行其人工智能服务 ChatGPT 每天就要花费约 70 万美元,从独角兽变成超级“吞金兽”,OpenAI 商业化发展成了首要目标。

技术解放生产力,技术模型越牛,越有兑换商业价值的筹码。

OpenAI 开发者大会的出现,不仅是它目前发展阶段的必然,长期来看,也是有望推动大模型逐渐迭代为AI智能体、并构建以 ChatGPT 大模型为基础的新生态体系的载体。

线上开发者大会只持续了短短 45 分钟,但内容足以在 AI 行业“平地一声雷”。我们也可以看到,OpenAI 的目标显然很高,将自己打造成一个独立于现有应用商店和分发方式的平台的决定并非一蹴而就,商业化的下一步就是直接面对苹果等行业巨头甚至其长期赞助人微软的挑战。

9.jpg

微软 CEO 萨蒂亚·纳德拉 (Satya Nadella) 短暂出现在了这次的大会舞台上,微软即将推出自己的 Copilot 模型,专门用于Office工具等任务,听起来 GPT 可能会直接应用到这些企业级模型中。

OpenAI 在未来依旧是微软的战友,还是有可能的竞争对手都未可知。但对于时代而言,我们需要更多这种富有冒险精神的企业存在。

参考链接:

App Store for AI: OpenAI’s GPT Store lets you build (and monetize) your own GPT. (TechCrunch)

All the news from OpenAI’s first developer conference. (The Verge)

#OpenAI DevDay, Opening Keynote. ( Youtube)

#OpenAI

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

扫描二维码,加入各大平台
致力于服务国内出海技术领袖与出海开发者
精选活动 更多 >

{{ val.activity_name }}

{{ val.province ? (val.province + ' ' + val.city) : val.location }}
客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章