HelloKitty • 2023-06-15 16:38
2013
本文由 量子位 撰写/授权提供,转载请注明原出处。
本文来源:量子位(QbitAI)
作者:梦晨 克雷西
ChatGPT 一夜间再次进化,OpenAI 一口气推出大量更新!
最核心的是 API 新增函数调用(Function calling)能力,与网页版的插件类似,API 也能使用外部工具了。
这个能力被交到开发者手上,ChatGPT API 原本不具备的能力也都能靠各种第三方服务解决了。
有人认为,这是一个杀手级特性,也是自 ChatGPT API 发布以来最重要的更新。
另外这次关于 ChatGPT API 的更新每一个都很重磅,不仅能力加量,价格还更低了:
. 推出新版本 gpt-4-0613 和 gpt-3.5-turbo-0613 模型
. gpt-3.5-turbo 上下文长度增涨400%,从 4k 增长到 16k
. gpt-3.5-turbo 输入 token 降价 25%
. 最先进 embeddings model 降价 75%
. GPT-4 API 大规模开放,直到清空排队列表为止
消息到了国内,也有网友认为这是国内大模型面临的重大挑战。
何时使用工具,API 自己决定
根据 OpenAI 官方介绍,函数调用同时支持新版 GPT-4 和 GPT-3.5。
开发者只需要模型描述需要用到的函数,何时调用哪个函数都是模型根据提示词自己决定的,与 ChatGPT 调用插件的机制一样。
对于具体使用方法,官方给出了三个例子:
第一,聊天机器人调用外部 API 执行操作或回答问题,如“给某人发邮件”或“今天的天气如何?”。
第二,将自然语言转换为 API 调用或数据库查询,如“上个月有多少订单?”会自动生成 SQL 查询语句。
第三,从文本中自动提取结构化数据,如只需要定义好需要的“人名、生日、位置”,再给个网页链接,就可以自动提取一篇维基百科文章中提到的所有人物信息。
这一新功能让广大网友、特别是开发者为之欢呼,表示有了它工作效率将大大提高。
以前,想要让GPT调用函数需要借助 LangChain 的工具才能实现。
……
尽管 LangChain 理论上拥有更高的运行效率,但可靠性要逊于经过专门调教的新 GPT。
更新版本,更低价格
目前,新版本的模型已经逐步开始迭代。
最新版 gpt-4-0613、gpt-3.5-turbo-0613 与扩充上下文长度的 gpt-4-32k-0613 都支持函数调用。
gpt-3.5-turbo-16k 不支持函数调用,提供 4 倍上下文长度,意味着一次请求可支持约 20 页文本。
旧模型也开始逐步废弃。
使用初始版本 gpt-3.5-turbo、gpt-4 的应用将于 6 月 27 日自动升级到新版本
需要更多时间过渡的开发者也可以手动指定继续使用旧版本,但 9 月 13 日之后所有旧版本请求将彻底废弃。
说完这个时间线,我们再来看看价格。
升级之后,OpenAI 不仅没有让产品涨价,反而下调了价格。
首先是使用量最大的的 gpt-3.5-turbo(4k token 版)。
输入 token 的价格降低了 25%,现在 0.0015 美元每千 token,也就是 1 美元 66.6 万 token。
而输出 token 每千 token 的价格则为 0.002 美元,也就是 1 美元 50 万 token。
换算成英语文本的话,大致是 1 美元 700 页。
嵌入模型(embeddings model)的价格更是大跳水,直接降低了 75%。
每千 token 只需 0.0001 美金,也就是 1 美元一千万 token。
此外,新推出的 16K token 版 GPT3.5-Turbo 提供了 4K 版本四倍的处理能力,但价格只有两倍。
输入及输出 token 的价格分别是 0.003 和 0.004 美元每千 token。
另外还有少数网友反应,当月账单直接从 100 到降到几美分了,目前还不清楚具体什么情况。
最后,有需要的话也不要忘记去排队 GPT-4 API 的测试资格。
(传送门放在文末)
OpenAI 捕“Chain”,微软在后
不少网友指出,OpenAI 新出的“函数调用”基本就是 Langchain 里“Tools”的翻版。
也许接下来,OpenAI 还会翻版 Langchain 的更多功能,如 Chains 和 Indexes。
Langchain 是大模型领域最火的开源开发框架,能够把各种大模型能力整合起来快速构建应用程序。
团队最近也刚刚获得 1000 万美元种子轮融资。
虽然 OpenAI 的这次更新还不至于直接“杀死”Langchain 这个创业项目。
但是开发者们本来需要 LangChain 才能实现一些功能,现在确实不再需要了。
再看 Langchain 一方的反应,求生欲也确实很强。
在 OpenAI 官推发布更新的 10 分钟之内,Langchain 立马宣布“已经在做兼容工作了”。
并且不到一个小时就发布了新版本,支持官方新功能之外,还可以把开发者已经写好的 tools 转换成 OpenAI 的 functions。
一众网友除了排队感叹这快得离谱的开发速度,还思考起一个无法回避的问题:OpenAI 把你的创业项目给做了怎么办?
对此,OpenAI 首席执行官 Sam Altman 最近刚好做过一次表态。
在 5 月底 Humanloop 举办的交流会上,Altman 曾表示:
除了 ChatGPT 类型的消费级应用之外,尽量避免与客户竞争。
现在看来,开发工具似乎不算在避免竞争的范围之内。
而与 OpenAI 形成竞争关系的除了创业公司,还有一个不可忽视的存在:
微软,OpenAI 最大金主,通过 Azure 云也对外提供 OpenAI API 服务。
就在最近,有开发者反馈,从 OpenAI 官方 API 切换到微软 Azure 版本后,性能显著提升。
具体来说:
. median latency 从 15 秒减少到 3 秒
. 95th percentile latency 从 60 秒减少到 15 秒
. 平均每秒处理的 token 数量增加了三倍,从 8 个增加到 24 个。
再算上 Azure 给的一些折扣,甚至比原来还便宜了。
但微软 Azure 的更新速度一般要比 OpenAI 慢上几周。
开发阶段快速迭代用 OpenAI,大规模部署转去微软 Azure,你学到了么?
更新公告
https://openai.com/blog/function-calling-and-other-api-updates
GPT-4 API 排队
https://openai.com/waitlist/gpt-4-api
参考链接:
[1]https://news.ycombinator.com/item?id=36313348
[2]https://twitter.com/svpino/status/1668695130570903552
[3]https://weibo.com/1727858283/N5cjr0jBq
[4]https://twitter.com/LangChainAI/status/1668671302624747520
[5]https://twitter.com/hwchase17/status/1668682373767020545
[6]https://twitter.com/ItakGol/status/1668336193270865921
扫码关注公众号
获取更多技术资讯