HelloKitty • 2024-06-26 11:54
2127
本文由 硅星GenAI 撰写/授权提供,转载请注明原出处。
文章来源于:硅星GenAI
作者:yok
北京时间 6 月 25 日凌晨,陆续有开发者收到了“OpenAI 的警告信”,信中表示,将采取额外措施停止其不支持地区的 API 使用。并表示:“从 7 月 9 日起,我们将采取额外措施,停止来自不在 OpenAl 支持的国家、地区名单上的 API 使用。”
据 OpenAI 官网显示,目前支持 156 个国家和地区,而中国并不在列。这就直接导致了中国开发者可能无法通过直接调用 OpenAI API 的方式来使用 GPT 系列的相关模型能力。消息一出,国产大模型公司们几乎第一时间为开发者们制定了“搬家计划”,不仅拿出核心大模型,还为新迁移开发者提供 Token 大礼包和迁移指导。硅星人整理了可提供迁移服务的大模型厂商(可能是当下最全的版本...),来看看具体情况。
一、智谱:企业用户不设上限
在所有大模型厂商中,智谱的反应是最快的。一直坚持与 OpenAI 同一路线的公司,在模型的各方面配置上,也全面对标了 OpenAI 的产品体系,最像 GPT。智谱为 OpenAI 的 API 用户提供了特别搬家计划,分为普通开发者版和高质量客户(企业版),且均为两部分群体提供迁移的一对一指导培训。
针对普通开发者,智谱开放了 GLM-4 和 GLM-4 Air 两个版本,并为新迁移开发者提供 1.5 亿 Token 赠送。而针对企业用户,智谱则提供与 OpenAI 使用规模对等的 Token 赠送计划,并强调不设上限。在智谱官网的上方,我们发现智谱还打出了“企业最低 6 折”的标语,也就是说,企业后续使用 GLM 系列大模型,也能享受优惠折扣。
有开发者评价道:“从使用感上来看,GLM 是目前国内比较像 GPT 的大模型,现在看智谱的 to B 服务做得很细致,反应速度也很快。”
二、通义千问:仅需 GPT-4 五十分之一的价格
通义千问,主打的就是一个性价比。通过阿里云百炼平台,公布了最新的搬家方案。官方信息表示:将为 OpenAI API 用户提供最具性价比的中国大模型替代方案,并为中国开发者提供 2200 万免费 tokens 和专属迁移服务。
从大模型本身的能力而言,Qwen 系列是目前海外最受欢迎的国产大模型之一。根据斯坦福最新公布的大模型测评榜单 HELM MMLU,Qwen2-72B 得分为 0.824,与 GPT-4 并列全球第四。通义千问 GPT4 级主力模型 Qwen-plus 在阿里云百炼上的调用价格为 0.004 元/千 tokens,仅为 GPT-4 的 50 分之一。
同时,百炼平台也集成了除通义外的三方大模型和行业大模型,并提供一系列的调试工具,让开发者能够获取一站式的服务。完善的工具箱和服务体系也是阿里生态能力提供的差异性因素。
三、MiniMax:免费使用一个月!
和其他几家送 Token 相比,MiniMax 直接送时长!据硅星人独家了解到,MiniMax 将对切换用户提供最新的 abab6.5s 版本的模型能力,并且免费使用一个月,不限制 TPM 和 RPM,同时也不限制 Token 的使用数量。
abab6.5 系列是 MiniMax 刚刚更新的万亿参数 MoE 大语言模型,既不限流量也不限数量的福利,对于开发者而言也是一个不小的吸引力。而 MiniMax 本身 Chat completion 接口在设计上就与 OpenAI 完全适配兼容,且功能更加齐全,额外支持 websearch 的联网功能,支持一键迁移。事实上,我们发现不止 MiniMax,很多国产基座模型在接口设置上都原生兼容 OpenAI,包括 MoonShot AI、DeepSeek 和零一万物都明确地对外表示 API 接口完全兼容 OpenAI,这意味着用户在使用时,只需要进行少量的代码修改,即可实现平滑迁移,降低了用户的学习成本和转换难度。
四、硅基流动:实现“Token 自由”
为大模型提供部署服务的 AI Infra 公司硅基流动,结合了几乎国内所有主流顶尖的大模型。在 OpenAI 封禁之后,硅基流动宣布,SiliconCloud 平台内的 Qwen、GLM、Yi 系列的几款模型的 API 永久免费。
包括最强开源代码生成模型 DeepSeek-Coder-V2,超越 Llama3 的大语言模型 Qwen2、GLM-4-9B-Chat、DeepSeek V2 系列模型。还支持 Stable Diffusion 3 Medium、InstantID 等文生图模型。且在考虑不同应用场景下选择合适的大模型时,开发者可在 SiliconCloud 上自由切换。
目前不少开发者在打造超级应用时,会使用“鸡尾酒分层的模型结构”,即底层、中层、上层用不同能力的模型,只对上层模型进行微调,既能满足产品能力又能节省调试成本。SiliconCloud 一类的部署平台,或许也在一定程度上匹配了当下超级应用的开发流程。
五、零一万物:“二折平替计划”
有人送 Token、有人送时长,零一万物直接送钱。
据零一万物介绍,目前注册使用 Yi API 的新用户,零一万物立即赠送 100 元额度,平台充值还将赠送 50% 的到账额度,且上不封顶。
流速方面,任意充值即可享受 PRM/TPM 限速直升 Tier3,是目前零一万物较高级别的服务质量和响应速度。另外,Yi API 还将提供 Prompt 兼容调优服务支持,帮助迁移用户快速适配 Yi 系列大模型。
充值用户可根据自身需求选择 Yi-Large、Yi-Large-Turbo、Yi-Medium 等多款不同参数的模型。
Turbo 系列主打的是快速、廉价的性价比,对比 GPT-4 Turbo 的价格,用户接入 Yi-Large-Turbo 后使用成本可下降九成以上。
扫码关注公众号
获取更多技术资讯