Qwen3深夜正式开源,小尺寸也能大力出奇迹

HelloKitty 2025-04-29 11:24

扫一扫 在手机阅读、分享本文

865

本文由 数字生命卡兹克 撰写/授权提供,转载请注明原出处。

以下文章来源于:数字生命卡兹克

作者:卡兹克、dongyi

小道消息一直在说,昨天深夜或者今天凌晨,阿里会发 Qwen3。

然后我特意早早的睡了一两小时,凌晨1点起床,就为了等 Qwen3 发。

结果这一等,就是好几个小时。。。

不过,功夫不负有心人。

凌晨5点,我眼睛都睁不开的时候,终于等到了。

Qwen 你赔我睡眠。。。

把报告看完,我总结一下,觉得最大的亮点有 6 个:

1. 模型能力登顶全球,这个没啥可说的,就是 No.1。

2. 第一个开源的混合推理模型。

3. 8 个不同尺寸的模型,几乎覆盖了所有场景。

4. 成本很低,旗舰模型 235B 参数部署成本只要 DeepSeek R1 的三分之一。

5. 支持 MCP 协议。

6. 居然还支持了 119 种语言。

一起说吧。

这次发了 8 个模型,Qwen3-0.6B、1.7B、4B、8B、14B、32B,这 6 个都是 Dense 稠密模型。

还有两个重量级 MoE 模型,Qwen3-30B-A3B,和旗舰版的 Qwen3-235B-A22B。

这次 Qwen 采用了新的命名方式,Qwen3-0.6B、1.7B、32B 这种没啥可说的,大家都理解。

两个 MoE 模型,把激活的参数写在后面,Qwen3-235B-A22B 的意思就是 235B 的参数,但是在推理时只激活 22B。

Qwen3-30B-A3B 就是总参数量为 30B,激活参数 3B,这个还蛮有意思的。

而且,所有的模型,都是混合推理模型。

大概的意思就是,你既可以把它当不会长思考没有思维链的普通模型用,也可以直接开启推理模式,变成一个推理模型。

可以简单的理解为,把 DeepSeek V3 和 R1 直接揉在了一起。

就像我们其实都知道,DeepSeek 这个深度思考,你打开的时候,是 R1 模型,但是你关掉,其实用的是 v3 来给你回答。

但是 Qwen3,是一体的。

是一个模型,只不过支持了两种模式,这个不管对于开发者还是使用者,都方便很多。

整体上,8 个模型,诚意足到爆炸,小到 0.6B,大到 235B,能打手机端侧,也能打旗舰体验,全部一次性开源了,而且都是 Apache 2.0 协议,想怎么用就怎么用,想商用就商用,没啥顾虑。

Qwen3-0.6B~4B 的最大 Token 都是 32K,其他的都是 128K。

性能上,稍微有点离谱。

Qwen3-4B 的小模型,就已经能和上一代 QwQ-32B 这玩意打得有来有回。而 Qwen3-30B-A3B,更是几乎就比 QwQ-32B 全方位的强。

至于最牛逼的那个 Qwen3-235B-A22B,他们甚至没只跟开源模型比,比的全都是最顶级的闭源模型。

最主要的是,这玩意部署成本,大概只有 DeepSeek R1 的三分之一啊。。。

什么叫便宜大碗,这就是。

但是这么一对比,忽然发现,Gemini2.5-Pro,好像有点猛。。。

同时,在性能水桶式提升的背景下,也有了更强的 Agent 能力,也支持 MCP 了。

他们官方自己放了一段视频。我也随手把即梦接了进去,可以直接用 Qwen3 来调用即梦画图了。。。

就还真的,挺好玩,你的下一个即梦,又何必是即梦呢(狗头。

除了这些模型的能力,Qwen3 这次还有一个很有趣的东西。

就是语言。

上一代的 Qwen2.5,只支持包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等 29 种语言。

而这一次,支持 119 种语言了。

不是,到底谁才是真正的 OpenAI 啊。

这妥妥是为世界人民谋福利好吧。。。

项目地址都在这了。

Blog: https://qwenlm.github.io/blog/qwen3/

GitHub: https://github.com/QwenLM/Qwen3

你牛逼的话可以自己部署,我 5080 勉强跑个 Qwen3-8B,实在跑不起。

想体验的话,可以直接去通义和 Qwen Chat,都可以。

通义:https://www.tongyi.com/qianwen/

Qwen Chat:https://chat.qwen.ai/

我自己直接在 Qwen Chat 上面实测了一波,一进来左上角就默认是旗舰版 Qwen3。

嗯,就是比较抽象的是,提示语都居然都变成早上好,卡兹克了。。。

你可以在左上角,切换 3 个这次 Qwen3 比较有代表的模型来进行对比。

左下角的深度思考,就能是否开启推理的开关。

而且这个开关还能拖动滑块,决定它的最大思考长度,虽然这个功能很极客,但是还有意思。

我自己的实测结论就是:水桶级别,中等偏上。

比如让它给我生成一个登录页。

效果很不错,能直接干出一个很酷的界面。

https://us4mpg09fz.app.yourware.so/

或者做藏师傅搞得可交互的网页,把吃瓜 PDF 变成在线时间线。

这时候你就会发现,审美会差一点,丰富度也会不是特别狗,稍微有一点点勉强了。

藏师傅之前的可视化网页 Prompt 如下:

1.png

2.png

而如果再让它写一个之前我在文章里放的洛小山的弹球游戏。就确实没有那么亮眼,在游玩的时候还有一些些 BUG。

但是毕竟这个游戏还是太复杂了,人模型的尺寸也没那么大,也没法既要又要。

如果是做稍微简单一点的连连看游戏,就还是比较简单了。

<!-- 生成一个记忆翻牌游戏,要求:

1. 使用 CSS 渐变背景(深紫到黑)

2. 12 张圆角卡片(6 对图案),默认显示彩色霓虹边框

3. 点击卡片翻转时显示 emoji 图案,匹配成功时卡片变为半透明发光状态

4. 顶部显示极简计时器和步数统计

5. 禁止使用图片,全部用 CSS 绘制 -->

6.<div id="memory-game" style="background: linear-gradient(135deg, #3a0ca3, #000);">  

7.<!-- JS动态生成卡片 -->

8.</div>,所有的游戏文字都是英文

除了代码,逻辑问题,现在基本也不太能难道现在的推理大模型了。

不过在遇到一些非常离奇非正常的测试 prompt 时,还是会有一点点掉智。

文笔的话,亲测会比 DeepSeek 好一些。

但是略逊于 GPT-4o。

如果你还想玩一点花活,还能跟即梦打通做结合。

就能实现类似于那种原生多模态模型,图文混排的效果。

还是超级有意思的。

总之,这次 Qwen3 的发布,真的有点像是深夜街头,突然亮起的那盏霓虹灯。

不仅亮,还便宜。

不仅便宜,还能库库的切换颜色。

这一波下来,阿里确实是拿出了一种很阿里的态度。

Qwen3,欢迎来到这个荒诞又灿烂的时代。

咱们,下个奇点见。

微信图片_20230104175528.jpg


扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章