> 数据图表

如何了解Qwen3 提供了 8 款不同尺寸的丰富模型版本

2025-5-3
如何了解Qwen3 提供了 8 款不同尺寸的丰富模型版本
Qwen3-4B 小尺寸模型数学及代码能力以小博大,有望助力端侧 AI 全面开花。4 月 29 日,阿里开源了新一代通义千问模型 Qwen3,在 GPQ A、AIME2425、LiveCodeBench 等多个权威基准测试中全面超越 R1、OpenAI -o1 等,表现出具备竞争力的结果。千问 3 提供了 8 款不同尺寸的丰富的模型版本,包含 2 款 30B、235B 的混合专家模型,以及 6 款稠密模型,每款模型均斩获同尺寸开源模型 SOTA。其中,小尺寸模型的表现亮眼,Qwen3-4B 在数学、代码能力上“以小博大”,和比自身大 10 倍模型水平相当,在数学编码生化上获得了显著提升,可媲美 Qwen2.5-72B。我们认为,Qwen3-4B 小尺寸模型性能与效率兼顾。提供的小尺寸高效方案将有利于更好地推动移动端部署,手机等 AI 端侧协同将迎来大幅增强。 AI 应用目前在走向百花齐放,而不是高度范化的统一模型。硬件侧在为应用的落地酝酿很多新技术储备,这些机会更加重要。MOE 模型开始驱动小的大模型,小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%,表现更胜一筹,激活 10%参数量却能超过满血模型,也为端侧应用提供了模型基础。我们认为,海外硬件大厂在储备能让 AI“泛在”与“常开”的技术,NPU 作为协处理器的运用极有可能是下一代的端侧技术趋势。