如何了解Qwen3 提供了 8 款不同尺寸的丰富模型版本

> 数据图表

如何了解Qwen3 提供了 8 款不同尺寸的丰富模型版本

2025-5-3

Qwen3-4B 小尺寸模型数学及代码能力以小博大，有望助力端侧 AI 全面开花。4 月 29 日，阿里开源了新一代通义千问模型 Qwen3，在 GPQ A、AIME2425、LiveCodeBench 等多个权威基准测试中全面超越 R1、OpenAI -o1 等，表现出具备竞争力的结果。千问 3 提供了 8 款不同尺寸的丰富的模型版本，包含 2 款 30B、235B 的混合专家模型，以及 6 款稠密模型，每款模型均斩获同尺寸开源模型 SOTA。其中，小尺寸模型的表现亮眼，Qwen3-4B 在数学、代码能力上“以小博大”，和比自身大 10 倍模型水平相当，在数学编码生化上获得了显著提升，可媲美 Qwen2.5-72B。我们认为，Qwen3-4B 小尺寸模型性能与效率兼顾。提供的小尺寸高效方案将有利于更好地推动移动端部署，手机等 AI 端侧协同将迎来大幅增强。 AI 应用目前在走向百花齐放，而不是高度范化的统一模型。硬件侧在为应用的落地酝酿很多新技术储备，这些机会更加重要。MOE 模型开始驱动小的大模型，小型 MoE 模型 Qwen3-30B-A3B 的激活参数数量是 QwQ-32B 的 10%，表现更胜一筹，激活 10%参数量却能超过满血模型，也为端侧应用提供了模型基础。我们认为，海外硬件大厂在储备能让 AI“泛在”与“常开”的技术，NPU 作为协处理器的运用极有可能是下一代的端侧技术趋势。

国泰海通科技传媒