如何才能2.3 阿里Qwen3 系列模型强势开源，文本表征领域一骑绝尘

> 数据图表

如何才能2.3 阿里Qwen3 系列模型强势开源，文本表征领域一骑绝尘

2025-6-1

2.3 阿里Qwen3 系列模型强势开源，文本表征领域一骑绝尘阿里巴巴开源 Qwen3 系列新模型 Qwen3-Embedding 和 Qwen3-Reranker，二者基于 Qwen3 基础模型训练，支持 119 种语言，专为文本表征、检索与排序任务设计。测试显示，Qwen3-Embedding 的 8B 参数模型在多语言文本表征基准测试中以 70.58 分排名第一，超越谷歌 Gemini-Embedding 等商业 API 服务。Qwen3-Reranker 的 8B 模型在多语言、中文、英文检索任务中分别取得 69.02 分、77.45 分、69.76 分，显著优于其他基线模型。Ø 模型架构上，两款模型采用基于 Qwen3 基础模型的密集版本，提供 0.6B、4B、8B 三种参数规模配置。研究人员采用了因果注意力机制的大模型，并在输入序列的末尾添加了[EOS]标记，从而从最后一层的隐藏状态中提取文本的语义表征，增强了模型对文本语义的理解能力。Ø 训练范式上，采用多阶段训练法：无监督预训练阶段利用 Qwen3 基础模型合成大规模弱监督数据，提升数据可控性与低资源语言数据质量；监督微调阶段结合开源标注数据集与合成筛选数据，增强模型泛化能力；模型融合阶段通过球面线性插值技术合并检查点，提升模型稳定性与一致性。图：千问官方发布动态图：模式测试对比资料来源：AIGC开放社区公众号、天风证券研究所

天风证券综合其他