> 数据图表我想了解一下2.3 阿里Qwen3 系列模型强势开源,文本表征领域一骑绝尘2025-6-12.3 阿里Qwen3 系列模型强势开源,文本表征领域一骑绝尘阿里巴巴开源 Qwen3 系列新模型 Qwen3-Embedding 和 Qwen3-Reranker,二者基于 Qwen3 基础模型训练,支持 119 种语言,专为文本表征、检索与排序任务设计。测试显示,Qwen3-Embedding 的 8B 参数模型在多语言文本表征基准测试中以 70.58 分排名第一,超越谷歌 Gemini-Embedding 等商业 API 服务。Qwen3-Reranker 的 8B 模型在多语言、中文、英文检索任务中分别取得 69.02 分、77.45 分、69.76 分,显著优于其他基线模型。Ø 模型架构上,两款模型采用基于 Qwen3 基础模型的密集版本,提供 0.6B、4B、8B 三种参数规模配置。研究人员采用了因果注意力机制的大模型,并在输入序列的末尾添加了[EOS]标记,从而从最后一层的隐藏状态中提取文本的语义表征,增强了模型对文本语义的理解能力。Ø 训练范式上,采用多阶段训练法:无监督预训练阶段利用 Qwen3 基础模型合成大规模弱监督数据,提升数据可控性与低资源语言数据质量;监督微调阶段结合开源标注数据集与合成筛选数据,增强模型泛化能力;模型融合阶段通过球面线性插值技术合并检查点,提升模型稳定性与一致性。图:千问官方发布动态图:模式测试对比资料来源:AIGC开放社区公众号、天风证券研究所天风证券综合其他