> 数据图表

咨询下各位DeepSeek-R1-0528-Qwen3-8B 等开源模型的 AIME 2024 对比结果

2025-6-1
咨询下各位DeepSeek-R1-0528-Qwen3-8B 等开源模型的 AIME 2024  对比结果
根据 DeepSeek 内部优化方向和自身的感知,这次升级集中在响应质量、响应速度、对话稳定性和 API 和接口兼容性等多个方面:1)响应质量优化:复杂推理、多步骤计算更准确长文理解与生成更连贯、逻辑更清晰数学、编程等专业性输出更可靠。2)响应速度小幅提升:在网页端、App、API 接口中响应更敏捷尤其在处理超长文本输入时,延迟有所降低(约提升 10%至 20%)。3)对话稳定性增强:上下文记忆更稳定,尤其在超长对话中(支持最多 128K 上下文)减少偶尔“遗忘设定”或“跑偏”的情况。4)API 和接口兼容性保持稳定:如公告所说,API 调用方式、参数、返回结构完全不变用户无需调整现有集成,即可无缝使用新版本。