> 数据图表怎样理解Mini Max M2.7 在多个测试集中的表现2026-3-0MiniMax 于 2026 年 3 月 18 日发布了新一代 Agent 旗舰大模型 M2.7,核心的突破在于首次实现了“模型自我进化” 。M2.7 能够通过构建复杂Agent Harness,深度参与自身的训练、优化与迭代流程,例如自动执行超过 100 轮“分析-改进-验证”的闭环,最终通过优化在内部评测集上实现约 30%的效果提升,并能够在 RL 场景实例中承担 30%至 50%的工作流 。在具体能力上,M2.7 在软件工程和办公等方面表现卓越,在 SWE-Pro基准测试中取得 56.22%的成绩,几乎接近 Opus 最好的水平。此外,M2.7在端到端的完整项目交付场景 VIBE-Pro 测试中得分 55.6%以及在对复杂工程系统的深层理解 Terminal Bench 2 测试中得分 57.0%。华龙证券综合其他