> 数据图表想关注一下Opus 4 SWE-bench 测试结果2025-5-2根据发布会描述,Claude Opus 4 被定义为 Anthropic 迄今最强大的模型,专为处理复杂的推理流程和软件开发场景设计。测试数据显示,该模型在 SWE-中邮证券金融地产