> 数据图表想关注一下Pass10 表现表现2025-5-3研究同时揭示了 AI 在许多核心子任务上的显著能力,尤其是在与具有清晰接口的系统(如网页 API)交互方面。表现最好的模型在 20 个任务家族中的 15 个上中邮证券金融地产