> 数据图表你知道o3 在 SWE-benchVerified、Codeforces 测试中2025-4-6近 OpenAI 顶尖程序员水平而在数学竞赛(AIME)中,o3 的准确率高达 96.7%,远超 o1的 83.3%在博士生级别问题测试集(GPQA)中,o3 达到 87.7 分,远超人类选手的程度中原证券综合其他