> 数据图表

咨询下各位使用Gemini 2.5 pro创建的视频游戏

2025-3-1
咨询下各位使用Gemini 2.5 pro创建的视频游戏
Gemini 2.5 Pro 在一系列需要高级推理的基准测试中都处于领先地位。2.5 Pro 不使用会增加成本的测试时间技术 如多数表决),在数学和科学基准测试 如 GPQA 和 AIME2025)中处于领先地位。 在由数百名学科专家设计的数据集,旨在捕捉人类知识和推理的前沿的“人类的最后考试”中,它在未使用工具的模型中也获得了 18.8%的最高分数,这是目前最先进的成绩。 在编码性能上,Gemini 2.5 Pro 擅长创建视觉上引人注目的 Web 应用程序和 Agent 代码应用程序。在 Agent 代码评估的行业标准 SWE-Bench Verified 上,Gemini 2.5 Pro 使用自定义 Agent 设置得分为 63.8%。