想问下各位网友Grok-3 基准能力测试结果

> 数据图表

想问下各位网友Grok-3 基准能力测试结果

2025-9-2

Grok-3 优化推理模式以及 AI 工具板块的使用。Grok-3 于 2025 年 2 月发布，这一版本在保持 Grok-2 多模态和实时信息能力的基础上，强化了复杂推理和自主工具使用，引入了双推理模式：Think 模式和 DeepSearch 模式。在 Think 模式下，Grok-3 会采用链式思维逐步分析问题，给出详细的推理过程，帮助用户理解模型的思考步骤。在 DeepSearch 模式下，模型则会调用内置的深度搜索引擎，对网络上的更多数据源进行检索。DeepSearch 通常比普通检索耗时更长，提供更深入详细的结果。Grok-3 可以针对不同任务选择最合适的推理策略：简单问题直接作答，复杂问题则分步思考或联网搜索。在算力规模方面，Grok-3 投入达到了新的高度，模型由多个优化过的专家网络组成，每个网络专攻不同领域，参数总数约 2.7 万亿。在 Grok-3 训练方面，xAI 利用了超级计算集群Colossus 提供算力支持，总训练数据来源自互联网与合成数据。Grok-3 展示了 xAI 在通用人工智能方面的巨大进步。

华创证券综合其他