> 数据图表

你知道Grok-3 基准能力测试结果

2025-9-2
你知道Grok-3 基准能力测试结果
Grok-3 优化推理模式以及 AI 工具板块的使用。Grok-3 于 2025 年 2 月发布,这一版本在保持 Grok-2 多模态和实时信息能力的基础上,强化了复杂推理和自主工具使用,引入了双推理模式:Think 模式和 DeepSearch 模式。在 Think 模式下,Grok-3 会采用链式思维逐步分析问题,给出详细的推理过程,帮助用户理解模型的思考步骤。在 DeepSearch 模式下,模型则会调用内置的深度搜索引擎,对网络上的更多数据源进行检索。DeepSearch 通常比普通检索耗时更长,提供更深入详细的结果。Grok-3 可以针对不同任务选择最合适的推理策略:简单问题直接作答,复杂问题则分步思考或联网搜索。在算力规模方面,Grok-3 投入达到了新的高度,模型由多个优化过的专家网络组成,每个网络专攻不同领域,参数总数约 2.7 万亿。在 Grok-3 训练方面,xAI 利用了超级计算集群Colossus 提供算力支持,总训练数据来源自互联网与合成数据。Grok-3 展示了 xAI 在通用人工智能方面的巨大进步。