各位网友请教一下Grok-2 基准能力测试结果

> 数据图表

各位网友请教一下Grok-2 基准能力测试结果

2025-9-2

Grok-2 整合实时检索与图像生成，形成图文多模态闭环。xAI 于 2024 年 8 月 13 日推出了 Grok-2 与轻量化 Grok-2 Mini 两个版本。Grok-2 通过架构优化、训练方法改进及功能升级，在对话质量、推理能力及代码生成等关键维度均呈现优异表现。在视图领域方面，Grok-2 对比 Grok-1.5 新版本能理解和生成文本，根据描述生成图像。在文本交互方面， Grok-2 在保持文本交互优势的基础上实现跨模态能力扩展。在实时信息深度集成方面，模型接入马斯克 X 平台的实时数据，可以获取最新新闻和资讯，并引用实时信息。Grok-2 在模型的基准测试中整体表现优异。在数学测试 MATH 中，Grok -2 超越了 Claude，与 GPT-4o 的水平持平在视觉基准测试 DocVQA 中，Grok-2 获得了同期模型的最高得分，在 MMLU 代码测试中得分稍微落后于同期头部模型。

华创证券综合其他