如何才能2.1.1 模型：Agentic能力内置LLM，迈向Agent深度渗透时代

> 数据图表

如何才能2.1.1 模型：Agentic能力内置LLM，迈向Agent深度渗透时代

2025-8-3

2.1.1 模型：Agentic能力内置LLM，迈向Agent深度渗透时代 我们认为，用户对Agent的信赖度，直接且深刻地锚定于其底层大模型的双重能力：卓越的性能水平与坚实的可靠水平，当前已有显著突破。 性能水平：根据斯坦福《2025年人工智能指数报告》，除多模态理解与推理，人工智能已在多数任务中超越人类水平。从主流的Agentic AI产品来看，用户任务完成率已达到较高水平。根据FirstPageSage，评估智能体系统在复杂的多步骤任务上的性能，Claude Computer、AutoGPT、OpenAI Code Interpreter任务完成率（无人类干预）分别为86%、81%、73%。图表3：选定的人工智能指数技术性能比较基准与人类表现对比图表4：主流Agentic AI任务完成率较高资料来源：斯坦福《2025年人工智能指数报告》，中邮证券研究所资料来源：FirstPageSage，中邮证券研究所请参阅附注免责声明9

中邮证券综合其他