> 数据图表如何才能2.1.1 模型:Agentic能力内置LLM,迈向Agent深度渗透时代2025-8-32.1.1 模型:Agentic能力内置LLM,迈向Agent深度渗透时代 我们认为,用户对Agent的信赖度,直接且深刻地锚定于其底层大模型的双重能力:卓越的性能水平与坚实的可靠水平,当前已有显著突破。 性能水平:根据斯坦福《2025年人工智能指数报告》,除多模态理解与推理,人工智能已在多数任务中超越人类水平。从主流的Agentic AI产品来看,用户任务完成率已达到较高水平。根据FirstPageSage,评估智能体系统在复杂的多步骤任务上的性能,Claude Computer、AutoGPT、OpenAI Code Interpreter任务完成率(无人类干预)分别为86%、81%、73%。图表3:选定的人工智能指数技术性能比较基准与人类表现对比图表4:主流Agentic AI任务完成率较高资料来源:斯坦福《2025年人工智能指数报告》,中邮证券研究所资料来源:FirstPageSage,中邮证券研究所请参阅附注免责声明9中邮证券综合其他