谁知道2.1.1 模型：Agentic能力内置LLM，迈向Agent深度渗透时代

> 数据图表

谁知道2.1.1 模型：Agentic能力内置LLM，迈向Agent深度渗透时代

2025-8-3

2.1.1 模型：Agentic能力内置LLM，迈向Agent深度渗透时代 我们认为，用户对Agent的信赖度，直接且深刻地锚定于其底层大模型的双重能力：卓越的性能水平与坚实的可靠水平，当前已有显著突破。 可靠水平：大模型故障发生率与幻觉水平正在加速下降。根据斯坦福《2025年人工智能指数报告》，基于语言模型的智能体故障发生率从GPT-3.5的62%下降至GPT-4的39.4%；根据Vectara，大模型幻觉发生率从o1-mini的1.4%下降至o3-mini-high的0.795%和gemini-2.0-flash的0.7%。图表5：基于语言模型的智能体故障发生率图表6：大模型幻觉率出现下降资料来源：斯坦福《2025年人工智能指数报告》，中邮证券研究所资料来源：Huggingface，中邮证券研究所请参阅附注免责声明10

中邮证券综合其他