> 数据图表

谁知道2.1.1 模型:Agentic能力内置LLM,迈向Agent深度渗透时代

2025-8-3
谁知道2.1.1 模型:Agentic能力内置LLM,迈向Agent深度渗透时代
2.1.1 模型:Agentic能力内置LLM,迈向Agent深度渗透时代 我们认为,用户对Agent的信赖度,直接且深刻地锚定于其底层大模型的双重能力:卓越的性能水平与坚实的可靠水平,当前已有显著突破。 可靠水平:大模型故障发生率与幻觉水平正在加速下降。根据斯坦福《2025年人工智能指数报告》,基于语言模型的智能体故障发生率从GPT-3.5的62%下降至GPT-4的39.4%;根据Vectara,大模型幻觉发生率从o1-mini的1.4%下降至o3-mini-high的0.795%和gemini-2.0-flash的0.7%。图表5:基于语言模型的智能体故障发生率图表6:大模型幻觉率出现下降资料来源:斯坦福《2025年人工智能指数报告》,中邮证券研究所资料来源:Huggingface,中邮证券研究所请参阅附注免责声明10