> 数据图表

一起讨论下3 GUI Agent浪潮迭起,自主性通用性不断提升

2025-3-3
一起讨论下3 GUI Agent浪潮迭起,自主性通用性不断提升
3 GUI Agent浪潮迭起,自主性通用性不断提升2 OpenAI推出首款AI Agent Operator 2025年1月24日,OpenAI发布AI Agent Operator,能在浏览器上执行简单在线任务的网络应用,如预订音乐会门票、在线订购杂货等。 关键技术:由基于GPT-4o构建的新模型Computer-Using Agent (CUA)提供支持,CUA通过处理原始像素数据以了解屏幕上发生的情况,并使用虚拟鼠标和键盘完成操作,可以导航多步骤任务、处理错误并适应意外变化。 Operator全计算机使用任务成功率:OSWorld(38.1%),WebArena(58.1%),WebVoyager(87%),超越之前最先进的基准结果;落后于人类在OS World测试中的表现(72.4%)。图:Computer-Using Agent (CUA)运作机制图:Computer-Using Agent (CUA)在OS World基准测试中的表现请务必阅读正文之后的免责条款部分资料来源:OpenAI官网,国元证券研究所资料来源:OpenAI官网,国元证券研究所1717