> 数据图表你知道证券研究报告2025-6-0证券研究报告23华安研究• 拓展投资价值AI Agent 海外厂商进程——OpenAI Operator技术原理• Operator核心是基于“ CUA (Computer-Using Agent)”新型模型的网络自动化,结合GPT-4o 的视觉能力和通过强化学习获得的先进推理能力,经过专门训练能够与图形用户界面GUI(即用户在屏幕上看到的按钮、菜单和文本框等元素)进行交互;通过“观察”(屏幕截图)和“交互”(使用鼠标和键盘的所有操作)与浏览器进行通信,能够像人类用户一样操作浏览器,完成各种在线任务;CUA关键步骤:1)视觉感知:通过截取网页的屏幕截图来“观察”网页的内容和布局,凭借 GPT-4o 多模态视觉能力,CUA 能够精确识别网页上的各种元素,例如按钮、文本框、图片、链接等交互组件;2)任务理解:利用 GPT-4o 的自然语言理解能力,将这些指令转化为计算机可以执行的操作序列;3)操作执行:基于任务指令,通过模拟人类用户的操作来完成具体任务,包括“移动”鼠标、点击按钮、拖动滑块、输入文本等;4)环境反馈:观察网页发生的变化,例如页面跳转、新内容加载、文本框自动填充,将其作为动态输入,调整后续的行动计划;5)推理与自纠正:在任务执行过程中遇到挑战或犯了错误会触发推理能力,通过对当前情境的综合分析进行自我纠正;6)人机协作:在某些特殊情况下,例如遇到复杂验证码或极具歧义性的指令时,CUA 会主动将控制权交还给用户。•图表21:CUA工作原理图资料来源:亿欧,华安证券研究所敬请参阅末页重要声明及评级说明华安证券研究所华安证券科技传媒