> 数据图表怎样理解字节在测评结果上取得了多项 SOTA 表现表现2025-5-4字节跳动发布升级版豆包 1.5 视觉深度思考模型,具备更强的通用多模态理解和推理能力。豆包1.5 深度思考模型的多模态推理能力接近 Gemini 2.5 pro,且激活参数仅有 20B。在 60 个公开评测基准中有 38 个取得 SOTA 表现,在视频理解、视觉推理、多模态智能体能力等方面均处于第一梯队。从性能上来看,其具有优秀的视觉识别能力和 OCR 能力,并可基于识别结果进行精确的推理,例如在找不同、图像规律推理中有更好的表现。东方证券综合其他