> 数据图表

如何了解行业要闻及简评

2025-3-0
如何了解行业要闻及简评
行业要闻及简评事件描述:OpenAI发布了GPT-4o image generation,图像生成技术模型。同日,谷歌推出Gemini 2.5 Pro Experimental。ChatGPT文生图功能迎重大升级,谷歌Gemini2.5 Experimental发布点评:OpenAI推出GPT-4o原生多模态图像生成功能。OpenAI将新的图像生成功能直接集成到 ChatGPT 中——该功能被称为“ChatGPT 中的图像”。用户现在可以使用 GPT-4o 在 ChatGPT 内部生成图像。此初始版本仅专注于图像创建,并将在 ChatGPT Plus、Pro、Team 和Free 订阅层中提供。值得注意的是,GPT-4o 图像生成标记器词汇量(实际上是用于表示文本的唯一整数的数量)已从GPT-4和GPT-3.5的约10万个增加到约20万个。古吉拉特语输入使用的标记减少了4.4倍,日语减少了1.4倍,西班牙语减少了1.1倍。以前,除英语以外的其他语言在提示中可以容纳多少文本方面会付出实质性的代价。此外,在价格方面,OpenAI声称,与GPT-4 Turbo相比,其价格降低了50%。更直观的对比是,GPT-4o成本恰好是10倍 GPT-3.5;4o是5美元/百万输入token和15美元/百万输出token。3.5是0.50美元/百万输入token和1.50美元/百万输出 token。OpenAI 承诺也将向免费ChatGPT用户提供该模型——这是他们第一次直接向非付费客户提供“最佳”模型。2020年1月10日谷歌最新推出的Gemini 2.5 Pro Experimental,被誉为迄今为止最先进的 AI 模型。 当前谷歌发布的Gemini 2.5 Pro Experimental已经在LMArena排行榜上拔得头筹,超越了 Claude 3.7、Grok 3 以及 DeepSeek-R1 等知名模型,在数学、科学以及创意写作等多项基准测试中表现突出,尤其在推理和编码上更是领先一步。Gemini 2.5 Pro 的核心创新在于把推理作为系统底层能力来构建,能够在充分思考和权衡之后才给出解决方案。相较于只把推理当作“外挂”的做法,这种全方位的整合让模型在回复时更准确、更贴近真实场景,也更能捕捉用户的上下文含义和细微差异。在谷歌自家的多项评估中,Gemini 2.5 Pro取得了极为抢眼的成绩:在高度复杂的推理基准上稳居榜首,并且无需依赖昂贵的投票或其他变通手段。在GPQA与AIME 2025等基准中都领先于同类产品。面对难度极高的“人类的最后考试”(由数百名专家构建,用来测试人类知识和推理极限)时,更是拿下了18.8% 的优异成绩,而且全程未借助任何工具辅助。同时,其编码能力的飞跃同样值得一提。相比Gemini 2.0,2.5 Pro 在构建 Web 应用、编写代理式代码以及进行代码转换等任务上都有重大突破。在 SWE-Bench Verified(专门用来衡量代理编码水平的基准)中,更是靠着定制代理配置取得了 63.8% 的表现。目前,Gemini 2.5 Pro 已在 Google AI Studio 以及 Gemini Advanced 应用平台上线,面向商业和个人用户开放,提供了长达一百万 Token 的上下文窗口。资料来源:36氪,平安证券研究所