想关注一下1.1

> 数据图表

想关注一下1.1

2025-5-0

1.1视频生成等多模态模型不断迭代升级，为多模态AI应用打下基础1.1.1 GPT-4o：发起图像生成领域技术革命2025年3月26日，OpenAI正式推出GPT-4o原生图像生成功能，取代了此前的DALL-E3，成为ChatGPT和Sora平台的默认图像引擎。GPT-4o具备几大特点：精准文本渲染：GPT-4o首次解决了图像生成领域的“文字难题”，可精准生成Logo、菜单、路牌等含复杂文本的图像。例如，用户描述“印有OpenAI字样的T恤”，模型能准确呈现文字细节，甚至保留摄影倒影的真实感。复杂指令执行：支持用户通过自然语言指定宽高比、色号、透明度等参数，并一次性处理10-20个对象的绑定关系。多模态深度整合：GPT-4o与Sora平台联动，用户可基于生成的图像进一步创作视频。艺术风格全覆盖：支持生成写实照片、手绘草图、漫画分镜等多种风格，一键生成吉卜力风格的图片，在海外社媒火爆出圈，ChatGPT一小时新增了百万用户。图1：GPT-4o可以一键生成吉卜力风格的图片图2：GPT-4o在ArtificialAnalysis测试中以ELO评分并列第一资料来源：新智元公众号资料来源：马上消费UXC公众号

开源证券科技传媒