> 数据图表想关注一下1.1
2025-5-01.1视频生成等多模态模型不断迭代升级,为多模态AI应用打下基础1.1.1 GPT-4o:发起图像生成领域技术革命2025年3月26日,OpenAI正式推出GPT-4o原生图像生成功能,取代了此前的DALL-E3,成为ChatGPT和Sora平台的默认图像引擎。GPT-4o具备几大特点:精准文本渲染:GPT-4o首次解决了图像生成领域的“文字难题”,可精准生成Logo、菜单、路牌等含复杂文本的图像。例如,用户描述“印有OpenAI字样的T恤”,模型能准确呈现文字细节,甚至保留摄影倒影的真实感。复杂指令执行:支持用户通过自然语言指定宽高比、色号、透明度等参数,并一次性处理10-20个对象的绑定关系。多模态深度整合:GPT-4o与Sora平台联动,用户可基于生成的图像进一步创作视频。艺术风格全覆盖:支持生成写实照片、手绘草图、漫画分镜等多种风格,一键生成吉卜力风格的图片,在海外社媒火爆出圈,ChatGPT一小时新增了百万用户。图1:GPT-4o可以一键生成吉卜力风格的图片图2:GPT-4o在ArtificialAnalysis测试中以ELO评分并列第一资料来源:新智元公众号资料来源:马上消费UXC公众号