> 数据图表

一起讨论下本周票房统计(2025.5.10-2025.5.16)

2025-5-0
一起讨论下本周票房统计(2025.5.10-2025.5.16)
腾讯发布混元图像 2.0 模型,首次实现毫秒级响应5 月 16 日,腾讯在北京发布了混元图像 2.0 模型。该模型首次实现了毫秒级响应的实时文生图功能,用户描述场景时,模型可同步生成图像,极大提升了生成效率。此外,该模型还具备实时绘画板功能,用户通过手绘草图结合文字说明即可创建图像。模型支持语音输入、参考图上传,并能优化生成的图像。技术上,混元图像 2.0 通过增大模型尺寸、采用高效图像编解码器、适配多模态大语言模型及强化学习后训练等手段,显著提高了图像生成的真实感和语义遵从能力。(量子位) 字节发布 Seed1.5-VL 多模态推理模型,在 60 个主流基准测试中拿下 38 项第一5 月 14 日,字节跳动在北京发布了轻量级多模态推理模型 Seed1.5-VL。该模型在 60个主流基准测试中拿下 38 项第一,展现了强大的多模态推理能力。Seed1.5-VL 采用532M 视觉编码器和 200 亿活跃参数的语言模型架构,在复杂谜题推理、图表理解、3D空间理解等方面表现出色。该模型还擅长处理 Agent 任务,在 GUI 界面操作和游戏场景中优于其他顶尖模型。模型训练通过多样化数据和多阶段训练优化,支持多种图像分辨率输入,并引入时间戳标记增强时间信息感知。此外,字节还开发了优化技术以支持大规模预训练和后训练,显著提高训练吞吐量并降低硬件成本。模型目前可在 Hugging Face 在线体验。(量子位)