> 数据图表想问下各位网友原生多模态模型的 Scaling 特性2026-1-2上升更快),导致部署成本更高。真正的优势路径是早期融合 稀疏(MoE):不仅性能不输,甚至更好,而且参数利用率更高,训练更高效,推理更省。东吴证券科技传媒