> 数据图表咨询大家6.2 Apple intelligence进展
2025-9-16.2 Apple intelligence进展n Apple Intelligence基础语言模型论文7月17日更新,语言理解、指令跟随、推理、写作与工具使用功能表现出色:Ø AFM包括两个模型,设备端运行的3B模型 AFM-on-device,以及在私有云计算上运行的大参数模型 AFM-server。Ø 训练:云端模型采用8192个TPUv4,端侧模型采用2048片TPUv5p训练。每个 v5p pod 由 8960 个芯片组成,每秒的浮点运算和内存分别是 TPU v4 的两倍和三倍。Ø 基准测试:设备端模型在MMLU/MMMLU上优于Qwen-2.5-3B、 Gemma-3n ,接近规模更大的Gemma-3-4B和Qwen-3-4B ;服务器模型略微落后LlaMA 4 Scout,但与更大的Qwen-3-235B和GPT-4o相比差距较大。Ø 人类评估:文字方面,AFM设备端模型表现优于Qwen-3-4B 与Gemma-3n-E4B,云端表现优于LlaMA 4 Scout与GPT-4o,略逊于Qwen-3-235B;图片方面,设备端模型表现大幅领先Qwen-2.5-VL-3B和Gemma-3-4B,云端模型表现优于Qwen-2.5-VL-32B,略逊于LlaMA 4 Scout,和GPT-4o差距较大。来源:artificial analysis,arxiv,中泰证券研究所48