> 数据图表

如何才能推理模型大量的 tokens 用于“打草稿”过程

2026-1-2
如何才能推理模型大量的 tokens 用于“打草稿”过程
佐证了这一点,推理模型的流量占比从 2025 年初的 0%一路飙升至 25 年末的 50%以上。这种从“简单问答”向“复杂推理”的范式转移,导致单位任务的算力消耗成倍增加。