LLM 推理成本 2026 变革:几分钱时代的应用经济学

2022 年 12 月,GPT-4 的 API 价格是每百万 Token 输入约 30 美元、输出约 60 美元。那时候能"用得起"大模型的公司屈指可数。 不到三年后,2026 年 3 月,Google Gemini 3.1 Flash-Lite 上线:每百万 Token 输入仅 0.25 美元,输出 1.5 美元。同等性能的成本下降超过 200 倍。 ...

进阶 · 2026-03-27 · 17 分钟 · 3055 字 · PengJiyuan
LLM 推理成本经济学

LLM 推理时间计算Scaling:为什么 o1/o3 之后的 AI 正在改变游戏规则

2025 年之前,提升 AI 模型能力的主流做法很简单:收集更多数据,训练更大的模型,买更多 GPU。这条路走过十几年,Scaling Laws 一次次被验证有效。 但 2025 年之后,事情开始起变化。 ...

高级 · 2026-03-26 · 22 分钟 · 3940 字 · PengJiyuan
Test-Time Compute Scaling