LLM 推理成本 2026 变革:几分钱时代的应用经济学
2022 年 12 月,GPT-4 的 API 价格是每百万 Token 输入约 30 美元、输出约 60 美元。那时候能"用得起"大模型的公司屈指可数。 不到三年后,2026 年 3 月,Google Gemini 3.1 Flash-Lite 上线:每百万 Token 输入仅 0.25 美元,输出 1.5 美元。同等性能的成本下降超过 200 倍。 ...

2022 年 12 月,GPT-4 的 API 价格是每百万 Token 输入约 30 美元、输出约 60 美元。那时候能"用得起"大模型的公司屈指可数。 不到三年后,2026 年 3 月,Google Gemini 3.1 Flash-Lite 上线:每百万 Token 输入仅 0.25 美元,输出 1.5 美元。同等性能的成本下降超过 200 倍。 ...

2025 年之前,提升 AI 模型能力的主流做法很简单:收集更多数据,训练更大的模型,买更多 GPU。这条路走过十几年,Scaling Laws 一次次被验证有效。 但 2025 年之后,事情开始起变化。 ...
