LLM 推理成本 2026 变革:几分钱时代的应用经济学

2022 年 12 月,GPT-4 的 API 价格是每百万 Token 输入约 30 美元、输出约 60 美元。那时候能"用得起"大模型的公司屈指可数。 不到三年后,2026 年 3 月,Google Gemini 3.1 Flash-Lite 上线:每百万 Token 输入仅 0.25 美元,输出 1.5 美元。同等性能的成本下降超过 200 倍。 ...

进阶 · 2026-03-27 · 17 分钟 · 3055 字 · PengJiyuan
LLM 推理成本经济学

2026 年 AI 技术趋势:从工程视角看真正重要的变化

每年年初都会有一批"AI 趋势预测"文章,大多读完感觉什么都写了又什么都没说。 这篇文章尝试不一样——只谈真正在改变工程实践的技术变化,跳过那些换汤不换药的营销概念。 ...

2026-03-05 · 15 分钟 · 2780 字 · PengJiyuan
2026 AI 技术趋势