LLM 推理时间计算Scaling:为什么 o1/o3 之后的 AI 正在改变游戏规则

2025 年之前,提升 AI 模型能力的主流做法很简单:收集更多数据,训练更大的模型,买更多 GPU。这条路走过十几年,Scaling Laws 一次次被验证有效。 但 2025 年之后,事情开始起变化。 ...

高级 · 2026-03-26 · 22 分钟 · 3940 字 · PengJiyuan
Test-Time Compute Scaling

思考的深度与广度:LLM Reasoning 技术全面解析

2024 年,OpenAI o1 的发布让"推理"成为 LLM 领域的关键词。2025 年,o3、Claude 3.7 Sonnet、Gemini 2.5 Flash 等模型相继在推理能力上取得突破。进入 2026 年,Reasoning 已经成为评价大模型能力的核心维度之一。 ...

高级 · 2026-03-25 · 27 分钟 · 4786 字 · PengJiyuan
LLM Reasoning 技术全景解析

神经符号AI:让机器同时拥有直觉与逻辑

2026年3月,AI圈出现了一个令人兴奋的消息:Tufts大学的研究团队证明,神经符号AI(Neuro-Symbolic AI)可以在机器人任务中实现100倍的能效提升,训练时间从传统模型的36小时缩短到34分钟,训练能耗仅需原来的1%。 ...

高级 · 2026-03-24 · 28 分钟 · 4953 字 · PengJiyuan
神经符号AI