2026 年 3 月,一条来自 IIT Delhi 的新闻在学术圈刷屏:一台 AI Agent 将原本需要一整天优化的显微镜参数,在 7–10 分钟内全部搞定。

这不是在吹牛——论文发表在 Nature Communications,作者是印度理工学院的博士生 Indrajeet Mandal。他的原话是:“AILA 大幅加速了我的研究进展。”

真正有意思的是 Professor N. M. Anoop Krishnan 的那句总结:

“以前,AI 只能帮你写关于科学的东西。现在,AI 真的能科学了——设计实验、操作真实设备、收集数据、解读结果。”

从「AI 辅助科研」到「AI 独立科研」,这个转变的信号比大多数人意识到的要强烈得多。本文深入解析这场真实发生的范式跃迁。


一、范式转移:从「科学家写报告」到「AI 做实验」

1.1 传统 AI for Science 的边界

过去几年,AI 在科研领域的应用主要集中在数字层面

  • 文献综述:用 LLM 快速梳理海量论文
  • 数据挖掘:从实验数据中寻找统计规律
  • 论文撰写:辅助起草、润色科研文档
  • AlphaFold:预测蛋白质结构,大幅加速结构生物学

这些工具本质上是增强人类科学家的认知效率——AI 做苦力,科学家做判断。

但 2025 年底出现的几个案例,开始触及一个更根本的问题:如果 AI 不仅能处理数据,还能操控真实世界的仪器呢?

1.2 三个标志性的临界点

临界点一:AILA(2025 年 12 月)

IIT Delhi 与丹麦、德国团队联合发布 AILA(Artificially Intelligent Lab Assistant),这是首个能独立操作真实科学仪器完成端到端实验的 AI Agent

它的实验对象是一台原子力显微镜(AFM)——一种用于纳米级材料表征的高精度仪器。操作 AFM 需要多年的物理学和仪器学训练,传统上即使是资深研究员,也需要数小时才能优化出高质量成像参数。

AILA 的工作流程:

  1. 观察:实时读取 AFM 软件输出的原始图像和测量数据
  2. 决策:判断当前参数是否最优,决定是否调整
  3. 执行:向显微镜发送指令,调整力度、速度、分辨率等参数
  4. 迭代:重复上述循环,直到获得高质量结果

全程无需人类干预。7–10 分钟完成过去一整天的工作。论文发表于 Nature Communications。

临界点二:AlphaEvolve(2025 年 5 月)

Google DeepMind 发布 AlphaEvolve,这是一个基于 Gemini 大模型的算法发现 Agent。它的工作方式本质上和 AILA 一致——观察→决策→执行→迭代——只是实验对象从显微镜变成了代码。

最惊人的成果:AlphaEvolve 发现了一个 4×4 复数矩阵乘法算法,使用 48 次标量乘法,打破了 Strassen 在 1969 年创下的纪录(51 次)。这个纪录保持了 56 年。

此外,AlphaEvolve 还帮助 Google 优化了数据中心调度、芯片设计、以及 AI 训练流程本身——平均回收了全球计算资源的 0.7%。

临界点三:AI Co-Scientist(2025 年 2 月)

Google 在 2025 年 2 月发布 AI Co-Scientist 系统,旨在让 AI 充当科学家的研究合作伙伴,而不仅仅是工具。它能:

  • 读取和消化大量文献,确定已知边界
  • 将想法翻译成数学和代码
  • 搭建分析和仿真环境
  • 自动检查计算正确性
  • 搜索庞大的设计空间,决定下一步实验方向

微软研究院的报告则指出了一个更明确的时间节点:2026 年,AI 不再只是总结报告,而是能生成自己的假设,并控制运行真实科学实验的应用程序。


二、AILA 深度解析:它是怎么做到的?

2.1 系统架构

AILA 的核心技术挑战在于将 AI 决策系统与真实物理仪器打通

AFM 显微镜连接着一台运行控制软件的计算机。软件实时显示原始图像和测量数据。AILA 的 Agent 框架读取这些数据输出,判断参数设置是否合适,然后向显微镜发送新的控制指令。

整个过程模拟了人类实验科学家的决策模式:

观察(看到图像质量)
→ 评估(判断是否需要调整参数)
→ 决策(调整什么参数)
→ 执行(发送指令)
→ 验证(再次观察结果)
→ 循环直到满意

2.2 为什么是 AFM?

选择 AFM 绝非偶然。AFM 是材料科学、纳米技术领域的核心表征工具,但其操作复杂性也是出了名的高:

  • 需要理解纳米级物理学
  • 涉及复杂的表面交互作用
  • 实时反馈控制要求极高
  • 参数空间庞大(探针力度、扫描速度、分辨率设置等)

AFM 被业界视为验证 AI 能否真正操控精密仪器的"试金石"。如果 AI 能搞定 AFM,操作其他实验室仪器(电子显微镜、光谱仪、3D 打印机等)的路径就打开了。

2.3 实际效益

对于科研人员而言,AILA 的价值不只是速度:

  • 7×24 运行:AI 不疲劳,可以通宵运行,人类科学家第二天早上直接看结果
  • 降低门槛:发展中国家和小型实验室通常缺乏熟练操作 AFM 的人员,AILA 可以弥补这一差距
  • 加速迭代:实验优化周期从"天"压缩到"分钟",同样的时间内可以测试更多假设

三、AlphaEvolve:会编程的 AI 科学家

3.1 工作原理

AlphaEvolve 的核心是一个大模型 + 进化算法的混合系统:

  1. 提示 Gemini 2.0 Flash:给定一个问题描述和可选的提示(如已有解法)
  2. 生成候选代码:让模型生成多段解决该问题的代码
  3. 评估器(Evaluator):用预先定义的"ground truth"测试每段代码的表现
  4. 进化选择:表现更好的代码进入下一代,被 LLM “morph”(变形)生成变体
  5. 迭代:重复上述过程,直到收敛到最优解

关键创新在于评估器的设计——将问题转化为可客观测量的指标(运行时间、精度、输出正确性),使进化过程有了"方向"。

3.2 已验证的成果

  • 矩阵乘法:4×4 复数矩阵,48 次乘法(vs Strassen 的 51 次)
  • 数据中心调度:全球平均提升 0.7% 计算资源利用率
  • 芯片设计:优化了 TPU 布局的关键算法
  • 数学问题:在 50+ 开放问题上测试,约 75% 的情况下重现了当前最优解

第 75% 这个数字值得玩味:它意味着 AlphaEvolve 至少不弱于现有最佳人类解法,同时在约 25% 的问题上有新发现。


四、AI for Science 的全局图景

4.1 从辅助到独立的演进路径

AI for Science 可以分为四个阶段:

阶段描述代表案例
L1: 数据处理AI 帮助处理实验数据、统计分析传统机器学习工具
L2: 认知增强AI 帮助读文献、写报告、做文献综述ChatGPT for research
L3: 实验执行AI 操控仪器,独立完成实验AILA
L4: 假设生成AI 自主提出科学假设并设计验证实验AlphaEvolve、AI Co-Scientist

当前(2026 年初),行业整体处于 L2 向 L3 过渡的阶段。L4 的案例(AlphaEvolve)仍然依赖于精心设计的评估器,大规模独立提出原创性科学假设的能力尚不成熟。

4.2 主要玩家

  • Google DeepMind:AlphaEvolve、AI Co-Scientist、AlphaFold 系列
  • 微软研究院:AI for Science 战略,重点在生物和材料领域
  • IIT Delhi:AILA,代表了学术界的突破
  • Argonne National Laboratory:闭环自动化实验室
  • OpenAI:发布 AI as a Scientific Collaborator 报告(2026 年 1 月),提出 AI 将成为"研究工作流编排器"

4.3 各学科的落地节奏

不同科学领域,AI 落地的节奏差异很大:

  • 数学和理论计算机科学:进展最快,AlphaEvolve 已经能发现新算法
  • 材料科学:AILA 的 AFM 实验属于这一领域,自动化进展迅速
  • 生物化学:AlphaFold 已成基础设施,自动化实验正在推进
  • 物理学:AI 作为"思想伙伴"帮助物理学家绕过计算障碍(OpenAI 报告)
  • 临床医学:监管复杂,进展相对慢,但病例分析和实验设计已开始 AI 化

五、深远影响:科学发现的民主化与加速

5.1 边际成本下降

Agentic Research(代理化科研)最大的经济学意义在于:验证想法的边际成本急剧下降

传统科研模式下,一个博士后一天可能只能做 2–3 次实验。AI Agent 可以将这个数字提升 1–2 个数量级——同样的时间内可以测试更多假设。

这带来的连锁反应:

  • 发现率上升:更多shots on target,命中正确方向的概率增加
  • 时间压缩:从假设到验证的周期从"年"压缩到"月"甚至"周"
  • 小团队崛起:小实验室也能负担高吞吐量实验,不再是资源密集型大实验室的专利

5.2 科研人才培养的新挑战

实验室自动化同时带来了人才培养方向的变化。UNC 化学系的 Dr. James Cahoon 指出了一个关键矛盾:

“机器人技术有可能把普通实验室变成加速发现的自动化工厂,但要实现这一点,我们需要创造性的解决方案,让研究人员和机器人能够在同一实验室环境中协作。”

未来的科研人员不仅需要深厚的领域知识,还需要理解 AI 和机器人技术的能力边界——「AI 协作能力」将成为科研人员的新必修课

5.3 安全与伦理考量

当 AI 开始操控真实世界的实验设备,新的风险也随之而来:

  • 生物安全:AI 独立设计基因编辑实验的风险如何管控?
  • 化学安全:AI 独立操作危险化学品的边界在哪里?
  • 军事应用:AI 发现的新算法或材料是否会被用于武器研发?
  • 科研诚信:AI 生成的假设和数据,如何建立可复现性标准?

目前,这些问题还没有系统性答案。L4 阶段的 AI 科研系统迫切需要配套的治理框架和审核机制


六、展望:2026 年 AI for Science 走向何方?

6.1 技术层面

几个值得关注的进展方向:

  • 多仪器协同:AILA 目前只操控 AFM,未来能否让一个 Agent 同时协调显微镜、光谱仪、机械臂等多个设备?
  • 自主假设生成 + 实验验证闭环:AlphaEvolve 证明 AI 能发现算法,如果将这一能力扩展到生物、化学、材料领域,并配套自动化实验平台?
  • 小样本适应:如何让 AI 科学家在数据稀缺的领域(如罕见病)也能发挥作用?

6.2 生态层面

  • AI 原生科研机构:是否会诞生第一批"AI 科学家占多数"的研究机构?
  • 科学出版标准:当实验主要由 AI 完成时,如何重新定义"署名"和"贡献"?
  • 开源 vs 闭源:AlphaFold 选择开源推动了整个行业进步,未来的 AI 科学工具会遵循同样的路径吗?

6.3 中国视角

印度 IIT Delhi 的 AILA 成果对国内科研有直接启示。AI for Science 已被列入多国战略优先级,中国在材料科学、凝聚态物理等领域有深厚积累,结合国产大模型和自动化实验平台,有望在特定垂直领域率先实现 AI 独立科研的突破。


结语

AI for Science 的故事,在 2025 年底进入了新章节。

过去我们习惯了"AI 帮助科学家更高效地做事"。以 AILA 和 AlphaEvolve 为代表的案例告诉我们:AI 的角色正在从工具变成同行者,甚至在某些任务上变成了独立执行者

这不意味着科学家会失业。恰恰相反——它意味着最宝贵的科学家人力将被释放,去做真正需要创造力、直觉和判断力的事情。AI 接管的是重复、是执行、是穷举;而人类守住的,是提出好问题。

“AI 不再只是帮你写关于科学的东西。现在,它真的能做科学了。”

这句话,或许会成为这个时代科学革命的序言。