AI for Science：从「辅助写作」到「亲自做实验」的范式跃迁

2026 年 3 月，一条来自 IIT Delhi 的新闻在学术圈刷屏：一台 AI Agent 将原本需要一整天优化的显微镜参数，在 7–10 分钟内全部搞定。

这不是在吹牛——论文发表在 Nature Communications，作者是印度理工学院的博士生 Indrajeet Mandal。他的原话是：“AILA 大幅加速了我的研究进展。”

真正有意思的是 Professor N. M. Anoop Krishnan 的那句总结：

“以前，AI 只能帮你写关于科学的东西。现在，AI 真的能做科学了——设计实验、操作真实设备、收集数据、解读结果。”

从「AI 辅助科研」到「AI 独立科研」，这个转变的信号比大多数人意识到的要强烈得多。本文深入解析这场真实发生的范式跃迁。

一、范式转移：从「科学家写报告」到「AI 做实验」

1.1 传统 AI for Science 的边界

过去几年，AI 在科研领域的应用主要集中在数字层面：

文献综述：用 LLM 快速梳理海量论文
数据挖掘：从实验数据中寻找统计规律
论文撰写：辅助起草、润色科研文档
AlphaFold：预测蛋白质结构，大幅加速结构生物学

这些工具本质上是增强人类科学家的认知效率——AI 做苦力，科学家做判断。

但 2025 年底出现的几个案例，开始触及一个更根本的问题：如果 AI 不仅能处理数据，还能操控真实世界的仪器呢？

1.2 三个标志性的临界点

临界点一：AILA（2025 年 12 月）

IIT Delhi 与丹麦、德国团队联合发布 AILA（Artificially Intelligent Lab Assistant），这是首个能独立操作真实科学仪器完成端到端实验的 AI Agent。

它的实验对象是一台原子力显微镜（AFM）——一种用于纳米级材料表征的高精度仪器。操作 AFM 需要多年的物理学和仪器学训练，传统上即使是资深研究员，也需要数小时才能优化出高质量成像参数。

AILA 的工作流程：

观察：实时读取 AFM 软件输出的原始图像和测量数据
决策：判断当前参数是否最优，决定是否调整
执行：向显微镜发送指令，调整力度、速度、分辨率等参数
迭代：重复上述循环，直到获得高质量结果

全程无需人类干预。7–10 分钟完成过去一整天的工作。论文发表于 Nature Communications。

临界点二：AlphaEvolve（2025 年 5 月）

Google DeepMind 发布 AlphaEvolve，这是一个基于 Gemini 大模型的算法发现 Agent。它的工作方式本质上和 AILA 一致——观察→决策→执行→迭代——只是实验对象从显微镜变成了代码。

最惊人的成果：AlphaEvolve 发现了一个 4×4 复数矩阵乘法算法，使用 48 次标量乘法，打破了 Strassen 在 1969 年创下的纪录（51 次）。这个纪录保持了 56 年。

此外，AlphaEvolve 还帮助 Google 优化了数据中心调度、芯片设计、以及 AI 训练流程本身——平均回收了全球计算资源的 0.7%。

临界点三：AI Co-Scientist（2025 年 2 月）

Google 在 2025 年 2 月发布 AI Co-Scientist 系统，旨在让 AI 充当科学家的研究合作伙伴，而不仅仅是工具。它能：

读取和消化大量文献，确定已知边界
将想法翻译成数学和代码
搭建分析和仿真环境
自动检查计算正确性
搜索庞大的设计空间，决定下一步实验方向

微软研究院的报告则指出了一个更明确的时间节点：2026 年，AI 不再只是总结报告，而是能生成自己的假设，并控制运行真实科学实验的应用程序。

二、AILA 深度解析：它是怎么做到的？

2.1 系统架构

AILA 的核心技术挑战在于将 AI 决策系统与真实物理仪器打通。

AFM 显微镜连接着一台运行控制软件的计算机。软件实时显示原始图像和测量数据。AILA 的 Agent 框架读取这些数据输出，判断参数设置是否合适，然后向显微镜发送新的控制指令。

整个过程模拟了人类实验科学家的决策模式：

观察（看到图像质量）
→ 评估（判断是否需要调整参数）
→ 决策（调整什么参数）
→ 执行（发送指令）
→ 验证（再次观察结果）
→ 循环直到满意

2.2 为什么是 AFM？

选择 AFM 绝非偶然。AFM 是材料科学、纳米技术领域的核心表征工具，但其操作复杂性也是出了名的高：

需要理解纳米级物理学
涉及复杂的表面交互作用
实时反馈控制要求极高
参数空间庞大（探针力度、扫描速度、分辨率设置等）

AFM 被业界视为验证 AI 能否真正操控精密仪器的"试金石"。如果 AI 能搞定 AFM，操作其他实验室仪器（电子显微镜、光谱仪、3D 打印机等）的路径就打开了。

2.3 实际效益

对于科研人员而言，AILA 的价值不只是速度：

7×24 运行：AI 不疲劳，可以通宵运行，人类科学家第二天早上直接看结果
降低门槛：发展中国家和小型实验室通常缺乏熟练操作 AFM 的人员，AILA 可以弥补这一差距
加速迭代：实验优化周期从"天"压缩到"分钟"，同样的时间内可以测试更多假设

三、AlphaEvolve：会编程的 AI 科学家

3.1 工作原理

AlphaEvolve 的核心是一个大模型 + 进化算法的混合系统：

提示 Gemini 2.0 Flash：给定一个问题描述和可选的提示（如已有解法）
生成候选代码：让模型生成多段解决该问题的代码
评估器（Evaluator）：用预先定义的"ground truth"测试每段代码的表现
进化选择：表现更好的代码进入下一代，被 LLM “morph”（变形）生成变体
迭代：重复上述过程，直到收敛到最优解

关键创新在于评估器的设计——将问题转化为可客观测量的指标（运行时间、精度、输出正确性），使进化过程有了"方向"。

3.2 已验证的成果

矩阵乘法：4×4 复数矩阵，48 次乘法（vs Strassen 的 51 次）
数据中心调度：全球平均提升 0.7% 计算资源利用率
芯片设计：优化了 TPU 布局的关键算法
数学问题：在 50+ 开放问题上测试，约 75% 的情况下重现了当前最优解

第 75% 这个数字值得玩味：它意味着 AlphaEvolve 至少不弱于现有最佳人类解法，同时在约 25% 的问题上有新发现。

四、AI for Science 的全局图景

4.1 从辅助到独立的演进路径

AI for Science 可以分为四个阶段：

阶段	描述	代表案例
L1: 数据处理	AI 帮助处理实验数据、统计分析	传统机器学习工具
L2: 认知增强	AI 帮助读文献、写报告、做文献综述	ChatGPT for research
L3: 实验执行	AI 操控仪器，独立完成实验	AILA
L4: 假设生成	AI 自主提出科学假设并设计验证实验	AlphaEvolve、AI Co-Scientist

当前（2026 年初），行业整体处于 L2 向 L3 过渡的阶段。L4 的案例（AlphaEvolve）仍然依赖于精心设计的评估器，大规模独立提出原创性科学假设的能力尚不成熟。

4.2 主要玩家

Google DeepMind：AlphaEvolve、AI Co-Scientist、AlphaFold 系列
微软研究院：AI for Science 战略，重点在生物和材料领域
IIT Delhi：AILA，代表了学术界的突破
Argonne National Laboratory：闭环自动化实验室
OpenAI：发布 AI as a Scientific Collaborator 报告（2026 年 1 月），提出 AI 将成为"研究工作流编排器"

4.3 各学科的落地节奏

不同科学领域，AI 落地的节奏差异很大：

数学和理论计算机科学：进展最快，AlphaEvolve 已经能发现新算法
材料科学：AILA 的 AFM 实验属于这一领域，自动化进展迅速
生物化学：AlphaFold 已成基础设施，自动化实验正在推进
物理学：AI 作为"思想伙伴"帮助物理学家绕过计算障碍（OpenAI 报告）
临床医学：监管复杂，进展相对慢，但病例分析和实验设计已开始 AI 化

五、深远影响：科学发现的民主化与加速

5.1 边际成本下降

Agentic Research（代理化科研）最大的经济学意义在于：验证想法的边际成本急剧下降。

传统科研模式下，一个博士后一天可能只能做 2–3 次实验。AI Agent 可以将这个数字提升 1–2 个数量级——同样的时间内可以测试更多假设。

这带来的连锁反应：

发现率上升：更多shots on target，命中正确方向的概率增加
时间压缩：从假设到验证的周期从"年"压缩到"月"甚至"周"
小团队崛起：小实验室也能负担高吞吐量实验，不再是资源密集型大实验室的专利

5.2 科研人才培养的新挑战

实验室自动化同时带来了人才培养方向的变化。UNC 化学系的 Dr. James Cahoon 指出了一个关键矛盾：

“机器人技术有可能把普通实验室变成加速发现的自动化工厂，但要实现这一点，我们需要创造性的解决方案，让研究人员和机器人能够在同一实验室环境中协作。”

未来的科研人员不仅需要深厚的领域知识，还需要理解 AI 和机器人技术的能力边界——「AI 协作能力」将成为科研人员的新必修课。

5.3 安全与伦理考量

当 AI 开始操控真实世界的实验设备，新的风险也随之而来：

生物安全：AI 独立设计基因编辑实验的风险如何管控？
化学安全：AI 独立操作危险化学品的边界在哪里？
军事应用：AI 发现的新算法或材料是否会被用于武器研发？
科研诚信：AI 生成的假设和数据，如何建立可复现性标准？

目前，这些问题还没有系统性答案。L4 阶段的 AI 科研系统迫切需要配套的治理框架和审核机制。

六、展望：2026 年 AI for Science 走向何方？

6.1 技术层面

几个值得关注的进展方向：

多仪器协同：AILA 目前只操控 AFM，未来能否让一个 Agent 同时协调显微镜、光谱仪、机械臂等多个设备？
自主假设生成 + 实验验证闭环：AlphaEvolve 证明 AI 能发现算法，如果将这一能力扩展到生物、化学、材料领域，并配套自动化实验平台？
小样本适应：如何让 AI 科学家在数据稀缺的领域（如罕见病）也能发挥作用？

6.2 生态层面

AI 原生科研机构：是否会诞生第一批"AI 科学家占多数"的研究机构？
科学出版标准：当实验主要由 AI 完成时，如何重新定义"署名"和"贡献"？
开源 vs 闭源：AlphaFold 选择开源推动了整个行业进步，未来的 AI 科学工具会遵循同样的路径吗？

6.3 中国视角

印度 IIT Delhi 的 AILA 成果对国内科研有直接启示。AI for Science 已被列入多国战略优先级，中国在材料科学、凝聚态物理等领域有深厚积累，结合国产大模型和自动化实验平台，有望在特定垂直领域率先实现 AI 独立科研的突破。

结语

AI for Science 的故事，在 2025 年底进入了新章节。

过去我们习惯了"AI 帮助科学家更高效地做事"。以 AILA 和 AlphaEvolve 为代表的案例告诉我们：AI 的角色正在从工具变成同行者，甚至在某些任务上变成了独立执行者。

这不意味着科学家会失业。恰恰相反——它意味着最宝贵的科学家人力将被释放，去做真正需要创造力、直觉和判断力的事情。AI 接管的是重复、是执行、是穷举；而人类守住的，是提出好问题。

“AI 不再只是帮你写关于科学的东西。现在，它真的能做科学了。”

这句话，或许会成为这个时代科学革命的序言。

一、范式转移：从「科学家写报告」到「AI 做实验」#

1.1 传统 AI for Science 的边界#

1.2 三个标志性的临界点#

二、AILA 深度解析：它是怎么做到的？#

2.1 系统架构#

2.2 为什么是 AFM？#

2.3 实际效益#

三、AlphaEvolve：会编程的 AI 科学家#

3.1 工作原理#

3.2 已验证的成果#

四、AI for Science 的全局图景#

4.1 从辅助到独立的演进路径#

4.2 主要玩家#

4.3 各学科的落地节奏#

五、深远影响：科学发现的民主化与加速#

5.1 边际成本下降#

5.2 科研人才培养的新挑战#

5.3 安全与伦理考量#

六、展望：2026 年 AI for Science 走向何方？#

6.1 技术层面#

6.2 生态层面#

6.3 中国视角#

结语#