人大高瓴黄文炳团队在《自然- 通讯》发表论文

首页
>>新闻动态

人大高瓴黄文炳团队在《自然- 通讯》发表论文
2026-05-12

信息来源：人大高瓴人工智能学院发布日期：2026年5月11日

晶体，是材料世界的"原子建筑"。从超导体到催化剂，从铁电材料到半导体，晶体的性质由其原子的三维排列决定。然而，仅凭化学式预测晶体结构这一被称为"晶体结构预测"（Crystal Structure Prediction, CSP）的问题，自上世纪50年代提出以来始终是材料科学的一个基础性难题。如果说AlphaFold系列让蛋白质折叠问题取得了重要进展，那么晶体结构预测则仍面临更多挑战。与蛋白质不同，晶体的几何结构更为复杂：周期性边界条件、多晶型现象、旋转对称性约束……这些都让CSP成为一块难啃的"硬骨头"。

为此，中国人民大学高瓴人工智能学院黄文炳副教授团队联合南京大学、华为技术有限公司以及清华大学在《自然-通讯》(Nature Communications)发表了题为 “Siamese Foundation Models for Crystal Structure Prediction” 的文章，论文的第一作者吴黎明现为中国人民大学高瓴人工智能学院三年级博士生，导师为黄文炳副教授。论文共同通讯作者为黄文炳（人大)、任宇翔（南大）、文继荣（人大）。

该工作提出了 DAO（Diffusion-based crystAl Omni），一个面向晶体结构预测的孪生基础模型框架，在权威的晶体结构预测榜单MP-20和MPTS-52上显著超越现有最好模型，且在多晶型体系的生成任务上也表现出卓越的性能。此外，DAO在三个传统计算难以处理的真实超导体（Cr₆Os₂、Zr₁₆Rh₈O₄、Zr₁₆Pd₈O₄）上同样表现出色。对于Cr₆Os₂，DAO在20次生成中实现了与实验参考100%的匹配率，原子位置误差仅为0.0012，且每轮迭代速度比基于DFT的结构预测方法快2000倍以上。对于另外两个更大体系的超导，不仅取得了较低的原子位置误差，超导温度预测也同样精准（误差为0.26K和0.04K）。这些结果充分展示了该工作推动材料科学研究的潜力。

论文作者：吴黎明（人大）、黄文炳（人大）、矫瑞（清华）、黄剑兴（华为）、刘力维（华为）、周怡鹏（华为）、孙浩（人大）、刘洋（清华）、孙富春（清华）、任宇翔（南大）、文继荣（人大）

📄 论文链接：https://www.nature.com/articles/s41467-026-72362-3

💻 代码链接：https://github.com/GLAD-RUC/DAO

🌐 项目主页：https://glad-ruc.github.io/DAO/

一、核心问题：为什么CSP这么难？

晶体结构预测的目标是：给定化学式，直接预测其稳定的三维原子排列。这之所以困难，有三个主要原因：

1. 搜索空间巨大

原子坐标和晶格参数构成连续高维空间，且需要满足周期性约束，搜索空间随原子数增加而快速增长。

2. 几何约束严格

晶体结构必须满足O(3)旋转等变性和周期平移不变性，这对模型设计提出了特定要求。

3. 训练数据有限

近年来的深度学习方法在CSP上取得了一些进展，但受限于小数据集和模型能力，在更复杂的MPTS-52等基准上的表现仍有较大提升空间。

二、DAO框架：两个模型，一个目标

DAO的核心思想是：用两个互补的基础模型协同处理CSP。

• DAO-G（Generator）：负责从化学式生成晶体结构，基于扩散生成模型训练。

• DAO-P（Predictor）：负责预测晶体能量，辅助DAO-G进行数据优化和生成引导。

两个模型共享同一个骨干网络 Crysformer，这是一种几何图Transformer，满足晶体结构的对称性需求。

DAO框架示意图：DAO-G与DAO-P的预训练-微调流程，以及两者在数据优化与能量引导中的协同机制。

三、CrysDB：近百万级晶体预训练数据集

基础模型的效果与数据规模密切相关。团队从Materials Project和OQMD两大开源数据库中，整合构建了CrysDB: 包含约94万条稳定与不稳定晶体及其能量标注。经过严格的去重处理（避免下游测试数据泄漏），最终得到919,258条训练数据。

CrysDB的一个特点是同时包含稳定和不稳定结构：OQMD子集中71%为不稳定结构，MP子集中45%为不稳定结构。这一设计使模型能够学习更广泛的能量景观分布，而非仅局限于稳定区域。

CrysDB数据集统计：来源分布、稳定/不稳定比例、能量分布、体积分布、原子数分布及元素覆盖。

四、两阶段预训练：从"见多识广"到"精益求精"

DAO-G的预训练分两个阶段进行：

第一阶段：见多识广

在CrysDB的全部数据（含大量不稳定结构）上训练DAO-G，使其学到更广泛的晶体结构分布。同时，DAO-P也在CrysDB上进行混合监督预训练——结合扩散自监督损失和指数能量监督损失，后者在理论上被证明可以收敛到真实的中间态能量。

第二阶段：精益求精

利用DAO-P对不稳定结构进行"松弛"——计算能量梯度并使用L-BFGS优化器将高能结构推向更稳定的构型。DAO-G在松弛后的数据集上继续训练，缓解对不稳定区域的偏向。

这种"训练-松弛-再训练"的范式，将不稳定数据的丰富性与稳定结构的质量结合起来。

五、能量引导采样：引导生成趋向稳定

经过两阶段预训练后，生成过程中仍可能出现不稳定结构。为此，DAO引入了能量引导采样机制：

在DAO-G的采样过程中，DAO-P实时预测当前结构的能量，并通过梯度引导采样方向。受玻尔兹曼分布启发，这一引导等价于将原始数据分布与能量势函数加权，使低能（稳定）结构被采样的概率增大。

实验表明，能量引导使MPTS-52上的RMSE从0.0695降至0.0688，稳定性率从73.75%提升至75.05%。

六、实验结果：两大基准上取得领先匹配率

在MP-20和MPTS-52两个常用CSP基准上的实验结果：

在MP-20和MPTS-52上的实验结果

几个值得关注的发现：

预训练的价值

大规模预训练将 DAO-G 在 MP-20 数据集上的匹配率从 51.55% 提升至 65.60%。FlowMM 同样从预训练中获益显著。

Crysformer的作用

DAO-G 在几乎所有指标上均优于 DiffCSP-large。采用 Crysformer 的 FlowMM 在匹配率上也超越了 FlowMM-large。

大体系泛化

虽然 MatterGen 在 MP-20 上略占优势，但 DAO-G 在 MPTS-52 上取得了更高的匹配率（32.52% 对比 30.28%），展现出对更大原子体系的更好扩展能力。

流匹配的优势

用流匹配替代扩散模型，在 MP-20 和 MPTS-52 上分别取得了 74.17% 和 42.01% 的最佳匹配率。

此外，DAO-G在多晶型结构生成上表现较好：对于2晶型、3晶型和4晶型体系，"全部成功生成"的比例分别达到72.2%、54.5%和81.8%。

DAO-G在多晶型上的生成结果

七、真实超导体验证

团队将DAO应用于三种真实超导体: Cr₆Os₂、Zr₁₆Rh₈O₄和Zr₁₆Pd₈O₄。这三种材料在预训练和微调阶段均未出现过，可用于验证模型对真实材料的预测性能和泛化能力。

超导体验证：DAO-G预测三种真实超导体结构，DAO-P估计临界温度，与DFT方法的速度对比。

Cr₆Os₂（A15结构）

DAO-G在20次生成中实现了100%的匹配率和0.0012的RMSE。DFT计算验证，生成结构的E_hull为0.02918 eV/atom，与实验值0.02916仅差0.00002。值得注意的是，虽然预训练数据中存在不稳定的Cr₆Os₂结构，DAO-G并未简单复现它们，而是倾向于生成稳定的超导结构，这表明模型学到了对稳定结构分布的条件建模，而非单纯的记忆。

Zr₁₆Pd₈O₄（η-碳化物结构）

具有刚性Wyckoff占位和几何受挫的星四角晶格，DAO-G以0.0172的RMSE生成了结构。

Zr₁₆Rh₈O₄

仅将Pd替换为Rh导致晶格常数变化约0.5%，却使超导转变温度从2.73K升至3.73K。DAO-G捕捉到了这一细微差异，RMSE为0.0212。

在临界温度Tc预测方面，DAO-P的绝对误差分别为2.02K（Cr₆Os₂）、0.26K（Zr₁₆Rh₈O₄）和0.04K（Zr₁₆Pd₈O₄）。

与DFT的速度对比

对于Cr₆Os₂，Quantum Espresso（QE）优化器完成38次迭代需要约138分钟，而DAO-G完成1000次采样仅需1.5分钟，单次迭代速度差距超过2000倍。不过需要指出，DFT和生成模型解决的问题性质不同：DFT是物理级别的能量优化，而DAO-G是数据驱动的结构生成，两者并非完全等价的替代关系。

八、协同效应：DAO-G与DAO-P互相增益

DAO框架的一个设计特点是两个模型的协同效应：

DAO-P辅助DAO-G

通过数据松弛和能量引导采样，DAO-P使DAO-G能从不稳定数据中获益而不被其误导。

DAO-G增强DAO-P

当结构信息缺失时，DAO-G可以为DAO-P生成结构数据，增强下游属性预测。在超导体Tc预测任务中，使用DAO-G生成的结构进行数据增强，将MAE（logK）从0.761降至0.714。

此外，DAO-P在晶体属性预测任务中也展现了一定的迁移能力，在8个数据集中的4个上取得了最优结果，另外3个进入前三。

九、局限与展望

DAO展示了基础模型在晶体结构预测中的潜力，但仍存在明显局限：

大体系性能仍需提升

当前预训练数据仅包含3-30个原子的晶体，MPTS-52上的20-shot匹配率仅为46.78%，扩展至更大体系的预训练数据有望改善。

超导体案例有限

目前仅在三种超导体上进行了验证，更广泛的实验验证仍在进行中。

从预测到设计的距离

从"预测已知材料的结构"到"设计具有目标属性的新材料"，仍有本质性的跨越。

后续工作中，团队计划扩展预训练数据规模、探索更先进的生成范式，并尝试面向特定属性（如高温超导性）的材料设计。

当AI不仅能够"看见"原子世界，还能"设计"原子世界，材料科学的下一个黄金时代或许正在到来。本研究得到了国家自然科学基金、北京市"科技新星"计划、中国人民大学科研基金等支持。

友情链接

理工院系

研究机构

职能部门

校外单位

常用链接

人大高瓴黄文炳团队在 《自然- 通讯》 发表论文

人大高瓴黄文炳团队在《自然- 通讯》发表论文