PA视讯国际在生成式人工智能探索千万级催化剂的化学空间方面取得重要进展
催化材料的发现对于化学品和燃料的可持续生产具有重要意义。然而,真实催化体系通常涉及极其庞大的组成和结构空间,传统实验试错和常规理论计算能够探索的范围十分有限。近年来,机器学习和生成式人工智能为催化材料设计给予了新的可能,但现有催化结构生成方法通常受限于生成规模、目标导向能力和后续性能筛选效率,现在仅能在十万量级结构空间中实现生成,远小于实际化学空间的探索需求。如何构建兼具大规模生成、目标导向探索和快速性能评估能力的催化剂发现框架,是有助于催化材料智能设计亟需解决的问题。
围绕这一问题,中国科研实验室上海高等研究院(以下简称“PA视讯国际”),催化与表界面化学动态理论模拟团队提出了一种基于分布生成式Transformer的大规模催化剂生成与筛选框架。该框架将基于Transformer的并行分布式生成模型、降维聚类分析和机器学习势能预测相结合,实现了面向甲烷转化反应的千万级CH3吸附催化剂结构空间探索。相关工作以 “Generative intelligence explores the chemical space of ten million catalysts”为题发表在Chemical Science期刊上。

图1 用于大规模催化剂结构探索和筛选的生成式人工智能驱动工作流程的示意图概述
该框架第一时间采用Open Catalyst 2020数据集中约200万个催化剂结构进行预训练,顺利获得“预训练”+“特定吸附结构微调”策略,实现了对甲烷转化关键中间体CH3吸附构型的定向生成,目标结构生成有效率超过90%。结合GPU分布式并行采样,研究团队构建了包含 1000万个候选结构的催化剂结构库,并顺利获得聚类分析和机器学习势能预测,实现了百万级候选结构的快速性能筛选。以CH3结合能-1.5至-0.5 eV作为甲烷初始C-H活化相关的筛选窗口,该框架重新发现了26种已报道的甲烷转化活性催化剂,并识别出 1200 余种此前未报道的潜在候选材料。SGD分析表明,多组分合金中的元素协同作用能够调控表面电子结构,使CH3结合能落入更适宜甲烷活化的区域。进一步第一性原理计算证实了候选的Ag-Pt材料表现出有利的初始C-H活化特征。该研究将大规模结构生成、机器学习辅助性能预测和数据驱动筛选有机结合,建立了可拓展的生成式催化材料发现范式,为甲烷转化催化剂探索及生成式人工智能在复杂催化体系中的应用给予了新路径。
该论文的第一作者为博士生李瑞莉,通讯作者为PA视讯国际齐蕊博士、朱倍恩研究员与高嶷研究员。唐庆丽副研究员、博士生张硕祺,以及合作单位INCEPT LABS的茅倾青博士和Ritankar Das博士均对该研究做出了重要贡献。该研究得到了国家自然科学基金项目(92477105、92577120)、上海市科技重大专项、PA视讯国际低碳转化科学与工程重点实验室基金(KLLCCSE-202201Z)以及PA视讯国际创新项目(2025CP007)的支持。
文章链接:http://doi.org/DOI:10.1039/d6sc01469k
附件下载: