|
含能化合物的设计通常需要在海量的分子中筛选出满足性能要求的分子,以减少后期合成实验的次数。如何实现海量分子的快速有效筛选,是其中的关键。我院数据与知识工程课题组杨春明副教授在与中国工程物理研究院化工材料研究所的长期合作中,采用数据驱动结合高通量计算的手段,在含能化合物的智能设计方面取得新进展,相关成果“高通量计算与深度学习相结合的稠环含能化合物设计”近日以封面文章形式发表于国内含能材料领域知名期刊《含能材料》(DOI: 10.11943/CJEM2022088)。
含能化合物的设计效率决取于多方面因素,如筛选空间中潜在高性能样本的占比和关键性能的准确预测方法。研究发现,含能分子的晶体密度与其骨架密度之间存在中度的正相关性,通过预筛选高密度分子骨架可以有效提升虚拟筛选空间的整体密度。该研究基于晶体学数据库CCDC提供的含能晶体密度数据集,采用深度学习方法获得含能晶体的密度预测模型,具有可靠的精度和泛化性。在此基础上,以稠环类含能化合物为研究对象,通过骨架预筛选获得高密度的稠环分子骨架,从而通过分子片段组装获得由潜在的高密度分子组成的虚拟筛选空间。最后采用量子化学计算和爆轰产物状态方程等方法实现了生成焓、爆轰性能和化学稳定性的预测,从而由性能排序筛选出能量水平优于RDX,稳定性优于TNT的新型含能分子6个。
高效的分子筛选需要解决2个问题:一是如何构建具有高性能潜质筛选对象,以提高分子筛选的成功率;二是如何获得精度高、泛化性好的模型以实现对性能的准确预测。在此项工作中首先预先筛选高密度分子骨架,然后经分子片段组装获得由潜在的高密度含能分子构成的虚拟筛选空间。在此基础上,基于深度学习、量子化学计算和爆轰产物状态方程等方法,预测晶体密度、生成焓、爆轰性能、BDE和撞击感度的数值,从而由性能排序完成含能分子的筛选。
虚拟筛选空间的构建由分子高密度骨架筛选和分子片段对接两步构成。首先,从收集到的已报道的含能分子中获取稠环类分子骨架数据集,然后从中筛选出具有高密度潜质的分子骨架与氨基和硝基进行片段组装,最终得到大量的待筛选分子结构组成虚拟筛选空间。
在性能预测阶段,首先采用图神经网络训练的QSPR模型预测晶体密度,然后针对晶体密度高的分子采用高通量计算平台EM-Studio预测生成焓、BDE、爆速、爆压和撞击感度,并由综合性能筛选获得含能分子候选物。
该研究工作由杨春明副教授和中国工程物理研究院化工材料研究所刘建副研究员共同指导完成,2019级计算机科学与技术专业硕士研究生王润文为论文第一作者,这是我院与化工材料研究所开展交叉学科联合培养的第三名学生。研究得到了国家自然科学基金(22175160,22105187)的资助。
论文链接: http://www.energetic-materials.org.cn/hncl/article/abstract/CJEM2022088