logo

【论文推荐】百度、清华 | ChemRL-GEM:用于属性预测的几何增强分子表征学习

作者:白桃酱酱2021.07.13 10:26浏览量:233

简介:文章提出了一个基于几何的图神经网络,GeoGNN,来编码分子的拓扑结构和几何信息。

【论文标题】ChemRL-GEM: Geometry Enhanced Molecular Representation Learning for Property Prediction
【作者团队】Xiaomin Fang, Lihang Liu, Jieqiong Lei, Donglong He, Shanzhuo Zhang, Jingbo Zhou, Fan Wang, Hua Wu, Haifeng Wang
【发表时间】2021/07/08
【机 构】百度、清华深圳研究院
【论文链接】https://arxiv.org/pdf/2106.06130v2.pdf

有效的分子表征学习对促进分子属性预测具有重要意义,这是药物和材料行业的一项基本任务。图神经网络的最新进展显示了将GNNs用于分子表征学习的巨大前景。此外,最近的一些研究也证明了自监督学习方法的成功应用,以预训练GNNs来克服标签分子不足的问题。然而,现有的GNNs和预训练策略通常将分子视为拓扑图数据,而没有充分利用分子的几何信息。而分子的三维空间结构,又称分子几何,是决定分子物理、化学和生物特性的最关键因素之一。为此,我们为化学表征学习(ChemRL)提出了一种新的几何增强分子表征学习方法(GEM)。首先,我们设计了一个基于几何学的GNN架构,同时对分子中的原子、键和键角进行建模。具体来说,我们为一个分子设计了两个图。第一个图编码原子-键关系;第二个图编码键-角关系。此外,在所设计的GNN架构的基础上,我们通过利用局部和整体的分子三维结构来学习空间知识,提出了几种新的几何层面的自监督学习策略。我们将ChemRL-GEM与各种最先进的基线在不同的分子基准上进行了比较,结果显示ChemRL-GEM在回归和分类任务中都能明显优于所有基线。例如,实验结果显示,在回归任务中,与SOTA基线相比,总体上平均提高了8.8%,表明了所提方法的优越性。

本文亮点:

  • 我们提出了一个基于几何的图神经网络,GeoGNN,来编码分子的拓扑结构和几何信息。
  • 除了其他自监督的学习任务外,我们还引入了多个几何层面的自监督学习任务来学习分子的三维空间知识。
  • 我们在各种分子属性预测数据集上对ChemRL-GEM进行了全面评估。实验结果表明,ChemRL-GEM在多个基准上的表现明显优于竞争方法。

73c3adbf35e44235.png
上图为原子-键图和键-角图的说明。左图显示了甲胺在三维空间的结构。我们可以借助描述原子和化学键之间关系的原子-化学键图和描述化学键和角之间关系的化学键-角图,轻松地对其几何信息进行编码。

8786eac54022c944.png

上图为几何自监督学习任务的图示,黑色圆圈代表所选原子,灰色的圆圈和线条代表相邻的被屏蔽的原子、键和
键角。自监督任务包括预测键长,键角,距离矩阵。

76ed5ef63bf37346.png

相关文章推荐

发表评论