自动化知识图谱表示学习从三元组到子图的核心要点如下:知识表示学习的目标:将知识图谱中的实体与关系映射到低维向量空间,以连续的向量形式保留符号信息,便于后续应用。整体框架:定义打分函数:用于评估知识图谱中三元组或子图的合理性。负样本设计:生成不合理的三元组或子图作为负样本,用于训练模型。损失函数设定:根据打分函数和负样本设计,设定损失函数以优化模型。正则化:用于平衡模型的表达能力和复杂度,减少过拟合。模型优化:通过循环迭代优化损失函数,更新embedding和模型参数。模型设计策略:三元组策略:针对关系建模,直接处理三元组信息。路径策略:通过路径表示捕捉实体间的复杂关系。子图策略:利用子图结构学习全局信息,特别是基于子图的图神经网络模型,如REDGNN,展现出强大能力。自动化机器学习的应用:整合搜索空间与目标,实现Bilevel优化,有效降低复杂度与提升性能。通过算法如KGTuner实现高效搜索与优化超参数。AutoSF与AutoSF+等算法针对relation矩阵搜索,通过渐进式与遗传算法优化搜索效率。实验结果与未来方向:双线性模型在链接预测任务中表现优异。Interstellar模型结合神经网络结构搜索与AutoML方法,实现高效与准确的模型搜索。未来研究方向包括通过AutoML优化模型结构,探索子图学习等潜力领域。



































