Heterophily-Aware Representation Learning on Heterogeneous Graphs (TPAMI 2025) 计算机科学 1区 I:18.6 top期刊

在这里插入图片描述

📌 摘要

现实世界中的图结构通常非常复杂,不仅具有全局结构上的异质性,还表现出局部邻域内的强异质相似性(heterophily)。虽然越来越多的研究揭示了图神经网络(GNN)在处理同质图中异质相似性时的局限性,但在异质图中研究异质相似性的工作仍然非常有限。

为填补这一研究空白,本文基于元路径(metapaths)对异质图中的异质相似性进行了定义,并提出了两个实用的度量指标来定量描述异质相似性的程度。通过对真实异质图的实证分析,作者发现现有的异质图神经网络(HGNN)——通常继承自同质图中的GNN机制——在面对具有异质相似性或低同质性的异质图时难以泛化。

为应对这一挑战,作者提出了一种新方法 HETERO2NET,该模型是一种面向异质图中异质相似性的HGNN。它结合了 遮蔽元路径预测(masked metapath prediction)遮蔽标签预测(masked label prediction) 两项任务,能够灵活高效地处理同质性和异质性共存的图结构。

在五个具有不同异质相似性水平的真实世界异质图上进行的实验表明,HETERO2NET 在半监督节点分类任务中表现优异,超过了多种强大基线方法。特别是,该模型还能扩展至具有1300万节点和1.57亿边的工业级商业图,展示出处理大规模复杂异质图的能力。

Index Terms—Heterogeneous Graphs, Heterogeneous Graph Neural Networks, Homophily and Heterophily

1 引言

图结构在现实世界的应用中变得日益普遍,因为它们能够建模各种领域中复杂的关系和互联结构。借助这一趋势,图神经网络(GNN) 迅速发展,成为分析图结构数据的强大工具,并在众多图学习任务中达到了最先进的性能 [1]–[4]。近年来,研究人员开始积极探索 GNN 在处理异质图(heterogeneous graphs)方面的潜力。异质图也被称为异构信息网络(heterogeneous information networks),它们的特点是由多种类型的节点和边构成,每个节点或边代表不同类型的实体或关系。这种节点和边类型的多样性给异质图中的语义挖掘带来了巨大挑战——不仅要理解每种节点的语义,还要解析不同类型节点之间丰富而复杂的关系。

为应对异质性的挑战,研究者提出了大量异质图神经网络(HGNNs),用于解决与异质图相关的任务,如异质节点分类链接预测推荐系统等 [8], [9]。HGNN 是 GNN 在异质图场景下的扩展,能够联合学习图的结构信息和语义信息。HGNN 的研究大致可分为两类:

  • 一类方法通过 定义并利用元路径(meta-paths) 来建模异质结构 [5], [8], [10], [11];
  • 另一类方法则属于 无元路径范式(metapath-free paradigms),这类方法像传统 GNN 一样从节点的局部邻域中聚合信息,但引入额外的模块将节点类型和边类型等语义信息嵌入到消息传播过程中 [6], [7], [12]–[14]。

尽管 GNN 和 HGNN 已取得了显著成功,越来越多的研究文献 [15], [15]–[20] 也揭示了一个重要的局限性:常规 GNN 在处理异质相似性(heterophily)较强的图时表现较差,特别是在同质图中,当相连节点拥有不同的标签和/或属性时(即“异性相吸”原则)。虽然现有的 HGNN 在设计上继承了许多原本为同质图开发的 GNN 机制,但目前尚不清楚 HGNN 是否能够有效处理具有异质相似性的异质图——这一问题在现有文献中尚未被明确定义和深入研究

为弥补这一研究空白,本文旨在通过引入基于元路径(metapaths)的异质图中异质相似性(heterophily)定义,为该方向建立一个新的研究基础。元路径本身是异质图中一个定义良好的概念 [5], [8]。
如图 1 所示,作者指出异质图学习中面临的三大核心挑战:
在这里插入图片描述

  1. 图的异质性(heterogeneity)
  2. 标签异质相似性(label heterophily)
  3. 属性异质相似性(attribute heterophily)

在这里,异质相似性指的是:两个相同类型的节点通过元路径相连,但它们在标签或属性上存在差异

为了量化异质相似性的程度,作者提出了两个实用的度量指标:

  • 基于元路径的标签同质性(MLH):将传统的同质性比率 [16] 从同质图扩展到了异质图;
  • 基于元路径的 Dirichlet 能量(MDE):衡量局部邻域中特征的平滑性。

通过实证研究,作者发现:在 MLH 和 MDE 指标下,当前的 HGNN 模型在异质图中难以泛化到异质相似性较强(或同质性较低/中等)的场景。在这类场景下,甚至一些完全不利用图结构的模型(如多层感知机 MLP)在许多情况下都优于 HGNN,这一发现进一步凸显了现有方法的局限性。

针对上述挑战,本文提出了一种新颖的异质图神经网络模型 HETERO2NET,它具备异质相似性感知能力,能够同时应对在标签或属性层面具有 同质性(homophily)或异质性(heterophily) 的异质图。在技术上,HETERO2NET 引入了 遮蔽元路径预测(masked metapath prediction) 机制,分别学习解耦的同质性与异质性表示。这两类表示能够捕捉图中不同的属性信号,从而有助于下游任务的执行。此外,HETERO2NET 还引入了 遮蔽标签预测(masked label prediction) 策略,以增强节点之间的消息传播,特别是对于那些表现出强标签异质性的节点。这两种设计分别有助于解决属性异质性标签异质性带来的挑战。

在这里插入图片描述

我们的主要贡献如下:

  • 异质相似性度量与现有方法的局限性:我们提出了两个基于元路径的异质相似性度量指标 —— MLH(标签同质性)MDE(属性Dirichlet能量),分别用于衡量异质图中的标签异质性属性异质性。通过实证研究,我们揭示了现有 HGNN 在处理具有异质相似性的异质图时的显著局限性,而这一问题在现有文献中长期被忽视,其根本原因是缺乏明确的异质性度量方法

  • 面向异质相似性的全新模型:基于上述挑战,我们提出了 HETERO2NET —— 一个新颖的、具有异质相似性感知能力的 HGNN。该模型通过引入解耦的遮蔽图预测任务遮蔽标签预测任务,能够灵活高效地处理同质性异质性共存的异质图(其技术细节如图 2 所示)。

  • 大规模实证验证:我们在五个真实世界的异质图数据集上进行了实验评估,包括一个包含 1300 万节点1.57 亿边的工业级商业图。实验结果表明,HETERO2NET 在半监督节点分类任务中表现优越,在性能和可扩展性方面均优于多种强基线方法

论文结构安排:

本文其余部分的结构安排如下:

  • 第 2 部分 回顾了与本研究相关的已有工作;
  • 第 3 部分 介绍了基本符号和必要的预备知识;
  • 第 4 部分 提出了两个基于元路径的异质相似性度量指标,并进行了关于不同异质性水平异质图的实证研究;
  • 第 5 部分 详细介绍了我们提出的 HETERO2NET 框架,包括解耦的遮蔽元路径预测遮蔽标签预测两项关键技术;
  • 第 6 部分 展示了实验结果;
  • 最后,第 7 部分 总结了全文,并展望了异质图学习在更广泛场景中的未来研究方向。

2 相关工作

本节回顾与本研究密切相关的文献,主要包括以下两个方面的研究进展:

  • 异质图神经网络(Heterogeneous Graph Neural Networks, HGNNs)
  • 在异质相似性图上进行的图表示学习(Graph Representation Learning over Heterophilic Graphs)

2.1 异质图神经网络(Heterogeneous Graph Neural Networks, HGNNs)

近年来,为了满足对高效建模各种异质图日益增长的需求,出现了大量关于 HGNN 的研究工作 [24]。
根据处理图中语义信息的方式不同,HGNN 大致可以分为两类:基于元路径的方法非元路径的方法

  • 基于元路径的 HGNN 通过手工设计或自动选择的元路径进行邻居特征的传播与聚合。
    例如:
    • Metapath2Vec [8] 使用元路径引导的随机游走,捕捉异质节点之间的语义信息;
    • GTN [25] 为不同元路径分配可学习的权重,从而自动学习有用的元路径;
    • HAN [5] 引入层次注意力机制,分别建模节点层级和语义层级的结构;
    • 作为后续工作,MAGNN [11] 在 HAN 的基础上引入了元路径聚合机制,以从多个元路径中学习语义信息。

非元路径的 HGNN 方法将传统 GNN 中的消息传递与聚合机制扩展到异质图上,无需手动设计有意义的元路径

例如:

  • RGCN [12] 及其后续工作 RGAT [26] 提出针对每种边类型提取关系特定的模式,然后将不同语义信息进行融合;
  • SHGN [7] 引入了多层图注意力网络,并在边注意力机制中加入可学习的边类型嵌入;
  • HGSL [27] 通过挖掘复杂交互关系,联合学习异质图结构和 GNN 参数;
  • 受到 Transformer [28] 成功经验的启发,HGT [6] 和 HINormer [22] 将自注意力机制引入图结构的消息传递中,用于建模异质节点之间的结构依赖关系。

2.2 异质相似性图上的学习

异质相似性图(heterophilic graphs)是指:相连节点更可能具有不同的属性或标签。近年来,这一类图结构受到了研究界越来越多的关注 [15], [15]–[20]。异质相似性问题为图分析与建模带来了独特挑战。

  • Pei 等人 [16] 首次关注到这一现象,并提出了一种度量图的同质性水平的指标;
  • Zhu 等人 [15] 随后深入研究了 GNN 在异质或非同质图上性能下降的问题,并提出了 H2GCN,以在存在异质相似性的情况下改进图结构的学习;
  • CPGNN [17] 通过引入兼容性矩阵(compatibility matrix),将 GNN 泛化为同时支持同质性与异质性的图
  • FAGCN [18] 在消息传递过程中引入了一种自适应整合机制可动态融合低频与高频信号
  • LINKX [15] 关注如何将 GNN 扩展到大规模异质图,通过 MLP 学习和融合特征矩阵与邻接矩阵的信息;
  • Luan 等人 [23] 从后聚合节点相似性的角度分析异质性,并提出了一种多通道混合机制,以提取丰富的本地信息,适应不同形式的节点异质相似性。

然而,大多数现有研究仍集中于同质图,对于异质图中的异质相似性问题尚缺乏深入探索。随着异质图在各类应用中的日益普及,开发能够有效处理异质相似性并应对其带来挑战的方法变得愈发重要。近期也有一些并行工作的研究开始关注在异质相似性环境下进行异质图学习 [30]–[33]。然而,这些方法普遍缺乏系统性的异质性量化指标,也缺少一个合理的框架来区分基于属性的异质性与基于标签的异质性,这正是促使我们开展本研究的动因。

3 预备知识(PRELIMINARY)

在本节中,我们将介绍与异质图相关的基本概念和符号表示,同时引入用于衡量图的同质性/异质性的度量指标。论文中经常使用的符号已在表 1中进行了汇总。
在这里插入图片描述

3.1 异质图(Heterogeneous Graphs)

一个异质图或称为异构信息网络,定义为:G={ V,E,A,R,φ,ψ}G = \{V, E, A, R, \varphi, \psi\}G={ V,E,A,R,φ,ψ} 其中,VVVEEE 分别表示节点集合和边集合。

该图还包括:

  • 一个节点类型映射函数 φ:V→A\varphi : V \rightarrow Aφ:VA,用于将每个节点映射为其对应的类型;
  • 一个边类型映射函数 ψ:E→R\psi : E \rightarrow Rψ:ER,用于将每条边映射为其对应的关系类型(边类型);
  • 其中,AAA 表示所有可能的节点类型集合RRR 表示所有可能的关系类型集合,并且满足 ∣A∣+∣R∣>2|A| + |R| > 2A+R>2。当 ∣A∣=∣R∣=1|A| = |R| = 1A=R=1 时,图 GGG 就退化为一个同质图

在大多数情况下,图 GGG 是具备属性的,即每个节点 u∈Vu \in VuV 都关联一个 ddd-维的属性向量 xu∈Rdx_u \in \mathbb{R}^dxuRd
在节点分类任务中,某些节点类型或特定的节点还会被分配一个类别标签 yyy。然而,在异质图中:

  • 并非所有节点类型都具备标签
  • 即使是带标签的节点类型,其内部通常也只有部分节点拥有标注信息。

3.2 异质图中的元路径(Metapath)

元路径(Metapath)
长度为 nnn 的元路径记作:P≜A1→R1A2→R2⋯→RnAn+1P \triangleq A_1 \xrightarrow{R_1} A_2 \xrightarrow{R_2} \cdots \xrightarrow{R_n} A_{n+1}PA1R1 A2R2 Rn An+1

简记为 A1A2⋯An+1A_1 A_2 \cdots A_{n+1}A1A2An+1,其中:

  • Ai∈AA_i \in AAiA 表示节点类型,
  • <

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/95361.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/95361.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/95361.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机视觉(7)-纯视觉方案实现端到端轨迹规划(思路梳理)

基于纯视觉方案实现端到端轨迹规划&#xff0c;需融合开源模型、自有数据及系统工程优化。以下提供一套从模型选型到部署落地的完整方案&#xff0c;结合前沿开源技术与工业实践&#xff1a; 一、开源模型选型与组合策略 1. 感知-预测一体化模型 ViP3D&#xff08;清华&#…

Nginx 屏蔽服务器名称与版本信息(源码级修改)

Nginx 屏蔽服务器名称与版本信息&#xff08;源码级修改&#xff09; 一、背景与目的 在生产环境部署 Nginx 时&#xff0c;默认配置会在 Server 响应头中暴露服务类型&#xff08;如 nginx&#xff09;和版本号&#xff08;如 nginx/1.25.4&#xff09;。这些信息可能被攻击者…

从钢板内部应力视角,重新认识护栏板矫平机

一、为什么钢板会“自带波浪”&#xff1f; 钢卷在热轧后冷却、卷取、长途运输、多次吊运时&#xff0c;不同部位受到的温度、张力、碰撞并不一致&#xff0c;内部会产生不均匀的残余应力。应力大的区域想“伸长”&#xff0c;应力小的区域想“缩短”&#xff0c;宏观上就表现为…

C++中的`auto`与`std::any`:功能、区别与选择建议

引言 在C编程中&#xff0c;auto和std::any是两个功能强大但用途不同的工具。理解它们的区别和适用场景对于编写高效、可维护的代码至关重要。本文将详细介绍auto和std::any的基本概念、使用方法、适用场景以及它们之间的区别&#xff0c;并提供选择建议&#xff0c;帮助开发者…

【Linux】进程(Process)

一、什么是进程二、进程的创建三、进程的状态四、僵尸进程五、孤儿进程六、进程的优先级 以及 并发/并行七、进程的切换一、什么是进程&#xff1f;什么是进程呢(一)?官方话来说&#xff1a;进程是一个执行实例、正在执行的程序、是系统资源分配的基本单位按课本官方话可能有一…

销售管理系统哪个好?14款软件深度对比

本文将深入对比14款销售管理系统&#xff1a;1.纷享销客&#xff1b; 2.Zoho CRM&#xff1b; 3.神州云动 CRM&#xff1b; 4.励销云 CRM&#xff1b; 5.Microsoft Dynamics 365 CRM&#xff1b; 6.悟空 CRM&#xff1b; 7.泛微 CRM&#xff1b; 8.HubSpot CRM&#xff1b; 9.…

如何从 0 到 1 开发企业级 AI 应用:步骤、框架与技巧

本文来自作者 莫尔索 的 企业级 AI 应用开发与最佳实践指南&#xff0c; 欢迎阅读原文。 大家好&#xff0c;我之前出版的《LangChain 编程&#xff1a;从入门到实践》一书获得了良好的市场反响和读者认可。近期推出了第二版&#xff0c;我对内容进行了大幅更新&#xff1a;近 …

【LLM】Openai之gpt-oss模型和GPT5模型

note gpt-oss模型代理能力&#xff1a;使用模型的原生功能进行函数调用、网页浏览&#xff08;https://github.com/openai/gpt-oss/tree/main?tabreadme-ov-file#browser&#xff09;、Python 代码执行&#xff08;https://github.com/openai/gpt-oss/tree/main?tabreadme-o…

Ubuntu 20.04 虚拟机安装完整教程:从 VMware 到 VMware Tools

目录 一、VMware的安装 1. 资源获取 1. 网盘提取 2. VMware官网&#xff0c;选择自己合适的版本&#xff0c;我下载的是16.2版本 2.安装步骤 二、Ubuntu的安装 1. Ubuntu 镜像文件官网下载 2. Ubuntu的安装步骤 第一步&#xff1a;打开刚刚安装好的VMware16.2.0&#…

【DL】最优化理论和深度学习

最优化理论是计算机科学中一个重要的概念&#xff0c;它用于帮助我们找到最优解&#xff08;即最小或最大值&#xff09;的算法。在深度学习中&#xff0c;最优化理论用于帮助深度学习模型找到最优解。训练误差&#xff08;Training Error&#xff09;&#xff1a;指模型在训练…

商品分类拖拽排序设计

商品分类、菜单项以及其他需要排序的元素常常会用到拖拽排序功能。这个看似简单的交互背后&#xff0c;其实涉及到一系列复杂的后端逻辑处理&#xff0c;尤其是在如何高效地更新数据库记录方面。本文将探讨两种常见的实现方案&#xff0c;并分析各自的优缺点&#xff0c;帮助你…

ROS机器人云实践设计申报书-草稿

ROS机器人云实践作品申报书 ROS机器人云实践设计一、项目基本信息 项目名称&#xff1a;基于ROS的移动机器人云实践平台设计与应用 申报单位&#xff1a;[具体单位名称] 项目负责人&#xff1a;[具体参与人员] 申报日期&#xff1a;[填写日期] 二、项目背景与目标 项目背景&…

Jira 根据问题类型 为 描述 字段添加默认值

背景: jira 8.16 想要为问题类型为 需求 的问题默认增加描述字段默认值 想都没想直接根据之前添加缺陷类型时描述默认值的方式去添加(系统字段--描述--上下文和默认值--添加上下文), 结果不随我愿, 系统默认的这个功能不能根据问题类型切换而切换不同的默认值, 只能设置 1 个…

深度学习(5):激活函数

ss激活函数的作用是在隐藏层引入非线性&#xff0c;使得神经网络能够学习和表示复杂的函数关系&#xff0c;使网络具备非线性能力&#xff0c;增强其表达能力。一、常见激活函数1、sigmoid激活函数的作用是在隐藏层引入非线性&#xff0c;使得神经网络能够学习和表示复杂的函数…

洛谷 小 Y 拼木棒 贪心

题目背景上道题中&#xff0c;小 Y 斩了一地的木棒&#xff0c;现在她想要将木棒拼起来。题目描述有 n 根木棒&#xff0c;现在从中选 4 根&#xff0c;想要组成一个正三角形&#xff0c;问有几种选法&#xff1f;答案对 1097 取模。输入格式第一行一个整数 n。第二行往下 n 行…

飞算JavaAI的“盾牌”计划:手撕Spring Security + JWT认证链

一、飞算JavaAI&#xff1a;智能时代Java开发的“全能引擎” 1.1 飞算JavaAI&#xff1a;重新定义Java安全开发的“技术革命”在数字化浪潮席卷全球的今天&#xff0c;Java作为企业级应用开发的首选语言&#xff0c;其安全性需求随着业务复杂度的提升而呈指数级增长——从用户认…

大语言模型提示工程与应用:大语言模型进阶提示工程技术

高级提示词使用 学习目标 掌握大语言模型中进阶提示工程技术的原理与应用&#xff0c;包括零样本/少样本提示、思维链推理、知识生成等核心方法&#xff0c;提升复杂任务解决能力。 相关知识点 零样本与少样本提示思维链提示技术高级推理技术 学习内容 1 零样本与少样本提…

【从零开始java学习|第五篇】项目、模块、包、类的概念与联系

目录 一、概念与作用&#xff1a;从宏观到微观的层级拆分 1. 项目&#xff08;Project&#xff09;&#xff1a;最外层的 "大容器" 2. 模块&#xff08;Module&#xff09;&#xff1a;项目的 "功能子单元" 3. 包&#xff08;Package&#xff09;&…

kernel pwn 入门(四) ret2dir详细

介绍 ret2dir 是哥伦比亚大学网络安全实验室在 2014 年提出的一种辅助攻击手法&#xff0c;主要用来绕过 smep、smap、pxn 等用户空间与内核空间隔离的防护手段&#xff0c; 原论文见此处&#xff1a; ret2dir原文论文 参考&#xff1a;kernel pwn入门到大神 ret2dir ret2di…

n阶常系数齐次线性微分方程的含义

微分方程 (Differential Equation): 含义&#xff1a; 包含未知函数及其导数&#xff08;或微分&#xff09;的方程。例子&#xff1a; dy/dx 2x&#xff08;未知函数是 y(x)&#xff0c;导数是 dy/dx&#xff09;, dy/dt 2 dy/dt y 0&#xff08;未知函数是 y(t)&#xff…