在传统的深度学习中，卷积神经网络（CNN）擅长处理网格结构数据（如图像），循环神经网络（RNN）擅长处理序列数据（如文本）。但当数据以图的形式存在时（如社交网络、分子结构、推荐系统），我们需要一种全新的架构——图神经网络（Graph Neural Network, GNN）。

文章目录

- 一、GNN核心思想：图上的信息传递
- 二、GNN三大核心流程
- - 1. 聚合（Aggregate）：收集邻居信息
  - 2. 更新（Update）：融合自身信息
  - 3. 循环（Loop）：多层信息传递
- 三、 GNN的完整计算流程
- 四、GNN的应用场景
- 五、GNN的优势与挑战
- 六、总结

一、GNN核心思想：图上的信息传递

GNN的核心思想是通过邻居节点的信息聚合来学习节点表示。与传统神经网络不同，GNN考虑了图结构中的拓扑关系，使每个节点的表示都包含其邻居信息。

二、GNN三大核心流程

1. 聚合（Aggregate）：收集邻居信息

聚合操作是GNN的第一步，也是最重要的一步。每个节点从其邻居节点收集信息，将这些信息聚合成一个单一向量。

数学表达：

$hN(v)(k)=AGGREGATE(k)({hu(k−1),∀u∈N(v)})h_{N(v)}^{(k)} = \text{AGGREGATE}^{(k)}\left(\{h_u^{(k-1)}, \forall u \in N(v)\}\right)$

其中：

$N (v)$ 表示节点 $v$ 的邻居集合
$h_u^{(k-1)}$ 是邻居节点 $u$ 在上一层的表示
$AGGREGATE\text{AGGREGATE}$ 可以是多种函数：均值、最大值、求和等

常用聚合函数：

聚合方式	公式	特点
均值聚合	$hN(v)(k)=1N(v)∑u∈N(v)hu(k−1)h_{N(v)}^{(k)} = \frac{1}{ N(v) }\sum_{u\in N(v)}h_u^{(k-1)}$	平等对待所有邻居
最大池化	$hN(v)=max⁡({hu,∀u∈N(v)})h_{N(v)} = \max(\{h_u, \forall u\in N(v)\})$	捕获最显著特征
求和聚合	$hN(v)=∑u∈N(v)huh_{N(v)} = \sum_{u\in N(v)}h_u$	保留邻居信息总量

# 伪代码示例：均值聚合
def aggregate(neighbors):total = sum(neighbor_features for neighbor in neighbors)return total / len(neighbors)

2. 更新（Update）：融合自身信息

在聚合邻居信息后，节点需要将邻居信息与自身信息结合，更新自己的状态表示。

数学表达：

$hv(k)=UPDATE(k)(hv(k−1),hN(v)(k))h_v^{(k)} = \text{UPDATE}^{(k)}\left(h_v^{(k-1)}, h_{N(v)}^{(k)}\right)$

其中：

$h_v^{(k-1)}$ 是节点 $v$ 上一层的表示
$h_{N(v)}^{(k)}$ 是当前聚合的邻居信息
$UPDATE\text{UPDATE}$ 通常是一个神经网络（如MLP）或线性变换

更新函数示例：

$hv(k)=σ(W(k)⋅CONCAT(hv(k−1),hN(v)(k)))h_v^{(k)} = \sigma\left(W^{(k)} \cdot \text{CONCAT}(h_v^{(k-1)}, h_{N(v)}^{(k)})\right)$

其中：

$W^{(k)}$ 是可学习的权重矩阵
$σ\sigma$ 是非线性激活函数（如ReLU）
$CONCAT\text{CONCAT}$ 表示向量拼接操作

# 伪代码示例：更新函数
def update(self_feature, aggregated_neighbors):combined = concatenate([self_feature, aggregated_neighbors])return relu(dense_layer(combined))

3. 循环（Loop）：多层信息传递

单层GNN只能聚合直接邻居的信息。通过堆叠多层GNN，信息可以在图中传播得更远，捕获更广泛的图结构信息。

数学表达：

$H(k)=GNNLayer(k)(H(k−1),A)H^{(k)} = \text{GNNLayer}^{(k)}(H^{(k-1)}, A)$

其中：

$H^{(k)}$ 是第 $k$ 层所有节点的表示矩阵
$A$ 是图的邻接矩阵
通常 $H^{(0)}$ 是节点的初始特征矩阵 $X$

循环过程：

graph LRH0[初始特征 H⁽⁰⁾] --> L1[GNN层1]L1 --> H1[H⁽¹⁾]H1 --> L2[GNN层2]L2 --> H2[H⁽²⁾]H2 --> L3[...]L3 --> HK[H⁽ᴷ⁾ 最终表示]

层数选择：

2-3层通常足够处理大多数任务
层数过多可能导致过度平滑（所有节点表示趋同）
层数过少则无法捕获长距离依赖

三、 GNN的完整计算流程

让我们通过一个具体例子理解三步流程：

一个完整的K层GNN可以表示为：

$hN(v)(k)=∑u∈N(v)hu(k−1)∣N(v)∣(均值聚合)hv(k)=σ(W(k)⋅[hv(k−1)∥hN(v)(k)]+b(k))(更新)hvfinal=hv(K)(经过K层循环)\begin{aligned} h_{N(v)}^{(k)} &= \sum_{u \in N(v)} \frac{h_u^{(k-1)}}{|N(v)|} \quad \text{(均值聚合)} \\ h_v^{(k)} &= \sigma\left(W^{(k)} \cdot [h_v^{(k-1)} \| h_{N(v)}^{(k)}] + b^{(k)}\right) \quad \text{(更新)} \\ h_v^{\text{final}} &= h_v^{(K)} \quad \text{(经过K层循环)} \end{aligned}$