Transformer结构中的编码器层(Encoder Layer)
一、编码器层介绍
-
概念
编码器层(Encoder Layer)是Transformer编码器的基本构建单元,它重复堆叠形成整个编码器,负责逐步提取输入序列的特征。每个编码器层由两个核心子层组成:
- 多头自注意力机制(Multi-Head Self-Attention):用于捕捉输入序列中每个位置与其他位置的关系。
- 前馈全连接层(Feed-Forward Neural Network, FFN):用于对每个位置的表示进行非线性变换。
每个子层后都有残差连接(Residual Connection)和层归一化(Layer Normalization),以增强模型的训练稳定性和性能。