🔍 为何需要神经网络工具箱？

在仅用 Autograd 和 Tensor 实现模型时，开发者需手动设置参数梯度（requires_grad=True）、反向传播（backward()）及梯度提取，过程繁琐且易出错。nn 工具箱应运而生，其核心模块 nn.Module 和 nn.functional 大幅简化网络构建流程，是高效开发的关键。

🧩 核心模块一：nn.Module

定位：神经网络层或多层网络的结构化容器。
关键特性：

1. 自动参数管理

继承 nn.Module 的自定义网络（如 class Net(nn.Module)）可自动检测学习参数（Parameter），无需手动声明梯度。

2. 预定义层优化

提供全连接层（nn.Linear）、卷积层（nn.Conv2d）、损失层（nn.CrossEntropyLoss）等高性能内置层，均经 cuDNN 深度优化，支持 GPU 加速。

3. 模块化组合

可与 nn.Sequential 无缝结合，实现层间的流水线式堆叠。

⚙️ 核心模块二：nn.functional

定位：提供函数式接口的神经网络操作（无状态，无内置参数）。
典型函数：

nn.functional.linear（全连接）
nn.functional.conv2d（卷积）
nn.functional.cross_entropy（交叉熵损失）

❗ 二者核心差异与选型建议

对比维度	nn.Xxx (e.g., nn.Linear)	nn.functional.xxx (e.g., F.linear)
使用方式	先实例化层对象，再传入输入数据	直接调用函数，需手动传入权重/偏置
参数管理	✅ 自动管理参数，支持复用	❌ 需手动定义并传递参数
状态切换	✅ 自动处理训练/测试模式（如 Dropout）	❌ 需手动实现模式切换逻辑
与 nn.Sequential 兼容性	✅ 直接支持	❌ 无法直接组合使用

📌 官方推荐场景：

优先用 nn.Xxx：
- 所有含可学习参数的层（如卷积、全连接、BatchNorm）。
可选 nn.functional.xxx：
- 无参数操作（如激活函数 F.relu、池化 F.max_pool2d）或自定义损失函数。

💎 实践总结

1. 结构化网络 → 选择 `nn.Module`

优势：参数自动追踪、模块化设计、训练/测试切换自动化。

2. 轻量级操作 → 选择 `nn.functional`

适用：简单变换或需灵活控制参数的场景（如自定义损失函数）。

示例代码片段：

# nn.Module 风格（推荐用于核心层）
class Net(nn.Module):def __init__(self):super().__init__()self.fc = nn.Linear(784, 256)  # 自动管理参数 def forward(self, x):return F.relu(self.fc(x))      # 激活函数用 functional # 训练时自动切换状态 
model.train()   # Dropout/BatchNorm 启用训练模式 
model.eval()    # 切换到测试模式