pytorch-patterns — Skillopedia

PyTorch 开发模式构建稳健、高效和可复现深度学习应用的 PyTorch 惯用模式与最佳实践。何时使用编写新的 PyTorch 模型或训练脚本时评审深度学习代码时调试训练循环或数据管道时优化 GPU 内存使用或训练速度时设置可复现实验时核心原则 1. 设备无关代码始终编写能在 CPU 和 GPU 上运行且不硬编码设备的代码。 2. 可复现性优先设置所有随机种子以获得可复现的结果。 3. 显式形状管理始终记录并验证张量形状。模型架构模式清晰的 nn.Module 结构正确的权重初始化训练循环模式标准训练循环验证循环数据管道模式自定义数据集高效的数据加载器配置针对变长数据的自定义整理函数检查点模式保存和加载检查点性能优化混合精度训练大模型的梯度检查点使用 torch.compile 加速快速参考：PyTorch 惯用法 | 惯用法 | 描述 | |-------|-------------| | / | 训练/评估前始终设置模式 | | | 推理时禁用梯度 | | | 更高效的梯度清零 | | | 设备无关的张量/模型放置 | | | 混合精度以获得 2 倍速度 | | | 更快的 CPU→GPU 数据传输 | | | JIT 编译加速 (2.0+) | | | 安全的模型加载 | | | 可复现的实验 | | | 以计算换…