Merge branch 'master' of https://github.com/apachecn/pytorch-doc-zh

jiangzhonglian · jiangzhonglian · commit abb15098aaae · 2024-12-05T20:06:30.000+08:00
diff --git a/docs/2.0/tutorials/beginner/basics/buildmodel_tutorial.md b/docs/2.0/tutorials/beginner/basics/buildmodel_tutorial.md
@@ -222,7 +222,7 @@ pred_probab = softmax(logits)
 print(f"Model structure: {model}\n\n")
 
 for name, param in model.named_parameters():
-    print(f"Layer: {name} | Size: {param.size()} | Values : {param[:2]} \n"
+    print(f"Layer: {name} | Size: {param.size()} | Values : {param[:2]} \n")
 ```
 
 输出:
diff --git a/docs/2.0/tutorials/beginner/basics/optimization_tutorial.md b/docs/2.0/tutorials/beginner/basics/optimization_tutorial.md
@@ -141,7 +141,7 @@ epochs = 5
 
 常见的损失函数包括给回归任务用的 `nn.MSELoss`(Mean Square Error, 均方误差)、给分类任务使用的 `nn.NLLLoss`(Negative Log Likelihood, 负对数似然)、`nn.CrossEntropyLoss`(交叉熵损失函数)结合了 `nn.LogSoftmax` 和 `nn.NLLLoss`.
 
-我们把模型输出的 logits 传递给 `nn.CrossEntropyLoss`， 它会正则化 logits 并计算预测误差。
+我们把模型输出的 logits 传递给 `nn.CrossEntropyLoss`， 它会归一化 logits 并计算预测误差。
 
 ```py
 # 初始化损失函数
@@ -212,6 +212,18 @@ def test_loop(dataloader, model, loss_fn):
 
 我们初始化了损失函数和优化器，传递给 `train_loop` 和 `test_loop`。你可以随意地修改 epochs 的数量来跟踪模型表现的进步情况。
 
+```py
+loss_fn = nn.CrossEntropyLoss()
+optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)
+
+epochs = 10
+for t in range(epochs):
+    print(f"Epoch {t+1}\n-------------------------------")
+    train_loop(train_dataloader, model, loss_fn, optimizer)
+    test_loop(test_dataloader, model, loss_fn)
+print("Done!")
+```
+
 输出:
 
 ```py
diff --git a/docs/2.0/tutorials/intermediate/custom_function_conv_bn_tutorial.md b/docs/2.0/tutorials/intermediate/custom_function_conv_bn_tutorial.md
@@ -46,53 +46,11 @@
 
 
 
+For simplicity, in this tutorial we hardcode bias=False, stride=1, padding=0, dilation=1, and groups=1 for Conv2D. For BatchNorm2D, we hardcode eps=1e-3, momentum=0.1, affine=False, and track_running_statistics=False. 
 
- 为简单起见，在本教程中我们硬编码
+ 为简单起见，在本教程中， 对于 Conv2D，我们硬编码 bias=False、 stride=1 、 padding=0 、 dilation=1 和 groups=1 。对于 BatchNorm2D，我们硬编码 eps=1e-3 、momentum=0.1 、 affine=False 和 track_running_statistics=False 。另一个小差异是我们在批量范数的计算中在平方根之外的分母中添加了epsilon。 
  
- bias=False
- 
- 、
- 
- stride=1
- 
- 、
- 
- padding=0
- 
- 、
- 
- Conv2D 的 dilation=1
- 
- 、
-and
- 
- groups=1
- 
- 。对于 BatchNorm2D，我们硬编码
- 
- eps=1e-3
- 
- 、
- 
-动量=0.1
- 
- 、
- 
- affine=False
- 
- 和
- 
- track\ \_running_statistics=False
- 
- 。另一个小差异
-是我们在批量范数的计算中
-在平方根之外的分母中添加了epsilon。
-
-
-
-
- [0]
- <https://nenadmarkus.com/p/fusing-batchnorm-and-conv/>
+ [0] <https://nenadmarkus.com/p/fusing-batchnorm-and-conv/>
 
 
 
@@ -105,7 +63,7 @@ and
 
  实现自定义函数需要我们自己实现向后的
 。在这种情况下，我们需要 Conv2D
- 和 BatchNorm2D 的后向公式。最终我们’d 在统一的
+ 和 BatchNorm2D 的后向公式。最终我们 在统一的
 后向函数中将它们链接在一起，但下面我们首先将它们实现为自己的
 自定义函数，以便我们可以单独验证它们的正确性