完整网络模型培训 (I) - III.创建网络功能

最编程 2024-10-01 07:10:53

...

创建网络模型：

sen = Sen()

搭建损失函数：

loss_fn = nn.CrossEntropyLoss()

优化器：

learning_rate = 1e-2
optimizer = torch.optim.SGD(sen.parameters(), lr=learning_rate)

优化器注释：
使用随机梯度下降（SGD）优化器
learning_rate = 1e-2 这里的1e-2代表的是：1 x （10）^(-2) = 1/100 = 0.01

记录训练的次数:

total_train_step = 0

记录测试的次数:

total_test_step = 0

训练的轮数:

epoch= 10

进行循环训练：

for i in range(epoch):
    print(f"第{i+1}轮训练开始")

    for data in train_dataloader:
        imgs, targets = data
        outputs = sen(imgs)
        loss = loss_fn(outputs, targets)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step + 1
        print(f"训练次数：{total_train_step}，Loss：{loss.item()}")

注释：
imgs, targets = data是解包数据，imgs 是输入图像，targets 是目标标签（真实值）
outputs = sen(imgs)将输入图像传入模型 ‘sen’，得到模型的预测输出 outputs
loss = loss_fn(outputs, targets)计算损失值（Loss），loss_fn 是损失函数，它比较outputs的值与targets 是目标标签（真实值）的误差
optimizer.zero_grad()清除优化器中上一次计算的梯度，以免梯度累积
loss.backward()反向传播，计算损失相对于模型参数的梯度
optimizer.step()使用优化器更新模型的参数，以最小化损失
loss.item() 将张量转换为 Python 的数值
loss.item演示：

import torch
a = torch.tensor(5)
print(a)
print(a.item())

运行结果：
在这里插入图片描述
因此可以得到：item的作用是将tensor变成真实数字5

本章节完整代码展示：

import torchvision.datasets
from torch import nn
from torch.utils.data import DataLoader

class Sen(nn.Module):
    def __init__(self):
        super(Sen, self).__init__()
        self.model = nn.Sequential(
            nn.Conv2d(3, 32, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 32, 5, 1 ,2),
            nn.MaxPool2d(2),
            nn.Conv2d(32, 64, 5, 1, 2),
            nn.MaxPool2d(2),
            nn.Flatten(),
            nn.Linear(64*4*4, 64),
            nn.Linear(64, 10)
        )
    def forward(self,x):
        x = self.model(x)
        return x
#准备数据集
#因为CIFAR10是属于PRL的数据集，所以需要转化成tensor数据集
train_data = torchvision.datasets.CIFAR10(root="./data", train=True, transform=torchvision.transforms.ToTensor(),download=True)
test_data = torchvision.datasets.CIFAR10(root="./data", train=False, transform=torchvision.transforms.ToTensor(),download=True)

#length长度
train_data_size = len(train_data)
test_data_size = len(test_data)
print(f"训练数据集的长度为{train_data_size}")
print(f"测试数据集的长度为{test_data_size}")

train_dataloader = DataLoader(train_data,batch_size=64)
test_dataloader = DataLoader(test_data,batch_size=64)

sen = Sen()

#损失函数
loss_fn = nn.CrossEntropyLoss()

#优化器
learning_rate = 1e-2
optimizer = torch.optim.SGD(sen.parameters(), lr=learning_rate)

#记录训练的次数
total_train_step = 0
#记录测试的次数
total_test_step = 0
#训练的轮数
epoch= 10

for i in range(epoch):
    print(f"第{i+1}轮训练开始")

    for data in train_dataloader:
        imgs, targets = data
        outputs = sen(imgs)
        loss = loss_fn(outputs, targets)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        total_train_step = total_train_step + 1
        print(f"训练次数：{total_train_step}，Loss：{loss.item()}")

运行结果：
在这里插入图片描述
可以看到训练的损失函数在一直进行修正。

上一篇： spring boot3.2.x vs spring boot2.7.x

下一篇：新技术浪潮下的等效评估：云计算、物联网和大数据的挑战与机遇