Pytorch 基于LeNet的手写数字识别
创始人
2024-04-03 12:42:32
0

Pytorch 基于LeNet的手写数字识别

  • 介绍
  • 1.导入相关库
  • 2.定义 LeNet-5 网络结构
  • 3.下载并配置数据集和加载器
  • 4.定义损失函数和优化器
  • 5.定义训练函数并训练和保存模型
  • 6.可视化展示
  • 7.预测图
  • 8.加载现有模型(可选)

介绍

使用到的库:

  • Pytorch
  • matplotlib

安装:

pip install matplotlib

Pytorch 环境配置请自行百度。

数据集:
使用 MNIST 数据集(Mixed National Institute of Standards and Technology database)。是美国国家标准与技术研究院收集整理的大型手写数字数据库,包含60,000个示例的训练集以及10,000个示例的测试集。
MNIST

下载地址:
http://yann.lecun.com/exdb/mnist/
本文使用 Pytorch 自动下载。

LeNet 是由 Yann Lecun 提出的一种经典的卷积神经网络,是现代卷积神经网络的起源之一。本文使用的 LeNetLeNet-5。结构图如下:
LeNet-5


1.导入相关库

import torch
from torch import nn
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt

2.定义 LeNet-5 网络结构

# reshape输入为28*28的图像
class Reshape(nn.Module):def forward(self, x):return x.view(-1, 1, 28, 28)# 定义网络
net = nn.Sequential(Reshape(), nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),nn.AvgPool2d(kernel_size=2, stride=2),nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),nn.AvgPool2d(kernel_size=2, stride=2),nn.Flatten(),nn.Linear(16*5*5, 120), nn.Sigmoid(),nn.Linear(120, 84), nn.Sigmoid(),nn.Linear(84, 10))

3.下载并配置数据集和加载器

# 下载并配置数据集
train_dataset = datasets.MNIST(root='./dataset', train=True,transform=transforms.ToTensor(), download=True)
test_dataset = datasets.MNIST(root='./dataset', train=False,transform=transforms.ToTensor(), download=True)# 配置数据加载器
batch_size = 64
train_loader = DataLoader(dataset=train_dataset,batch_size=batch_size, shuffle=True)
test_loader = DataLoader(dataset=test_dataset,batch_size=batch_size, shuffle=True)

4.定义损失函数和优化器

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(net.parameters())

5.定义训练函数并训练和保存模型

def train(epochs):# 训练模型for epoch in range(epochs):for i, (images, labels) in enumerate(train_loader):outputs = net(images)loss = criterion(outputs, labels)optimizer.zero_grad()loss.backward()optimizer.step()if i % 50 == 0:print(f'Epoch: {epoch + 1}, Step: {i + 1}, Loss: {loss.item():.4f}')correct = 0total = 0for images, labels in test_loader:outputs = net(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)correct += (predicted == labels).sum().item()print(f'Accuracy: {correct / total * 100:.2f}%')# 保存模型torch.save(net.state_dict(),f"./model/LeNet_Epoch{epochs}_Accuracy{correct / total * 100:.2f}%.pth") train(epochs=5)

6.可视化展示

def show_predict():# 预测结果图像可视化loader = DataLoader(dataset=test_dataset, batch_size=1, shuffle=True)plt.figure(figsize=(8, 8))for i in range(9):(images, labels) = next(iter(loader))outputs = net(images)_, predicted = torch.max(outputs.data, 1)title = f"Predicted: {predicted[0]}, True: {labels[0]}"plt.subplot(3, 3, i + 1)plt.imshow(images[0].squeeze(), cmap="gray")plt.title(title)plt.xticks([])plt.yticks([])plt.show()show_predict()

7.预测图

结果来自训练轮数epochs=10,准确率Accuracy=98.42%的模型:
预测图1

包含错误预测的结果:
预测图2


8.加载现有模型(可选)

本文的训练函数会保存每次训练的模型,下一次预测可以不调用训练函数,而是直接加载已经保存的模型来进行预测:

# 加载保存的模型
net.load_state_dict(torch.load("./model/LeNet_Epoch10_Accuracy98.42%.pth"))

请根据自己的情况修改路径。

相关内容

热门资讯

不能访问光猫的的管理页面 光猫是现代家庭宽带网络的重要组成部分,它可以提供高速稳定的网络连接。但是,有时候我们会遇到不能访问光...
【NI Multisim 14...   目录 序言 一、工具栏 🍊1.“标准”工具栏 🍊 2.视图工具...
Android|无法访问或保存... 这个问题可能是由于权限设置不正确导致的。您需要在应用程序清单文件中添加以下代码来请求适当的权限:此外...
银河麒麟V10SP1高级服务器... 银河麒麟高级服务器操作系统简介: 银河麒麟高级服务器操作系统V10是针对企业级关键业务...
北信源内网安全管理卸载 北信源内网安全管理是一款网络安全管理软件,主要用于保护内网安全。在日常使用过程中,卸载该软件是一种常...
安卓文字转语音tts没有声音 安卓文字转语音TTS没有声音的问题在应用中比较常见,通常是由于一些设置或者代码逻辑问题导致的。本文将...
APK正在安装,但应用程序列表... 这个问题可能是由于以下原因导致的:应用程序安装的APK文件可能存在问题。设备上已经存在同名的应用程序...
​ToDesk 远程工具安装及... 目录 前言 ToDesk 优势 ToDesk 下载安装 ToDesk 功能展示 文件传输 设备链接 ...
AWSECS:访问外部网络时出... 如果您在AWS ECS中部署了应用程序,并且该应用程序需要访问外部网络,但是无法正常访问,可能是因为...
报告实验.pdfbase.tt... 这个错误通常是由于找不到字体文件或者文件路径不正确导致的。以下是一些解决方法:确认字体文件是否存在:...