基于pytorch的简单小案例 -凯发娱发k8

　　神经网络的理论知识不是本文讨论的重点，假设读者们都是已经了解rnn的基本概念，并希望能用一些框架做一些简单的实现。这里推荐神经网络必读书目：邱锡鹏《神经网络与深度学习》。本文基于pytorch简单实现cifar-10、mnist手写体识别，读者可以基于此两个简单案例进行拓展，实现自己的深度学习入门。

环境说明

　　python 3.6.7

　　pytorch的cup版本

　　pycharm编辑器

　　部分可能报错：参见pytorch安装错误及解决

基于pytorch的cifar-10图片分类

代码实现

# coding = utf-8
import torch

import torch.nn

import numpy as np

from torchvision.datasets import cifar10

from torchvision import transforms

from torch.utils.data import dataloader

from torch.utils.data.sampler import subsetrandomsampler

import torch.nn.functional as f

import torch.optim as optimizer
'''

the compose function allows for multiple transforms.

transform.totensor() converts our pilimage to a tensor of

shape (c x h x w) in the range [0, 1]

transform.normalize(mean, std) normalizes a tensor to a (mean, std)

for (r, g, b)

'''

_task = transforms.compose([

    transforms.totensor(),

    transforms.normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])

])
# 注意：此处数据集在本地，因此download=false;若需要下载的改为true

# 同样的，第一个参数为数据存放路径

data_path = '../cifar_10_zhuanzhi/cifar10'

cifar = cifar10(data_path, train=true, download=false, transform=_task)
# 这里只是为了构造取样的角标，可根据自己的思路进行拓展

# 此处使用了前百分之八十作为训练集，百分之八十到九十的作为验证集，后百分之十为测试集

samples_count = len(cifar)

split_train = int(0.8 * samples_count)

split_valid = int(0.9 * samples_count)
index_list = list(range(samples_count))

train_idx, valid_idx, test_idx = index_list[:split_train], index_list[split_train:split_valid], index_list[split_valid:]
# 定义采样器

# create training and validation, test sampler

train_sampler = subsetrandomsampler(train_idx)

valid_sampler = subsetrandomsampler(valid_idx)

test_samlper  = subsetrandomsampler(test_idx )
# create iterator for train and valid, test dataset

trainloader = dataloader(cifar, batch_size=256, sampler=train_sampler)

validloader = dataloader(cifar, batch_size=256, sampler=valid_sampler)

testloader  = dataloader(cifar, batch_size=256, sampler=test_samlper )
# 网络设计

class net(torch.nn.module):

    """

    网络设计了三个卷积层，一个池化层，一个全连接层

    """

    def __init__(self):

        super(net, self).__init__()
        self.conv1 = torch.nn.conv2d(3, 16, 3, padding=1)

        self.conv2 = torch.nn.conv2d(16, 32, 3, padding=1)

        self.conv3 = torch.nn.conv2d(32, 64, 3, padding=1)

        self.pool = torch.nn.maxpool2d(2, 2)

        self.linear1 = torch.nn.linear(1024, 512)

        self.linear2 = torch.nn.linear(512, 10)
    # 前向传播

    def forward(self, x):

        x = self.pool(f.relu(self.conv1(x)))

        x = self.pool(f.relu(self.conv2(x)))

        x = self.pool(f.relu(self.conv3(x)))

        x = x.view(-1, 1024)

        x = f.relu(self.linear1(x))

        x = f.relu(self.linear2(x))
        return x
if __name__ == "__main__":
    net = net()  # 实例化网络

    loss_function = torch.nn.crossentropyloss()  # 定义交叉熵损失
    # 定义优化算法

    optimizer = optimizer.sgd(net.parameters(), lr=0.01, weight_decay=1e-6, momentum=0.9, nesterov=true)
    # 迭代次数

    for epoch in range(1, 31):

        train_loss, valid_loss = [], []
        net.train()  # 训练开始

        for data, target in trainloader:

            optimizer.zero_grad()  # 梯度置0

            output = net(data)

            loss = loss_function(output, target)  # 计算损失

            loss.backward()   # 反向传播

            optimizer.step()  # 更新参数

            train_loss.append(loss.item())
        net.eval()  # 验证开始

        for data, target in validloader:

            output = net(data)

            loss = loss_function(output, target)

            valid_loss.append(loss.item())
        print("epoch:{}, training loss:{}, valid loss:{}".format(epoch, np.mean(train_loss), np.mean(valid_loss)))

    print("======= training finished ! =========")
    print("testing begining ... ")  # 模型测试

    total = 0

    correct = 0

    for i, data_tuple in enumerate(testloader, 0):
        data, labels = data_tuple

        output = net(data)

        _, preds_tensor = torch.max(output, 1)
        total  = labels.size(0)

        correct  = np.squeeze((preds_tensor == labels).sum().numpy())

    print("accuracy : {} %".format(correct/total))

实验结果

经验总结

1.激活函数的选择。

激活函数可选择sigmoid函数或者relu函数，亲测使用relu函数后，分类的正确率会高使用sigmoid函数很多；
relu函数的导入有两种：import torch.nn.functional as f, 然后f.relu()，还有一种是torch.nn.relu() 两种方式实验结果没区别，但是推荐使用后者；因为前者是以函数的形式导入的，在模型保存时，f中相关参数会被释放，无法保存下去，而后者会保留参数。

2.预测结果的处理。

　　pytorch预测的结果，返回的是一个tensor,需要处理成数值才能进行准确率计算，.numpy()方法能将tensor转化为数组，然后使用squeeze能够将数组转化为数值。

3. 数据加载。pytorch是采用批量加载数据的，因此使用for循环迭代从采样器中加载数据，batch_size参数指定每次加载数据量的大小

4.注意维度。

网络设计中的维度。网络层次设计中，要谨记前一层的输出是后一层的输入，维度要对应的上。
全连接中的维度。全连接中要从特征图中选取特征，这些特征不是一维的，而全连接输出的结果是一维的，因此从特征图中选取特征作为全连接层输入前，需要将特征展开，例如：x = x.view(-1, 28*28)

基于pytorch的mnist手写体识别

代码实现

# coding = utf-8

import numpy as np

import torch

from torchvision import transforms
_task = transforms.compose([

    transforms.totensor(),

    transforms.normalize(

        [0.5], [0.5]

    )

])
from torchvision.datasets import mnist
# 数据集加载

mnist = mnist('./data', download=false, train=true, transform=_task)
# 训练集和验证集划分

from torch.utils.data import dataloader

from torch.utils.data.sampler import subsetrandomsampler
# create training and validation split

index_list = list(range(len(mnist)))
split_train = int(0.8*len(mnist))

split_valid = int(0.9*len(mnist))
train_idx, valid_idx, test_idx = index_list[:split_train], index_list[split_train:split_valid], index_list[split_valid:]
# create sampler objects using subsetrandomsampler

train_sampler = subsetrandomsampler(train_idx)

valid_sampler = subsetrandomsampler(valid_idx)

test_sampler = subsetrandomsampler(test_idx)
# create iterator objects for train and valid dataset

trainloader = dataloader(mnist, batch_size=256, sampler=train_sampler)

validloader = dataloader(mnist, batch_size=256, sampler=valid_sampler)

test_loader = dataloader(mnist, batch_size=256, sampler=test_sampler )
# design for net

import torch.nn.functional as f

class netmodel(torch.nn.module):

    def __init__(self):

        super(netmodel, self).__init__()

        self.hidden = torch.nn.linear(28*28, 300)

        self.output = torch.nn.linear(300, 10)
    def forward(self, x):

        x = x.view(-1, 28*28)

        x = self.hidden(x)

        x = f.relu(x)

        x = self.output(x)

        return x
if __name__ == "__main__":

    net = netmodel()
    from torch import optim

    loss_function = torch.nn.crossentropyloss()

    optimizer = optim.sgd(net.parameters(), lr=0.01, weight_decay=1e-6, momentum=0.9, nesterov=true)
    for epoch in range(1, 12):

        train_loss, valid_loss = [], []

        # net.train()

        for data, target in trainloader:

            optimizer.zero_grad()

            # forward propagation

            output = net(data)

            loss = loss_function(output, target)

            loss.backward()

            optimizer.step()

            train_loss.append(loss.item())

        # net.eval()

        for data, target in validloader:

            output = net(data)

            loss = loss_function(output, target)

            valid_loss.append(loss.item())

        print("epoch:", epoch, "training loss:", np.mean(train_loss), "valid loss:", np.mean(valid_loss))
    print("testing ... ")

    total = 0

    correct = 0

    for i, test_data in enumerate(test_loader, 0):

        data, label = test_data

        output = net(data)

        _, predict = torch.max(output.data, 1)
        total  = label.size(0)

        correct  = np.squeeze((predict == label).sum().numpy())

    print("accuracy:", (correct/total)*100, "%")

实验结果

经验总结

　　1.网络设计的使用只用了一个隐层，单隐层神经网络经过10词迭代，对手写体识别准确率高达97%！！简直变态啊！

　　2.loss.item()和loss.data[0]。好像新版本的pytorch放弃了loss.data[0]的表达方式。

　　3.手写体识别的图片是单通道图片，因此在transforms.compose()中做标准化的时候，只需要指定一个值即可；而cifar中的图片是三通道的，因此需要指定三个参数。

基于pytorch的简单小案例 -凯发娱发k8

环境说明

基于pytorch的cifar-10图片分类

代码实现

实验结果

经验总结

基于pytorch的mnist手写体识别

代码实现

实验结果

经验总结

基于pytorch的简单小案例的相关教程结束。

相关推荐

怎么解决pytorch 自定义子module .cuda() tensor失败问题

jetson nx配置pytorch的问题如何解决

python-装饰器-案例-获取文件列表

案例45-crm练习改写客户列表使用struts2&ognl

案例42-使用ajax获取crm中的客户列表

案例实践 | 某能源企业api安全实践

【前端学习笔记】2015-09-11~~~~ js中ajax请求返回案例