当前位置: 首页 > ds >正文

【pytorch学习】土堆pytorch学习笔记2

说明

主要以https://www.morinha.cc/posts/courses/pytorch-%E5%B0%8F%E5%9C%9F%E5%A0%86的内容为基础,没有的或者自己不是很清楚的再补充上内容,该贴有的内容大部分不再加入进来
新增的更全的参考:
https://2048.csdn.net/6801fc28e98581517972bb50.html

卷积操作–torch.nn.function

卷积分为不同的层,如con1、con2等

以二层卷积为例,具体的参数可查看官方文档

卷积操作主要就是用卷积核(weight)与原始数据进行计算,再加上其他的操作,最后得到一个新的输出

代码示例:
output3 = F.conv2d(input, kernel, stride=1, padding=1)
print(output3)

output3 就是 卷积神经网络模型计算后的 输出,
input是输入的数据,在此为一个二维数组,代表一张图片
kernel表示卷积核,同input形状,也是一个二维数组,并且两者的形状都要有四个维度,否则要进行reshape
stride表示步长
padding表示周围填充几层,填充的默认值是0

输入维度要求

注意要求输入的要求:(批大小,通道数,高,宽)

神经网络–卷积层(torch.nn.conv)

其实就是对nn.function的进一步封装
如nn.Conv2d(),最常用的是这五个参数:in_channels、 out_channels、kernel_size、stride、 padding
实例:
#在初始化方法中定义进行卷积操作
self.conv1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0)
in_channels=3:三通道输入(彩色图片)
out_channels=6:输出是六通道(6层),即生成6个卷积核
kernel_size=3:每个卷积核的维度是3*3
stride=1:步长为1,卷积核中心移动的步长
padding=0:不进行填充

import torch
import torchvision
from torch import nn
from torch.nn import Conv2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from urllib3.filepost import writerdatset = torchvision.datasets.CIFAR10("data",train=False,transform=torchvision.transforms.ToTensor(),download=True)dataloader = DataLoader(datset, batch_size=64)class Tudui(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(in_channels=3, out_channels=6,kernel_size=3,stride=1, padding=0)def forward(self, x):x = self.conv1(x)return xtudui = Tudui()
# print(tudui)writer = SummaryWriter("logs")
step = 0
for data in dataloader:if step == 1:breakimgs, targets = dataoutput = tudui(imgs)  # torch.Size([64, 6, 30, 30])# print(imgs.shape)# print(output.shape)writer.add_images("input", imgs, step)  # torch.Size([64, 3, 32, 32])# 第一个值不知道写什么所以写的-1,会自动调整output = torch.reshape(output, (-1, 3, 30, 30))print(output.shape)  # 调整后变成了torch.Size([128, 3, 30, 30])writer.add_images("output", output, step)  step = step + 1writer.close()

池化

最大池化层的步长默认大小为kernel_size
ceil 允许有出界部分;floor 不允许.ceil_mode =True时 为ceil

nn.MaxPool2d(kernel_size=3,ceil_mode=False) 

非线性激活(Non-linear Activations)

非线性变换的主要目的就是给网中加入一些非线性特征,

非线性越多才能训练出符合各种特征的模型。常见的非线性激活:

ReLU:主要是对小于0的进行截断(将小于0的变为0),图像变换效果不明显
主要参数是inplace:
inplace为真时,将处理后的结果赋值给原来的参数;为假时,原值不会改变。
SIGMOID: 归一化处理
效果没有ReLU好,但对于多分类问题,必须采用sigmoid

http://www.xdnf.cn/news/10111.html

相关文章:

  • 【Linux】权限相关指令
  • Axure疑难杂症:中继器新增数据时如何上传并存储图片(玩转中继器)
  • 【仿生机器人系统设计】涉及到的伦理与安全问题
  • 数据基座觉醒!大数据+AI如何重构企业智能决策金字塔(上)
  • 代码随想录打卡|Day53 图论(Floyd 算法精讲 、A * 算法精讲 (A star算法)、最短路算法总结篇、图论总结 )
  • 历年武汉大学计算机保研上机真题
  • 服务器液冷:突破散热瓶颈,驱动算力革命的“冷静”引擎
  • 美国服务器文件系统的基本功能和命令
  • ansible-playbook 进阶 接上一章内容
  • dart实现单client连接的grpc server (以ip地址作判断)
  • Yum配置第三方源与本地源详解
  • 日常--OBS+mediamtx实现本地RTMP推流环境搭建(详细图文)
  • RPG17.蓝图函数库与轻重攻击连击
  • C++ 5.29 dddd
  • 【深度剖析】义齿定制行业数字化转型模式创新研究(上篇2:痛点和难点分析)
  • AI智能监控系统:赋能厂区安全管理的数智化革新
  • [Dify] 如何应对明道云API数据过长带来的Token超限问题
  • OAuth协议中的Token、Ticket
  • (NAT64)IPv6网络用户访问IPv4网络服务器(动态映射方式)
  • Linux服务器时间同步——Chronyd
  • MyBatis动态SQL
  • Baklib知识中台驱动业务创新
  • 【HarmonyOS 5】鸿蒙中的UIAbility详解(二)
  • 深化生态协同,宁盾身份域管完成与拓波软件兼容互认证
  • 19、Python字符串高阶实战:转义字符深度解析、高效拼接与输入处理技巧
  • 2.2.1 05年T4
  • Python 连接 MinIO (一)
  • wsl2 docker重启后没了
  • Cobra CLI 工具使用指南:构建 Go 语言命令行应用的完整教程
  • 激励电平与频差的微妙平衡:晶振选型不可忽视的细节