当前位置: 首页 > news >正文

PyTorch笔记7----------计算机视觉基础

1.颜色空间

  • RGB色彩模式
    • RGB色彩模式是工业界的一种颜色标准
    • 通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及他们相互之间的叠加来得到各式各样的颜色
    • 红、绿、蓝三个颜色通道每种色各为0~255阶亮度
    • 一幅图片包含,宽(W)、高(H)、通道数(C),RGB图片的通道数为3,即表示为H*W*3
  • HSV色彩模式
    • 色相(Hue):指物体传导或反射的波长。即色彩,取0到360度的数值来衡量
    • 饱和度(Saturation):又称色度,是指色彩的强度或纯度,取值范围为0%~100%
    • 明度(Value):表示颜色明亮的程度,取之范围为0%(黑)到100%(白)
  • 灰度图
    • 灰度图通常由一个unit8、unit16、单精度类型或者双精度类型的数组描述
    • 一个灰度图,可以看做一个M*N的矩阵,矩阵中每一个元素与图像的一个像素点对应
    • 灰度图中,0代表黑色,1或255代表白色

2.图像处理概念

  • 亮度、对比度、饱和度
    • 亮度:图像的明亮程度,在单色图像中,最高的值应该对应于白色,最低的值应当对应于黑色。调整图像亮度时,通常在图像矩阵上加减一个值。通常用于RGB图进行数据增强。
    • 对比度:图像暗和亮的落差值,即图像最大灰度级和最小灰度级之间的差值,差异范围越大代表对比度越大,差异范围越小代表对比越小。调整图像对比度度时,通常在图像矩阵上加乘一个值,如果这个值大于1,则对比度增加,小于1则对比度减小。通常用于RGB图进行数据增强。
    • 饱和度:图像颜色种类的多少,饱和度越高,颜色种类越多,外观上看起来图像会更鲜艳。通常用于HSV/HSI/HSL色彩空间上进行数据增强
  • 平滑、降噪
    • 图像平滑是指用于突出图像的宽大区域、低频成分、主干部分或抑制图像噪声和干扰高频成分的图像处理方法,使图像亮度平缓渐变,减小突变梯度,改善图像质量
  • 锐化、增强
    • 锐化时通过增强高频分量来减少图像中的模糊,增强图像细节边缘和轮廓,增强灰度反差,便于后期对目标的识别和处理。锐化处理在增强图像边缘的同时也增加了图像的噪声
  • 边缘提取算子
    • 通过微分的方式计算图像的边缘,边缘即色差大的点
  • 直方图均衡化
    • 直方图均衡化是将原图像通过某种变换,得到一幅灰度直方图为均匀分布的心图像的方法
    • 在对图像中像素个数多的灰度级进行展宽,而对像素个数少的灰度级进行缩减,从而达到清洗图像的目的
  • 图像滤波
    • 图像滤波可以更改或者增强图像
    • 通过滤波,可以强调一些特征或者去除图像中一些不需要的部分
    • 滤波是一个邻域操作算子,利用给定像素周围的像素的值决定此像素的最终输出值
    • 常见的应用包括去噪、图像增强、检测边缘、检测角点、模版匹配等
  • 形态学运算
    • 腐蚀:把图片“变瘦”,其原理是在原图的小区域内去局部最小值
    • 膨胀:把图片“变胖”,其原理是在原图的小区域内去局部最大值
    • 开运算:先腐蚀后膨胀
    • 闭运算:先膨胀后腐蚀
    • 形态学梯度:膨胀土减去腐蚀图,得到轮廓图
    • 顶帽:原图减去开运算后的图
    • 黑帽:闭运算后的图减去原图

3.特征工程

        特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优。

本文内容较短,主要是为了铺垫一下卷积神经网络😂😂

知识点为听课总结笔记,课程为B站“2025最新整合!公认B站讲解最强【PyTorch】入门到进阶教程,从环境配置到算法原理再到代码实战逐一解读,比自学效果强得多!”:2025最新整合!公认B站讲解最强【PyTorch】入门到进阶教程,从环境配置到算法原理再到代码实战逐一解读,比自学效果强得多!_哔哩哔哩_bilibili

http://www.xdnf.cn/news/1126999.html

相关文章:

  • SSM框架学习DI入门——day2
  • flutter弹窗:fluttertoast
  • AI-Compass LLM训练框架生态:整合ms-swift、Unsloth、Megatron-LM等核心框架,涵盖全参数/PEFT训练与分布式优化
  • 开通保存图片权限
  • 专业文档搜索工具,快速定位文本内容
  • 简单2步配置CadenceSkill开发编辑器,支持关键字高亮
  • 《大数据技术原理与应用》实验报告四 MapReduce初级编程实践
  • excel 通过openpyxl表格下载和插入图片
  • Linux的用户和用户组与权限解析、环境变量说明与配置、sudo配置解析和使用
  • Linux系统下 挂载exfat文件系统U盘
  • 【C语言进阶】字符函数和字符串函数的内部原理
  • 解锁Redis:从安装到配置的全攻略
  • sqli-labs靶场通关笔记:第18-19关 HTTP头部注入
  • 阿里云 Kubernetes 的 kubectl 配置
  • 46. 携带研究材料(01背包二维数组)
  • Rust基础[part4]_基本类型,所有权
  • 深入理解设计模式:组合模式(Composite Pattern)
  • [设计模式]C++单例模式的几种写法以及通用模板
  • Ubuntu18.04 系统重装记录
  • 【高并发服务器】多路复用的总结 eventfd timerfd
  • 复习笔记 39
  • (李宏毅)deep learning(五)--learning rate
  • 单臂路由实现VLAN互通实验
  • 编译原理第一到三章(知识点学习/期末复习/笔试/面试)
  • HashMap详解
  • 优学教育官网搭建01首页
  • 多模态大语言模型arxiv论文略读(157)
  • Node.js 中http 和 http/2 是两个不同模块对比
  • React源码4 三大核心模块之一:Schedule,scheduleUpdateOnFiber函数
  • GBase 8a 与 Spring Boot + MyBatis 整合实战:从环境搭建到CRUD操作