卷积神经网络(一)基础入门
目录
-
什么是卷积神经网络(CNN)
-
CNN 的起源与应用场景
-
CNN 的核心组件
-
卷积层详解
-
池化层简介
-
CNN 的基本架构示意
-
简单示例与理解
1️⃣ 什么是卷积神经网络(CNN)
-
CNN是一种深度学习模型,专门用于处理具有类似网格结构的数据(如图像、语音信号)。
-
通过卷积运算提取局部特征,有效捕捉空间和局部关联性。
-
相较于传统神经网络,CNN在图像识别、目标检测、语义分割等任务中表现优异。
2️⃣ CNN 的起源与应用场景
-
最初由Yann LeCun于1989年提出,用于手写数字识别(LeNet-5)。
-
现今广泛应用于计算机视觉领域:
-
图像分类(如ImageNet竞赛)
-
目标检测(如YOLO、Faster R-CNN)
-
语义分割
-
视频分析
-
自然语言处理中的文本分类等
-
3️⃣ CNN 的核心组件
组件 | 作用 |
---|---|
卷积层 | 提取输入的局部特征 |
激活函数 | 引入非线性,提高模型表达能力 |
池化层 | 降低特征维度,防止过拟合 |
全连接层 | 综合高层特征,输出分类结果 |
损失函数 | 衡量预测与真实值的差距 |
4️⃣ 卷积层详解
-
卷积层通过多个**卷积核(滤波器)**滑动扫描输入图像,提取局部特征。
-
卷积核大小常见为3x3、5x5等。
-
卷积操作公式简化:
(I∗K)(x,y)=∑i∑jI(x+i,y+j)⋅K(i,j)其中 I 是输入图像,K 是卷积核。
-
参数共享和局部连接特性减少了模型参数量,提高训练效率。
-
卷积层输出称为特征图(feature map)。
5️⃣ 池化层简介
-
池化层用于降低空间尺寸,减少计算量和过拟合。
-
常见的池化方式:
-
最大池化(Max Pooling)
-
平均池化(Average Pooling)
-
-
通过滑动窗口,对区域内数值进行最大值或平均值操作,降低分辨率。
6️⃣ CNN 的基本架构示意
输入图像 -> 卷积层 + 激活 -> 池化层 -> 卷积层 + 激活 -> 池化层 -> ... -> 全连接层 -> 输出
7️⃣ 简单示例理解
-
假设输入是28x28的灰度手写数字图像。
-
使用5个3x3卷积核提取边缘、纹理等低级特征。
-
池化层将28x28降为14x14,降低后续计算负担。
-
重复卷积和池化提取更高层次语义信息。
-
最终全连接层输出10个数字分类概率。
卷积神经网络(一) – 菜鸟-创作你的创作