LeNet-5:卷积神经网络的奠基之作
LeNet-5:卷积神经网络的奠基之作
1. 网络提出的目的
论文题目:Gradient-Based Learning Applied to Document Recognition
论文地址:http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf
LeNet-5由Yann LeCun等人于1998年提出,是首个成功应用于商业场景的卷积神经网络。在当时背景下,传统机器学习方法对手写字符识别任务效果有限,主要面临以下挑战:
- 手工设计特征效率低下且泛化能力差
- 图像变形和位置变化导致识别率下降
- 全连接网络参数过多难以训练
LeCun团队通过以下创新解决这些问题:
- 引入卷积操作:通过局部感受野和权值共享,显著减少参数数量
- 使用下采样层(现称池化层):增强特征的空间不变性
- 端到端训练:首次展示了梯度反向传播在图像识别中的有效性
LeNet-5在MNIST手写数字识别上达到99%+的准确率,奠定了现代卷积神经网络的基础架构。