CNN 入门 - CNN 层功能说明

最编程 2024-03-31 12:40:35

...

   众所周知，CNN是一种特殊的深层前馈网络，CNN模型主要包含输入层、卷积层、激励函数、池化层、全连接层以及输出层。接下来将为大家细化分析每一层结构的作用。

卷积神经网络经典模型图
输入层(INPUT)：用于数据的输入。
当输入一张3232的jpg图片的时候，输入层能读取到3232*3的矩阵，3是它的深度（即R、G、B）。

卷积层(CONV)：使用卷积核进行特征提取和特征映射。
机器学习识别图片的过程中，并不是一下子整张图同时识别，而是对于图片中的每一个特征首先局部感知，然后更高层次对局部进行综合操作，从而得到全局信息。左边为输入层读取数据，右边通过卷积层提取特征
激励函数(RELU)：由于卷积也是一种线性运算，因此需要增加非线性映射。
所谓激励，实际上是对卷积层的输出结果做一次非线性映射。
如果不用激励函数（其实就相当于激励函数是f(x)=x），这种情况下，每一层的输出都是上一层输入的线性
函数。容易得出，无论有多少神经网络层，输出都是输入的线性组合，与没有隐层的效果是一样的，这就是最原
始的感知机了。
常用的激励函数有：

Sigmoid
Tanh
ReLU
Leaky ReLU
ELU
Maxout

激励函数建议：首先ReLU，因为迭代速度快，但是有可能效果不加。如果ReLU失效的情况下，考虑使用
Leaky ReLU或者Maxout，此时一般情况都可以解决。Tanh函数在文本和音频处理有比较好的效果。
池化层(POOL)：进行下采样，对特征图稀疏处理，减少数据运算量。
池化，也称为欠采样或下采样。要用于特征降维，压缩数据和参数的数量，减小过拟合，同时提高模型的容错性。
通过池化层，使得原本4*4的特征图压缩成了2*2，从而降低了特征维度
全连接层(FC)：也称它为输出层，用于输出卷积计算后的结果。
经过前面若干次卷积+激励+池化后，终于来到了输出层，模型会将学到的一个高质量的特征图片全连接层。其实在全连接层之前，如果神经元数目过大，学习能力强，有可能出现过拟合。因此，可以引入dropout操作，来随机删除神经网络中的部分神经元，来解决此问题。还可以进行局部归一化（LRN）、数据增强等操作，来增加鲁棒性。
结果输出

上一篇：第 1 章基于 STM32 核心电路板的电路设计和制作流程

下一篇： Flink 生态：PyFlink 入门案例研究

CNN 入门 - CNN 层功能说明

GO 语言入门指南：基本语法和常用功能说明（数据类型） | YTCA

与卷积神经网络（CNN）、视觉转换器功能的比较

详细介绍 CNN 卷积层的原理、结构和应用，讨论其在图像处理和计算机视觉任务中的重要性

CNN 入门 - CNN 层功能说明

用 SVD 压缩深度模型（DNN、CNN）的全连接层

从入门到实践：探索深度学习中的卷积神经网络（CNN）详解与代码实现

入门指南：了解Mask R-CNN和实现实例分割的Swin Transformer测试