CNN

2025915

15:17

“卷积是一个通道一个通道分开独立计算”是不完全正确的,这是一个非常常见的误解。

 

卷积核是“全通道”的:

实际上,一个标准的卷积核(无论是3x3还是1x1),它的深度(即通道数)总是和输入特征图的通道数 C_in 完全相等的。

 

对于一个输入为 [H, W, C_in] 的特征图。

 

  • 一个单一的 3x3 卷积核,其实际尺寸是 [3, 3, C_in]。
  • 一个单一的 1x1 卷积核,其实际尺寸是 [1, 1, C_in]。

 

计算过程是这样的:

这个 [3, 3, C_in] 的核会同时覆盖输入特征图上一个 3x3xC_in 的局部区域。卷积操作是:

 

  • 将这个核与输入区域逐通道、逐元素相乘。
  • 将所有 C_in 个通道的乘法结果求和,再加上一个偏置项(bias)。
  • 最终得到的只是一个数字(对应输出特征图的一个像素、一个通道)。

 

一个卷积核相当于一次性融合所有输入通道的信息。例如,如果输入是RGB三通道图片,一个权重为 [0.3, 0.6, 0.1] 的1x1卷积核,它的计算就是 输出 = 0.3*R + 0.6*G + 0.1*B。这显然是在融合三个通道的信息,并且更“看重”G通道。

 

已使用 OneNote 创建。