可视化
Last updated
Was this helpful?
Last updated
Was this helpful?
可视化仓库: utkuozbulak/pytorch-cnn-visualizations
| conference | paper | first author | institute | | - | - | - | - | - | | ECCV 2014 | Visualizing and Understanding Convolutional Networks | Matthew D. Zeiler | Dept. of Computer Science, Courant Institute, New York University | | CVPR 16 | Learning Deep Features for Discriminative Localization | Bolei Zhou | MIT | | ICCV 2017 | Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization | Ramprasaath R. Selvaraju | Georgia Institute of Technology, Atlanta, GA, USA |
Learning Deep Features for Discriminative Localization
为了在定位上得到好的表现,网络的分类性能很重要,因为它决定了网络是否能准确地分类和定位的边界。
用于两个方面:
弱监督语义分割(分类信息有定位能力)
可视化
本文针对使用GAP的CNN网络提出了一个叫做CAM的通用技术,这个技术可以让做过分类训练的CNN网络学会进行物体定位,不需要进行额外的边界框注解训练。
本文针对使用GAP的CNN网络提出了一个叫做CAM的通用技术,这个技术可以让做过分类训练的CNN网络学会进行物体定位,不需要进行额外的边界框注解训练。CAM可以可视化预测类在任何给定图片上的得分,标出CNN检测到的物体的区别性区域。我们在ILSVRC上评估了我们的方法,进行了弱监督物体定位,证明了我们的全局平均池化层的CNN可以进行准确的物体定位。此外,我们证明了CAM定位技术可以推广到其他视觉识别任务中,也就是说,我们的技术可以生成通用的用于定位的深层特征,可以帮助其他用CNN做任务的研究人员,作为他们理解区别性区域的基础。
将图片转化为可以求梯度的tensor
将图片输入网络
反传梯度时将目标类的one hot设为1,其他为0
将梯度进行0-1的min-max归一化,然后保存为彩色图片
对三个通道的梯度绝对值相加,然后进行0-1的min-max归一化,然后保存为灰度图片
在Vanilla Backpropagation
的基础之上,对ReLU激活层的反向传播进行修正。
将反传的负的梯度设为0
这里除了彩色图和灰度图之外,也对正的和负的梯度分别展示(和彩色图的展示方法一样)。
代码如下: