类激活图（CAM）代码+原理详解

作者：rousong2024.01.08 16:02浏览量：30

简介：类激活图（Class Activation Mapping，CAM）是一种可视化神经网络决策过程的方法。它通过反向传播，将每个输入特征的重要性可视化，从而帮助我们理解模型决策背后的原因。本文将介绍CAM的原理、实现方法和应用场景，并通过代码示例进行演示。

在深度学习中，神经网络模型通常被视为黑盒子，其决策过程难以理解。为了解决这个问题，类激活图（CAM）应运而生。CAM是一种可视化神经网络决策过程的方法，通过将每个输入特征的重要性可视化，使我们能够理解模型决策背后的原因。
原理：
CAM的基本原理是通过对最后一层卷积层的权重进行重加权，得到每个输入特征的重要性得分。具体来说，首先将卷积层输出进行全局平均池化，然后将得到的向量与卷积层的权重向量逐元素相乘并求和，最终得到每个特征的得分。这个得分反映了该特征对分类结果的贡献程度。
实现方法：
在实现CAM时，我们需要对神经网络进行一些修改。首先，我们需要将最后一层卷积层的输出进行全局平均池化，然后将其与一个可学习的向量相加，得到最终的输出。这个可学习的向量在训练过程中会被优化，以便更好地反映特征的重要性。
在推理时，我们只需要将最后一层卷积层的输出进行全局平均池化，然后将其与权重向量的元素逐元素相乘并求和，即可得到每个特征的得分。
应用场景：
CAM的应用场景非常广泛。例如，在医疗图像诊断中，我们可以通过CAM了解模型关注图像的哪些区域来判断病变；在自动驾驶中，我们可以通过CAM了解模型关注图像中的哪些物体来进行路径规划。总的来说，CAM可以帮助我们理解模型的决策过程，从而提高模型的解释性和可信度。
下面是一个简单的代码示例，演示如何使用PyTorch实现CAM：
首先，我们定义一个简单的CNN模型：

import torch.nn as nn
class SimpleCNN(nn.Module):
def __init__(self):
super(SimpleCNN, self).__init__()
self.conv1 = nn.Conv2d(3, 64, kernel_size=3, stride=1, padding=1)
self.conv2 = nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1)
self.conv3 = nn.Conv2d(128, 256, kernel_size=3, stride=1, padding=1)
self.pool = nn.MaxPool2d(kernel_size=2, stride=2)
self.fc = nn.Linear(256 * 7 * 7, 10)

然后，我们定义一个CAM类：

import torch.nn.functional as F
class CAM:
def __init__(self, model):
self.model = model
self.feature_maps = []
self.gradients = []
for module in model.modules():
if isinstance(module, nn.Conv2d):
module.register_backward_hook(self.backward_hook)

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

开发者热搜

类激活图（CAM）代码+原理详解

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者