當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

学习笔记|Pytorch使用教程22(hook函数与CAM可视化)

發(fā)布時(shí)間：2023/12/31 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了学习笔记|Pytorch使用教程22(hook函数与CAM可视化) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

學(xué)習(xí)筆記|Pytorch使用教程22

本學(xué)習(xí)筆記主要摘自“深度之眼”，做一個(gè)總結(jié)，方便查閱。
使用Pytorch版本為1.2

Hook函數(shù)概念
Hook函數(shù)與特征圖提取
CAM (class activation map,類(lèi)激活圖)

一.Hook函數(shù)概念

Hook函數(shù)機(jī)制:不改變主體，實(shí)現(xiàn)額外功能，像一個(gè)掛件，掛鉤，hook

1.torch.Tensor.register_ hook(hook)
功能:注冊(cè)一個(gè)反向傳播hook函數(shù)

Hook函數(shù)僅一個(gè)輸入?yún)?shù)，為張量的梯度

計(jì)算圖與梯度求導(dǎo)：
$y=(x+w)?(w+1)a=x+wb=w+1y=a?b?y?w=?y?a?a?w+?y?b?b?w=b+1+a+1=(w+a)+(x+w)=2+w+x+1=2+1+2+1=5\begin{aligned} y &=(x+w) *(w+1) \\ a &=x+w \quad b=w+1 \\ y &=a * b \\ \frac{\partial y}{\partial w} &=\frac{\partial y}{\partial a} \frac{\partial a}{\partial w}+\frac{\partial y}{\partial b} \frac{\partial b}{\partial w} \\ &=b+1+a+1 \\ &=(w+a)+(x+w) \\ &=2+w+x+1 \\ &=2+1+2+1=5 \end{aligned}$
在反向傳播結(jié)束后，非葉子節(jié)點(diǎn)a和b的梯度會(huì)被釋放掉。現(xiàn)使用hook函數(shù)捕獲其梯度。
測(cè)試代碼：

import torch import torch.nn as nn from tools.common_tools import set_seedset_seed(1) # 設(shè)置隨機(jī)種子# ----------------------------------- 1 tensor hook 1 ----------------------------------- # flag = 0 flag = 1 if flag:w = torch.tensor([1.], requires_grad=True)x = torch.tensor([2.], requires_grad=True)a = torch.add(w, x)b = torch.add(w, 1)y = torch.mul(a, b)a_grad = list()def grad_hook(grad):a_grad.append(grad)handle = a.register_hook(grad_hook)y.backward()# 查看梯度print("gradient:", w.grad, x.grad, a.grad, b.grad, y.grad)print("a_grad[0]: ", a_grad[0])handle.remove()

輸出：

gradient: tensor([5.]) tensor([2.]) None None None a_grad[0]: tensor([2.])

tensor hook嘗試修改葉子節(jié)點(diǎn)梯度：

# ----------------------------------- 2 tensor hook 2 ----------------------------------- # flag = 0 flag = 1 if flag:w = torch.tensor([1.], requires_grad=True)x = torch.tensor([2.], requires_grad=True)a = torch.add(w, x)b = torch.add(w, 1)y = torch.mul(a, b)a_grad = list()def grad_hook(grad):grad *= 2#return grad*3handle = w.register_hook(grad_hook)y.backward()# 查看梯度print("w.grad: ", w.grad)handle.remove()

輸出(需要保留上段代碼結(jié)果)：

gradient: tensor([5.]) tensor([2.]) None None None a_grad[0]: tensor([2.]) w.grad: tensor([10.])

如果加上 return grad*3，會(huì)覆蓋原始張量梯度，輸出：

gradient: tensor([5.]) tensor([2.]) None None None a_grad[0]: tensor([2.]) w.grad: tensor([30.])

2.torch.nn.Module.register_forward _hook
功能:注冊(cè)module的前向傳播hook函數(shù)

參數(shù):

module:當(dāng)前網(wǎng)絡(luò)層
input :當(dāng)前網(wǎng)絡(luò)層輸入數(shù)據(jù)
output:當(dāng)前網(wǎng)絡(luò)層輸出數(shù)據(jù)

測(cè)試代碼：

# ----------------------------------- 3 Module.register_forward_hook and pre hook ----------------------------------- # flag = 0 flag = 1 if flag:class Net(nn.Module):def __init__(self):super(Net, self).__init__()self.conv1 = nn.Conv2d(1, 2, 3)self.pool1 = nn.MaxPool2d(2, 2)def forward(self, x):x = self.conv1(x)x = self.pool1(x)return xdef forward_hook(module, data_input, data_output):fmap_block.append(data_output)input_block.append(data_input)def forward_pre_hook(module, data_input):print("forward_pre_hook input:{}".format(data_input))def backward_hook(module, grad_input, grad_output):print("backward hook input:{}".format(grad_input))print("backward hook output:{}".format(grad_output))# 初始化網(wǎng)絡(luò)net = Net()net.conv1.weight[0].detach().fill_(1)net.conv1.weight[1].detach().fill_(2)net.conv1.bias.data.detach().zero_()# 注冊(cè)hookfmap_block = list()input_block = list()net.conv1.register_forward_hook(forward_hook)#net.conv1.register_forward_pre_hook(forward_pre_hook)#net.conv1.register_backward_hook(backward_hook)# inferencefake_img = torch.ones((1, 1, 4, 4)) # batch size * channel * H * Woutput = net(fake_img)"""loss_fnc = nn.L1Loss()target = torch.randn_like(output)loss = loss_fnc(target, output)loss.backward()"""# 觀察print("output shape: {}\noutput value: {}\n".format(output.shape, output))print("feature maps shape: {}\noutput value: {}\n".format(fmap_block[0].shape, fmap_block[0]))print("input shape: {}\ninput value: {}".format(input_block[0][0].shape, input_block[0]))

輸出：

output shape: torch.Size([1, 2, 1, 1]) output value: tensor([[[[ 9.]],[[18.]]]], grad_fn=<MaxPool2DWithIndicesBackward>)feature maps shape: torch.Size([1, 2, 2, 2]) output value: tensor([[[[ 9., 9.],[ 9., 9.]],[[18., 18.],[18., 18.]]]], grad_fn=<ThnnConv2DBackward>)input shape: torch.Size([1, 1, 4, 4]) input value: (tensor([[[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]]]]),)

查看hook函數(shù)運(yùn)行機(jī)制，在該處設(shè)置斷點(diǎn)：output = net(fake_img)，并進(jìn)入(step into)

3.torch.nn.Module.register _forward_ pre_ hook
功能:注冊(cè)module前向傳播前的hook函數(shù)

參數(shù):

module:當(dāng)前網(wǎng)絡(luò)層
input :當(dāng)前網(wǎng)絡(luò)層輸入數(shù)據(jù)

4.torch.nn.Module.register_backward_hook
功能:注冊(cè)module反向傳播的hook函數(shù)

參數(shù):

module:當(dāng)前網(wǎng)絡(luò)層
grad_input :當(dāng)前網(wǎng)絡(luò)層輸入梯度數(shù)據(jù)
grad_output :當(dāng)前網(wǎng)絡(luò)層輸出梯度數(shù)據(jù)

完整代碼如上述所示，現(xiàn)在取消注釋。

# ----------------------------------- 3 Module.register_forward_hook and pre hook ----------------------------------- # flag = 0 flag = 1 if flag:class Net(nn.Module):def __init__(self):super(Net, self).__init__()self.conv1 = nn.Conv2d(1, 2, 3)self.pool1 = nn.MaxPool2d(2, 2)def forward(self, x):x = self.conv1(x)x = self.pool1(x)return xdef forward_hook(module, data_input, data_output):fmap_block.append(data_output)input_block.append(data_input)def forward_pre_hook(module, data_input):print("forward_pre_hook input:{}".format(data_input))def backward_hook(module, grad_input, grad_output):print("backward hook input:{}".format(grad_input))print("backward hook output:{}".format(grad_output))# 初始化網(wǎng)絡(luò)net = Net()net.conv1.weight[0].detach().fill_(1)net.conv1.weight[1].detach().fill_(2)net.conv1.bias.data.detach().zero_()# 注冊(cè)hookfmap_block = list()input_block = list()net.conv1.register_forward_hook(forward_hook)net.conv1.register_forward_pre_hook(forward_pre_hook)net.conv1.register_backward_hook(backward_hook)# inferencefake_img = torch.ones((1, 1, 4, 4)) # batch size * channel * H * Woutput = net(fake_img)loss_fnc = nn.L1Loss()target = torch.randn_like(output)loss = loss_fnc(target, output)loss.backward()# 觀察# print("output shape: {}\noutput value: {}\n".format(output.shape, output))# print("feature maps shape: {}\noutput value: {}\n".format(fmap_block[0].shape, fmap_block[0]))# print("input shape: {}\ninput value: {}".format(input_block[0][0].shape, input_block[0]))

輸出：

forward_pre_hook input:(tensor([[[[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.],[1., 1., 1., 1.]]]]),) backward hook input:(None, tensor([[[[0.5000, 0.5000, 0.5000],[0.5000, 0.5000, 0.5000],[0.5000, 0.5000, 0.5000]]],[[[0.5000, 0.5000, 0.5000],[0.5000, 0.5000, 0.5000],[0.5000, 0.5000, 0.5000]]]]), tensor([0.5000, 0.5000])) backward hook output:(tensor([[[[0.5000, 0.0000],[0.0000, 0.0000]],[[0.5000, 0.0000],[0.0000, 0.0000]]]]),)

二.Hook函數(shù)與特征圖提取

測(cè)試代碼：

import torch.nn as nn import numpy as np from PIL import Image import torchvision.transforms as transforms import torchvision.utils as vutils from torch.utils.tensorboard import SummaryWriter from tools.common_tools import set_seed import torchvision.models as modelsset_seed(1) # 設(shè)置隨機(jī)種子# ----------------------------------- feature map visualization ----------------------------------- # flag = 0 flag = 1 if flag:writer = SummaryWriter(comment='test_your_comment', filename_suffix="_test_your_filename_suffix")# 數(shù)據(jù)path_img = "./lena.png" # your path to imagenormMean = [0.49139968, 0.48215827, 0.44653124]normStd = [0.24703233, 0.24348505, 0.26158768]norm_transform = transforms.Normalize(normMean, normStd)img_transforms = transforms.Compose([transforms.Resize((224, 224)),transforms.ToTensor(),norm_transform])img_pil = Image.open(path_img).convert('RGB')if img_transforms is not None:img_tensor = img_transforms(img_pil)img_tensor.unsqueeze_(0) # chw --> bchw# 模型alexnet = models.alexnet(pretrained=True)# 注冊(cè)hookfmap_dict = dict()for name, sub_module in alexnet.named_modules():if isinstance(sub_module, nn.Conv2d):key_name = str(sub_module.weight.shape)fmap_dict.setdefault(key_name, list())n1, n2 = name.split(".")def hook_func(m, i, o):key_name = str(m.weight.shape)fmap_dict[key_name].append(o)alexnet._modules[n1]._modules[n2].register_forward_hook(hook_func)# forwardoutput = alexnet(img_tensor)# add imagefor layer_name, fmap_list in fmap_dict.items():fmap = fmap_list[0]fmap.transpose_(0, 1)nrow = int(np.sqrt(fmap.shape[0]))fmap_grid = vutils.make_grid(fmap, normalize=True, scale_each=True, nrow=nrow)writer.add_image('feature map in {}'.format(layer_name), fmap_grid, global_step=322)

使用tensorboard，在當(dāng)前路徑下輸入：tensorboard --logdir=./runs
在瀏覽器中進(jìn)入：http://localhost:6006/

三.CAM (class activation map,類(lèi)激活圖)

總結(jié)

以上是生活随笔為你收集整理的学习笔记|Pytorch使用教程22(hook函数与CAM可视化)的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：台达AS228Tplc加台达触摸屏一套程
下一篇：业余剪辑——从拍摄到剪辑到加字幕