mengpengfei
diff --git a/‎README.md
Lines changed: 42 additions & 0 deletions b/‎README.md
Lines changed: 42 additions & 0 deletions
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool2_Grayscale.png
33.8 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool2_Grayscale.png
33.8 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool2_Heatmap.png
48.2 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool2_Heatmap.png
48.2 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool2_On_Image.png
119 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool2_On_Image.png
119 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool3_Grayscale.png
19.8 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool3_Grayscale.png
19.8 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool3_Heatmap.png
27.3 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool3_Heatmap.png
27.3 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool3_On_Image.png
116 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool3_On_Image.png
116 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool4_Grayscale.png
17.6 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool4_Grayscale.png
17.6 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool4_Heatmap.png
27.6 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool4_Heatmap.png
27.6 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool4_On_Image.png
116 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool4_On_Image.png
116 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool5_Grayscale.png
13.1 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool5_Grayscale.png
13.1 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool5_Heatmap.png
19.1 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool5_Heatmap.png
19.1 KB
diff --git a/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool5_On_Image.png
115 KB b/‎results/hierarchical_gradient_visualization/snake_LayerCam_pool5_On_Image.png
115 KB
diff --git a/‎src/layercam.py
Lines changed: 102 additions & 0 deletions b/‎src/layercam.py
Lines changed: 102 additions & 0 deletions
@@ -14,6 +14,7 @@ This repository contains a number of convolutional neural network visualization
 * [Gradient-weighted class activation mapping](#gradient-visualization) [3] (Generalization of [2]) 
 * [Guided, gradient-weighted class activation mapping](#gradient-visualization) [3]
 * [Score-weighted class activation mapping](#gradient-visualization) [15] (Gradient-free generalization of [2])
+* [Element-wise gradient-weighted class activation mapping](#hierarchical-gradient-visualization) [16] (Visualization of any CNN layer) 
 * [Smooth grad](#smooth-grad) [8]
 * [CNN filter visualization](#convolutional-neural-network-filter-visualization) [9]
 * [Inverted image representations](#inverted-image-representations) [5]
@@ -163,6 +164,45 @@ If you find the code in this repository useful for your research consider citing
 	</tbody>
 </table>
 
+## Hierarchical Gradient Visualization
+**Element-wise gradient-weighted class activation mapping**: LayerCAM [16] is a simple modification of Grad-CAM [3], which can generate reliable class activation maps from different layers. For this example I used a pre-trained **VGG16**. 
+
+<table border=0 width="50px" >
+	<tbody> 
+    <tr>
+			<td>  </td>
+			<td align="center"> Class Activation Map </td>
+			<td align="center"> Class Activation HeatMap </td>
+			<td align="center"> Class Activation HeatMap on Image</td>
+		</tr>
+		<tr>
+			<td width="19%" align="center"> LayerCAM <br /> (Layer 9)</td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool2_Grayscale.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool2_Heatmap.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool2_On_Image.png"> </td>
+		</tr>
+		<tr>
+			<td width="19%" align="center"> LayerCAM <br /> (Layer 16)</td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool3_Grayscale.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool3_Heatmap.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool3_On_Image.png"> </td>
+		</tr>
+		<tr>
+			<td width="19%" align="center"> LayerCAM <br /> (Layer 23)</td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool4_Grayscale.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool4_Heatmap.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool4_On_Image.png"> </td>
+		</tr>
+		<tr>
+			<td width="19%" align="center"> LayerCAM <br /> (Layer 30)</td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool5_Grayscale.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool5_Heatmap.png"> </td>
+			<td width="27%" align="center"> <img src="results/hierarchical_gradient_visualization/snake_LayerCam_pool5_On_Image.png"> </td>
+		</tr>
+	</tbody>
+</table>
+
+
 ## Grad Times Image
 Another technique that is proposed is simply multiplying the gradients with the image itself. Results obtained with the usage of multiple gradient techniques are below.
 
@@ -401,3 +441,5 @@ PIL >= 1.1.7
 [14] J. Yosinski, J. Clune, A. Nguyen, T. Fuchs, Hod Lipson, *Understanding Neural Networks Through Deep Visualization* https://arxiv.org/abs/1506.06579
 
 [15] H. Wang, Z. Wang, M. Du, F. Yang, Z. Zhang, S. Ding, P. Mardziel, X. Hu. *Score-CAM: Score-Weighted Visual Explanations for Convolutional Neural Networks* https://arxiv.org/abs/1910.01279
+
+[16] P. Jiang, C. Zhang, Q. Hou, M. Cheng, Y. Wei. LayerCAM: *Exploring Hierarchical Class Activation Maps for Localization* http://mmcheng.net/mftp/Papers/21TIP_LayerCAM.pdf
@@ -0,0 +1,102 @@
+"""
+Created on Mon Jul 5 12:39:11 2021
+
+@author: Peng-Tao Jiang - github.com/PengtaoJiang
+"""
+from PIL import Image
+import numpy as np
+import torch
+
+from misc_functions import get_example_params, save_class_activation_images
+
+
+class CamExtractor():
+    """
+        Extracts cam features from the model
+    """
+    def __init__(self, model, target_layer):
+        self.model = model
+        self.target_layer = target_layer
+        self.gradients = None
+
+    def save_gradient(self, grad):
+        self.gradients = grad
+
+    def forward_pass_on_convolutions(self, x):
+        """
+            Does a forward pass on convolutions, hooks the function at given layer
+        """
+        conv_output = None
+        for module_pos, module in self.model.features._modules.items():
+            x = module(x)  # Forward
+            if int(module_pos) == self.target_layer:
+                x.register_hook(self.save_gradient)
+                conv_output = x  # Save the convolution output on that layer
+        return conv_output, x
+
+    def forward_pass(self, x):
+        """
+            Does a full forward pass on the model
+        """
+        # Forward pass on the convolutions
+        conv_output, x = self.forward_pass_on_convolutions(x)
+        x = x.view(x.size(0), -1)  # Flatten
+        # Forward pass on the classifier
+        x = self.model.classifier(x)
+        return conv_output, x
+
+
+class LayerCam():
+    """
+        Produces class activation map
+    """
+    def __init__(self, model, target_layer):
+        self.model = model
+        self.model.eval()
+        # Define extractor
+        self.extractor = CamExtractor(self.model, target_layer)
+
+    def generate_cam(self, input_image, target_class=None):
+        # Full forward pass
+        # conv_output is the output of convolutions at specified layer
+        # model_output is the final output of the model (1, 1000)
+        conv_output, model_output = self.extractor.forward_pass(input_image)
+        if target_class is None:
+            target_class = np.argmax(model_output.data.numpy())
+        # Target for backprop
+        one_hot_output = torch.FloatTensor(1, model_output.size()[-1]).zero_()
+        one_hot_output[0][target_class] = 1
+        # Zero grads
+        self.model.features.zero_grad()
+        self.model.classifier.zero_grad()
+        # Backward pass with specified target
+        model_output.backward(gradient=one_hot_output, retain_graph=True)
+        # Get hooked gradients
+        guided_gradients = self.extractor.gradients.data.numpy()[0]
+        # Get convolution outputs
+        target = conv_output.data.numpy()[0]
+        # Get weights from gradients
+        weights = guided_gradients
+        weights[weights < 0] = 0 # discard negative gradients
+        # Element-wise multiply the weight with its conv output and then, sum
+        cam = np.sum(weights * target, axis=0)
+        cam = (cam - np.min(cam)) / (np.max(cam) - np.min(cam))  # Normalize between 0-1
+        cam = np.uint8(cam * 255)  # Scale between 0-255 to visualize
+        cam = np.uint8(Image.fromarray(cam).resize((input_image.shape[2],
+                       input_image.shape[3]), Image.ANTIALIAS))/255
+
+        return cam
+
+
+if __name__ == '__main__':
+    # Get params
+    target_example = 0  # Snake
+    (original_image, prep_img, target_class, file_name_to_export, pretrained_model) =\
+        get_example_params(target_example)
+    # Layer cam
+    layer_cam = LayerCam(pretrained_model, target_layer=9)
+    # Generate cam mask
+    cam = layer_cam.generate_cam(prep_img, target_class)
+    # Save mask
+    save_class_activation_images(original_image, cam, file_name_to_export)
+    print('Layer cam completed')