sparse_transformers/src/activation_capture.py at 0f17b8e3fde8a9d946f743d2df0c19b3d0147075 · NimbleEdge/sparse_transformers · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

from enum import Enum
from typing import List

class Hook(Enum):
    IN = "IN"
    ACT = "ACT"
    UP = "UP"
    OUT = "OUT"


class ActivationCapture():
    """Helper class to capture activations from model layers."""
    hooks_available: List[Hook] = [Hook.IN, Hook.ACT, Hook.UP, Hook.OUT]

    def __init__(self, model):
        self.model = model
        self.mlp_activations = {
            hook: {} for hook in self.hooks_available
        }
        self.handles = []

    def _register_in_hook(self, layer_idx, layer):
        def hook(module, input, output):
            # Just detach, don't clone or move to CPU yet
            self.mlp_activations[Hook.IN][layer_idx] = input[0].clone().detach()
            return output
        handle = layer.mlp.register_forward_hook(hook)
        return handle

    def _register_act_hook(self, layer_idx, layer):
        def hook(module, input, output):
            # Just detach, don't clone or move to CPU yet
            self.mlp_activations[Hook.ACT][layer_idx] = input[0].clone().detach()
            return output
        handle = layer.mlp.act_fn.register_forward_hook(hook)
        return handle

    def _register_up_hook(self, layer_idx, layer):
        def hook(module, input, output):
            # Just detach, don't clone or move to CPU yet
            self.mlp_activations[Hook.UP][layer_idx] = input[0].clone().detach()
            return output
        handle = layer.mlp.down_proj.register_forward_hook(hook)
        return handle

    def _register_out_hook(self, layer_idx, layer):
        def hook(module, input, output):
            # Just detach, don't clone or move to CPU yet
            self.mlp_activations[Hook.OUT][layer_idx] = output.clone().detach()
            return output
        handle = layer.mlp.register_forward_hook(hook)
        return handle

    def get_layers(self):
        return self.model.get_decoder().layers

    def register_hooks(self, hooks=(Hook.ACT, Hook.UP, Hook.OUT)):
        """Register forward hooks to capture activations."""
        # Clear any existing hooks
        self.remove_hooks()

        # Hook into each transformer layer
        for i, layer in enumerate(self.get_layers()):
            # Hooks capturing inputs to the MLP layer
            if Hook.IN in hooks and Hook.IN in self.hooks_available:
                handle = self._register_in_hook(i, layer)
                if handle is not None:
                    self.handles.append(handle)

            # Hooks capturing inputs to the activation function
            if Hook.ACT in hooks and Hook.ACT in self.hooks_available:
                handle = self._register_act_hook(i, layer)
                if handle is not None:
                    self.handles.append(handle)

            # Hooks capturing inputs to the down projection
            if Hook.UP in hooks and Hook.UP in self.hooks_available:
                handle = self._register_up_hook(i, layer)
                if handle is not None:
                    self.handles.append(handle)

            # Hooks capturing the final MLP output
            if Hook.OUT in hooks and Hook.OUT in self.hooks_available:
                handle = self._register_out_hook(i, layer)
                if handle is not None:
                    self.handles.append(handle)


    def remove_hooks(self):
        """Remove all registered hooks."""
        for handle in self.handles:
            handle.remove()
        self.handles = []

    def clear_captures(self):
        """Clear captured activations."""
        self.mlp_activations = {
            hook: {} for hook in self.hooks_available
        }