diff --git a/pyproject.toml b/pyproject.toml
index 0fd085292..f0ae899ea 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -11,6 +11,7 @@
         "jaxtyping>=0.2.11",
         "numpy>=1.24; python_version >= '3.10' and python_version < '3.12'",
         "numpy>=1.26; python_version >= '3.12' and python_version < '3.13'",
+        "packaging>=23.0",
         "pandas>=1.1.5",
         "protobuf>=3.20.0",
         "rich>=12.6.0",
@@ -18,7 +19,7 @@
         "torch>=2.6",
         "tqdm>=4.64.1",
         "transformers-stream-generator>=0.0.5,<0.1",
-        "transformers>=4.56",
+        "transformers>=5.4.0",
         "typeguard>=4.2,<5",
         "typing-extensions",
         "wandb>=0.13.5",
@@ -36,7 +37,6 @@
         # whenever chardet>=6 is installed. Remove the pin when psf/requests bumps the cap.
         evals=["lm-eval>=0.4", "chardet<6"]
         lit=["lit-nlp>=1.3"]
-        qwen35=["packaging>=23.0", "transformers>=5.2.0"]
 
     [project.scripts]
         build-docs="docs.make_docs:build_docs"
diff --git a/tests/unit/components/test_attention.py b/tests/unit/components/test_attention.py
index 670b5315e..799559cfd 100644
--- a/tests/unit/components/test_attention.py
+++ b/tests/unit/components/test_attention.py
@@ -64,7 +64,7 @@ def test_attention_load_in_4bit():
     assert attn.cfg.n_ctx == 1024
     assert attn.cfg.d_head == 64
     assert attn.cfg.n_heads == 8
-    assert attn.cfg.load_in_4bit == False
+    assert attn.cfg.load_in_4bit == True
     assert attn.cfg.dtype == torch.float32
     assert attn.cfg.act_fn == "relu"
 
diff --git a/tests/unit/model_bridge/supported_architectures/test_gemma1_adapter.py b/tests/unit/model_bridge/supported_architectures/test_gemma1_adapter.py
new file mode 100644
index 000000000..0426a1a42
--- /dev/null
+++ b/tests/unit/model_bridge/supported_architectures/test_gemma1_adapter.py
@@ -0,0 +1,39 @@
+"""Unit tests for Gemma1ArchitectureAdapter.
+
+Mirrors test_gemma2_adapter.py: GemmaTextScaledWordEmbedding scales internally,
+so the adapter must NOT override setup_hook_compatibility (an override that
+installed a hook_conversion would double-scale embed.hook_out).
+"""
+
+import pytest
+
+from transformer_lens.config.transformer_bridge_config import TransformerBridgeConfig
+from transformer_lens.model_bridge.supported_architectures.gemma1 import (
+    Gemma1ArchitectureAdapter,
+)
+
+
+def _make_cfg(d_model: int = 32) -> TransformerBridgeConfig:
+    return TransformerBridgeConfig(
+        d_model=d_model,
+        d_head=d_model // 4,
+        n_layers=2,
+        n_ctx=128,
+        n_heads=4,
+        d_vocab=256,
+        d_mlp=64,
+        architecture="GemmaForCausalLM",
+    )
+
+
+@pytest.fixture(scope="module")
+def adapter() -> Gemma1ArchitectureAdapter:
+    return Gemma1ArchitectureAdapter(_make_cfg())
+
+
+class TestGemma1HookCompatibility:
+    def test_adapter_does_not_override_setup_hook_compatibility(
+        self, adapter: Gemma1ArchitectureAdapter
+    ) -> None:
+        # bridge.py:763 uses hasattr() to decide whether to call the override.
+        assert "setup_hook_compatibility" not in vars(type(adapter))
diff --git a/tests/unit/model_bridge/supported_architectures/test_gemma2_adapter.py b/tests/unit/model_bridge/supported_architectures/test_gemma2_adapter.py
new file mode 100644
index 000000000..00d1bee61
--- /dev/null
+++ b/tests/unit/model_bridge/supported_architectures/test_gemma2_adapter.py
@@ -0,0 +1,78 @@
+"""Unit tests for Gemma2ArchitectureAdapter.
+
+Post-fix invariant: the adapter MUST NOT override setup_hook_compatibility.
+Gemma2TextScaledWordEmbedding scales by sqrt(d_model) inside its own forward(),
+so the bridge's wrapped layer already returns the scaled value. An override
+that installed a hook_conversion would double-scale (cache R * d_model instead
+of R * sqrt(d_model)) — the dev-4.x vLLM-comparison investigation surfaced this.
+"""
+
+import os
+
+import pytest
+import torch
+
+from transformer_lens.config.transformer_bridge_config import TransformerBridgeConfig
+from transformer_lens.model_bridge.supported_architectures.gemma2 import (
+    Gemma2ArchitectureAdapter,
+)
+
+
+def _make_cfg(d_model: int = 32) -> TransformerBridgeConfig:
+    return TransformerBridgeConfig(
+        d_model=d_model,
+        d_head=d_model // 4,
+        n_layers=2,
+        n_ctx=128,
+        n_heads=4,
+        d_vocab=256,
+        d_mlp=64,
+        architecture="Gemma2ForCausalLM",
+    )
+
+
+@pytest.fixture(scope="module")
+def adapter() -> Gemma2ArchitectureAdapter:
+    return Gemma2ArchitectureAdapter(_make_cfg())
+
+
+class TestGemma2HookCompatibility:
+    def test_adapter_does_not_override_setup_hook_compatibility(
+        self, adapter: Gemma2ArchitectureAdapter
+    ) -> None:
+        # bridge.py:763 uses hasattr() to decide whether to call the override.
+        # Absence is the contract — the base ArchitectureAdapter has no such
+        # method, so the bridge skips installation entirely.
+        assert "setup_hook_compatibility" not in vars(type(adapter))
+
+
+@pytest.mark.skipif(bool(os.getenv("CI")), reason="Network/disk fetch of tiny Gemma2 — skip in CI")
+def test_gemma2_embed_hook_out_magnitude_matches_sqrt_d_model_scaling():
+    """End-to-end regression for the embed double-scale bug.
+
+    Before the fix: embed.hook_out held R * d_model (double-scaled).
+    After:         embed.hook_out holds R * sqrt(d_model) — i.e. exactly what
+                   Gemma2TextScaledWordEmbedding.forward returns and what flows
+                   into block 0.
+    """
+    import torch.nn.functional as F
+
+    from transformer_lens.model_bridge import TransformerBridge
+
+    bridge = TransformerBridge.boot_transformers(
+        "hf-internal-testing/tiny-random-Gemma2ForCausalLM",
+        dtype=torch.float32,
+        device="cpu",
+    )
+    assert bridge.embed.hook_out.hook_conversion is None
+
+    tokens = torch.tensor([[1, 2, 3, 4]])
+    raw_R = F.embedding(tokens, bridge.embed.original_component.weight)
+    scaled_direct = bridge.embed.original_component(tokens)
+    _, cache = bridge.run_with_cache(tokens)
+
+    # embed.hook_out should equal the ScaledWordEmbedding's actual output
+    assert torch.allclose(cache["embed.hook_out"], scaled_direct, atol=1e-6)
+    # And the ratio to the raw lookup is sqrt(d_model), not d_model
+    ratio = cache["embed.hook_out"].abs().max().item() / raw_R.abs().max().item()
+    assert ratio == pytest.approx(bridge.cfg.d_model**0.5, rel=1e-4)
diff --git a/tests/unit/model_bridge/supported_architectures/test_xglm_adapter.py b/tests/unit/model_bridge/supported_architectures/test_xglm_adapter.py
index 62b1d3733..21b5e6fef 100644
--- a/tests/unit/model_bridge/supported_architectures/test_xglm_adapter.py
+++ b/tests/unit/model_bridge/supported_architectures/test_xglm_adapter.py
@@ -1,10 +1,6 @@
 """Unit tests for XGLMArchitectureAdapter: cfg, components, weight conversions, hook compat, factory."""
 
-import math
-from types import SimpleNamespace
-
 import pytest
-import torch
 
 from transformer_lens.config import TransformerBridgeConfig
 from transformer_lens.conversion_utils.conversion_steps import RearrangeTensorConversion
@@ -191,44 +187,15 @@ def test_mlp_out_name(self, adapter: XGLMArchitectureAdapter) -> None:
         assert mlp.submodules["out"].name == "fc2"
 
 
-def _make_mock_bridge() -> SimpleNamespace:
-    """Minimal mock bridge with embed.hook_out for hook-compat tests."""
-    hook_out = SimpleNamespace(hook_conversion=None)
-    embed = SimpleNamespace(hook_out=hook_out)
-    return SimpleNamespace(embed=embed)
-
-
 class TestXGLMAdapterHookCompatibility:
-    """setup_hook_compatibility attaches a scale conversion to hook_embed."""
-
-    def test_sets_hook_conversion_on_embed_hook_out(self, adapter: XGLMArchitectureAdapter) -> None:
-        bridge = _make_mock_bridge()
-        adapter.setup_hook_compatibility(bridge)
-        assert bridge.embed.hook_out.hook_conversion is not None
-
-    def test_scales_by_sqrt_d_model(self, adapter: XGLMArchitectureAdapter) -> None:
-        bridge = _make_mock_bridge()
-        adapter.setup_hook_compatibility(bridge)
-        conv = bridge.embed.hook_out.hook_conversion
-        x = torch.ones(2, 4, 64)
-        result = conv.handle_conversion(x)
-        expected_scale = math.sqrt(64)
-        assert torch.allclose(result, x * expected_scale, atol=1e-6)
-
-    def test_revert_inverts_scale(self, adapter: XGLMArchitectureAdapter) -> None:
-        bridge = _make_mock_bridge()
-        adapter.setup_hook_compatibility(bridge)
-        conv = bridge.embed.hook_out.hook_conversion
-        x = torch.randn(2, 4, 64)
-        assert torch.allclose(conv.revert(conv.handle_conversion(x)), x, atol=1e-6)
-
-    def test_no_error_when_embed_missing(self, adapter: XGLMArchitectureAdapter) -> None:
-        bridge = SimpleNamespace()
-        adapter.setup_hook_compatibility(bridge)
-
-    def test_no_error_when_hook_out_missing(self, adapter: XGLMArchitectureAdapter) -> None:
-        bridge = SimpleNamespace(embed=SimpleNamespace())
-        adapter.setup_hook_compatibility(bridge)
+    """Adapter must not override setup_hook_compatibility — XGLMScaledWordEmbedding
+    scales internally, so any override would double-scale embed.hook_out."""
+
+    def test_adapter_does_not_override_setup_hook_compatibility(
+        self, adapter: XGLMArchitectureAdapter
+    ) -> None:
+        # bridge.py:763 uses hasattr() to decide whether to call the override.
+        assert "setup_hook_compatibility" not in vars(type(adapter))
 
 
 class TestXGLMFactoryRegistration:
diff --git a/transformer_lens/model_bridge/supported_architectures/gemma1.py b/transformer_lens/model_bridge/supported_architectures/gemma1.py
index 40d3692ff..63bdab124 100644
--- a/transformer_lens/model_bridge/supported_architectures/gemma1.py
+++ b/transformer_lens/model_bridge/supported_architectures/gemma1.py
@@ -48,11 +48,12 @@ def __init__(self, cfg: Any) -> None:
         self.cfg.rmsnorm_uses_offset = True
 
         self.weight_processing_conversions = {
-            # NOTE: Gemma1 scales embeddings by sqrt(d_model) at RUNTIME in
-            # GemmaModel.forward(). We must NOT pre-scale embed weights here
-            # because that would cause double-scaling (pre-scale + runtime).
-            # The runtime hook_conversion in setup_hook_compatibility() handles
-            # scaling the hook output so it matches HookedTransformer's behavior.
+            # NOTE: Gemma1 scales embeddings by sqrt(d_model) at RUNTIME inside
+            # GemmaTextScaledWordEmbedding.forward() (HF transformers >= 5.0).
+            # That layer is what bridge.embed wraps, so embed.hook_out already
+            # captures the scaled value — matching HookedTransformer's hook_embed
+            # (which uses pre-scaled W_E). We must NOT pre-scale weights here and
+            # we must NOT install a runtime hook_conversion that re-scales.
             #
             # Attention weight conversions
             **self._qkvo_weight_conversions(),
@@ -118,40 +119,6 @@ def __init__(self, cfg: Any) -> None:
             "unembed": UnembeddingBridge(name="lm_head"),
         }
 
-    def setup_hook_compatibility(self, bridge: Any) -> None:
-        """Setup hook compatibility for Gemma1 models.
-
-        Gemma1 scales embeddings by sqrt(d_model) in its forward pass,
-        but the HuggingFace embed_tokens layer doesn't include this scaling.
-        We need to apply it to hook_embed to match HookedTransformer behavior.
-
-        Args:
-            bridge: The TransformerBridge instance
-        """
-        from transformer_lens.conversion_utils.conversion_steps.base_tensor_conversion import (
-            BaseTensorConversion,
-        )
-
-        class EmbeddingScaleConversion(BaseTensorConversion):
-            """Scale embeddings by sqrt(d_model) for Gemma models."""
-
-            def __init__(self, scale: float):
-                super().__init__()
-                self.scale = scale
-
-            def handle_conversion(self, input_value: Any, *full_context: Any) -> Any:
-                """Scale the embedding output."""
-                return input_value * self.scale
-
-            def revert(self, input_value: Any, *full_context: Any) -> Any:
-                """Unscale the embedding output (for user modifications)."""
-                return input_value / self.scale
-
-        # Apply scaling to embed.hook_out
-        if hasattr(bridge, "embed") and hasattr(bridge.embed, "hook_out"):
-            scale_factor = self.cfg.d_model**0.5
-            bridge.embed.hook_out.hook_conversion = EmbeddingScaleConversion(scale_factor)
-
     def setup_component_testing(self, hf_model: Any, bridge_model: Any = None) -> None:
         """Set up rotary embedding references for Gemma1 component testing.
 
diff --git a/transformer_lens/model_bridge/supported_architectures/gemma2.py b/transformer_lens/model_bridge/supported_architectures/gemma2.py
index 163a1ddac..719ead0e5 100644
--- a/transformer_lens/model_bridge/supported_architectures/gemma2.py
+++ b/transformer_lens/model_bridge/supported_architectures/gemma2.py
@@ -1,9 +1,6 @@
 """Gemma2 architecture adapter."""
 
-from typing import TYPE_CHECKING, Any
-
-if TYPE_CHECKING:
-    pass
+from typing import Any
 
 from transformer_lens.conversion_utils.conversion_steps import (
     ArithmeticTensorConversion,
@@ -60,11 +57,12 @@ def __init__(self, cfg: Any) -> None:
         # by map_default_transformer_lens_config() in sources/transformers.py
 
         self.weight_processing_conversions = {
-            # NOTE: Gemma2 scales embeddings by sqrt(d_model) at RUNTIME in
-            # Gemma2Model.forward(). We must NOT pre-scale embed weights here
-            # because that would cause double-scaling (pre-scale + runtime).
-            # The runtime hook_conversion in setup_hook_compatibility() handles
-            # scaling the hook output so it matches HookedTransformer's behavior.
+            # NOTE: Gemma2 scales embeddings by sqrt(d_model) at RUNTIME inside
+            # Gemma2TextScaledWordEmbedding.forward() (HF transformers >= 5.0).
+            # That layer is what bridge.embed wraps, so embed.hook_out already
+            # captures the scaled value — matching HookedTransformer's hook_embed
+            # (which uses pre-scaled W_E). We must NOT pre-scale weights here and
+            # we must NOT install a runtime hook_conversion that re-scales.
             "blocks.{i}.attn.q.weight": ParamProcessingConversion(
                 tensor_conversion=RearrangeTensorConversion("(n h) m -> n m h", n=self.cfg.n_heads),
             ),
@@ -162,24 +160,6 @@ def __init__(self, cfg: Any) -> None:
             "unembed": UnembeddingBridge(name="lm_head", config=self.cfg),
         }
 
-    def setup_hook_compatibility(self, bridge: Any) -> None:
-        """Setup hook compatibility for Gemma2 models.
-
-        Gemma2 scales embeddings by sqrt(d_model). The weights are pre-scaled via
-        preprocess_weights(), but we still need to apply the scaling conversion to
-        the hook output for proper hook functionality (so user modifications are
-        correctly scaled/unscaled).
-
-        Args:
-            bridge: The TransformerBridge instance
-        """
-        # Apply embedding scaling conversion to hook output
-        if hasattr(bridge, "embed") and hasattr(bridge.embed, "hook_out"):
-            scale_factor = self.cfg.d_model**0.5
-            bridge.embed.hook_out.hook_conversion = ArithmeticTensorConversion(
-                OperationTypes.MULTIPLICATION, scale_factor
-            )
-
     def setup_component_testing(self, hf_model: Any, bridge_model: Any = None) -> None:
         """Set up rotary embedding references and attention implementation for Gemma-2 component testing.
 
diff --git a/transformer_lens/model_bridge/supported_architectures/gemma3.py b/transformer_lens/model_bridge/supported_architectures/gemma3.py
index 0c325fbaa..8c3e48b59 100644
--- a/transformer_lens/model_bridge/supported_architectures/gemma3.py
+++ b/transformer_lens/model_bridge/supported_architectures/gemma3.py
@@ -52,10 +52,10 @@ def __init__(self, cfg: Any) -> None:
         self.cfg.attn_implementation = "eager"
 
         self.weight_processing_conversions = {
-            # Note: Gemma3 scales embeddings by sqrt(d_model) in the forward pass.
-            # This is handled in setup_hook_compatibility() which applies the scaling
-            # to hook_embed output at runtime, matching HuggingFace's behavior.
-            # We do NOT scale the stored weights here.
+            # Note: Gemma3TextScaledWordEmbedding scales by sqrt(d_model) inside
+            # its own forward(). Bridge.embed wraps that layer, so embed.hook_out
+            # already captures the scaled value — no weight pre-scaling and no
+            # hook_conversion needed (setup_hook_compatibility is a no-op).
             #
             # Q/K/V weight conversions
             "blocks.{i}.attn.q.weight": ParamProcessingConversion(
@@ -171,24 +171,6 @@ def __init__(self, cfg: Any) -> None:
             "unembed": UnembeddingBridge(name="lm_head"),
         }
 
-    def setup_hook_compatibility(self, bridge: Any) -> None:
-        """Setup hook compatibility for Gemma3 models.
-
-        Unlike Gemma1/Gemma2, Gemma3 uses Gemma3TextScaledWordEmbedding which
-        scales embeddings by sqrt(d_model) INSIDE the embedding layer's forward().
-        Therefore we do NOT need a hook_conversion — the embed.hook_out already
-        captures the scaled output. Adding a conversion would double-scale.
-
-        (Gemma1/Gemma2 scale in GemmaModel.forward() AFTER the embedding layer,
-        so their adapters correctly use EmbeddingScaleConversion to match HT.)
-
-        Args:
-            bridge: The TransformerBridge instance
-        """
-        # No embed scaling conversion needed — Gemma3TextScaledWordEmbedding
-        # already applies sqrt(d_model) scaling in its forward() method.
-        pass
-
     def setup_component_testing(self, hf_model: Any, bridge_model: Any = None) -> None:
         """Set up rotary embedding references and native autograd for Gemma-3 component testing.
 
diff --git a/transformer_lens/model_bridge/supported_architectures/gemma3_multimodal.py b/transformer_lens/model_bridge/supported_architectures/gemma3_multimodal.py
index 928186f4b..a0c6d09ee 100644
--- a/transformer_lens/model_bridge/supported_architectures/gemma3_multimodal.py
+++ b/transformer_lens/model_bridge/supported_architectures/gemma3_multimodal.py
@@ -184,19 +184,6 @@ def __init__(self, cfg: Any) -> None:
             "unembed": UnembeddingBridge(name="lm_head"),
         }
 
-    def setup_hook_compatibility(self, bridge: Any) -> None:
-        """Setup hook compatibility for Gemma3 multimodal models.
-
-        Like text-only Gemma 3, the multimodal model uses
-        Gemma3TextScaledWordEmbedding which scales embeddings by sqrt(d_model)
-        internally in its forward() method. No additional hook conversion is
-        needed — adding one would double-scale the embeddings.
-
-        Args:
-            bridge: The TransformerBridge instance
-        """
-        pass
-
     def setup_component_testing(self, hf_model: Any, bridge_model: Any = None) -> None:
         """Set up rotary embedding references for Gemma-3 multimodal component testing.
 
diff --git a/transformer_lens/model_bridge/supported_architectures/xglm.py b/transformer_lens/model_bridge/supported_architectures/xglm.py
index c2f839b55..d90a58107 100644
--- a/transformer_lens/model_bridge/supported_architectures/xglm.py
+++ b/transformer_lens/model_bridge/supported_architectures/xglm.py
@@ -104,32 +104,3 @@ def __init__(self, cfg: Any) -> None:
             ),
             "unembed": UnembeddingBridge(name="lm_head"),
         }
-
-    def setup_hook_compatibility(self, bridge: Any) -> None:
-        """Scale hook_embed by sqrt(d_model) to match XGLMScaledWordEmbedding.forward().
-
-        XGLMScaledWordEmbedding multiplies the embedding lookup by embed_scale =
-        sqrt(d_model) at runtime.  Without this override, hook_embed would capture
-        the raw (unscaled) table output, diverging from actual model activations.
-        """
-        from transformer_lens.conversion_utils.conversion_steps.base_tensor_conversion import (
-            BaseTensorConversion,
-        )
-
-        class EmbeddingScaleConversion(BaseTensorConversion):
-            """Scale embeddings by sqrt(d_model) for XGLM models."""
-
-            def __init__(self, scale: float) -> None:
-                super().__init__()
-                self.scale = scale
-
-            def handle_conversion(self, input_value: Any, *full_context: Any) -> Any:
-                return input_value * self.scale
-
-            def revert(self, input_value: Any, *full_context: Any) -> Any:
-                return input_value / self.scale
-
-        if hasattr(bridge, "embed") and hasattr(bridge.embed, "hook_out"):
-            bridge.embed.hook_out.hook_conversion = EmbeddingScaleConversion(
-                self.cfg.d_model**0.5
-            )
diff --git a/transformer_lens/tools/model_registry/data/supported_models.json b/transformer_lens/tools/model_registry/data/supported_models.json
index 61a3f869f..f865cb180 100644
--- a/transformer_lens/tools/model_registry/data/supported_models.json
+++ b/transformer_lens/tools/model_registry/data/supported_models.json
@@ -8,7 +8,7 @@
   },
   "total_architectures": 52,
   "total_models": 11249,
-  "total_verified": 725,
+  "total_verified": 729,
   "models": [
     {
       "architecture_id": "MistralForCausalLM",
@@ -87547,34 +87547,34 @@
     {
       "architecture_id": "XGLMForCausalLM",
       "model_id": "facebook/xglm-1.7B",
-      "status": 0,
-      "verified_date": null,
+      "status": 1,
+      "verified_date": "2026-05-19",
       "metadata": {
         "downloads": 3061,
         "total_params": null
       },
-      "note": null,
-      "phase1_score": null,
-      "phase2_score": null,
-      "phase3_score": null,
-      "phase4_score": null,
+      "note": "Full verification completed",
+      "phase1_score": 100.0,
+      "phase2_score": 100.0,
+      "phase3_score": 100.0,
+      "phase4_score": 99.0,
       "phase7_score": null,
       "phase8_score": null
     },
     {
       "architecture_id": "XGLMForCausalLM",
       "model_id": "facebook/xglm-2.9B",
-      "status": 0,
-      "verified_date": null,
+      "status": 1,
+      "verified_date": "2026-05-19",
       "metadata": {
         "downloads": 2352,
         "total_params": null
       },
-      "note": null,
-      "phase1_score": null,
-      "phase2_score": null,
-      "phase3_score": null,
-      "phase4_score": null,
+      "note": "Full verification completed",
+      "phase1_score": 100.0,
+      "phase2_score": 100.0,
+      "phase3_score": 100.0,
+      "phase4_score": 98.7,
       "phase7_score": null,
       "phase8_score": null
     },
@@ -87598,8 +87598,8 @@
     {
       "architecture_id": "XGLMForCausalLM",
       "model_id": "facebook/xglm-564M",
-      "status": 0,
-      "verified_date": null,
+      "status": 1,
+      "verified_date": "2026-05-19",
       "metadata": {
         "downloads": 168586,
         "total_params": null
@@ -92685,13 +92685,13 @@
       "architecture_id": "Gemma2ForCausalLM",
       "model_id": "google/gemma-2-2b",
       "status": 1,
-      "verified_date": "2026-02-22",
+      "verified_date": "2026-05-19",
       "metadata": null,
-      "note": "Full verification completed with issues: P3=81.0% (failed: logits_equivalence, loss_equivalence, forward_hooks, backward_hooks)",
+      "note": "Full verification completed with issues: P3=95.5% (failed: unembed_centering)",
       "phase1_score": 100.0,
       "phase2_score": 100.0,
-      "phase3_score": 81.0,
-      "phase4_score": 92.8,
+      "phase3_score": 95.5,
+      "phase4_score": 98.8,
       "phase7_score": null,
       "phase8_score": null
     },
@@ -92699,12 +92699,12 @@
       "architecture_id": "Gemma2ForCausalLM",
       "model_id": "google/gemma-2-2b-it",
       "status": 1,
-      "verified_date": "2026-03-30",
+      "verified_date": "2026-05-19",
       "metadata": null,
-      "note": "Full verification completed with issues: P3=95.2% (failed: unembed_centering)",
+      "note": "Full verification completed with issues: P3=95.5% (failed: unembed_centering)",
       "phase1_score": 100.0,
       "phase2_score": 100.0,
-      "phase3_score": 95.2,
+      "phase3_score": 95.5,
       "phase4_score": 100.0,
       "phase7_score": null,
       "phase8_score": null
@@ -92727,13 +92727,13 @@
       "architecture_id": "Gemma2ForCausalLM",
       "model_id": "google/gemma-2-9b",
       "status": 1,
-      "verified_date": "2026-03-17",
+      "verified_date": "2026-05-19",
       "metadata": null,
-      "note": "Core verification completed",
+      "note": "Full verification completed with issues: P3=95.5% (failed: unembed_centering)",
       "phase1_score": 100.0,
-      "phase2_score": null,
-      "phase3_score": null,
-      "phase4_score": 94.5,
+      "phase2_score": 100.0,
+      "phase3_score": 95.5,
+      "phase4_score": 93.9,
       "phase7_score": null,
       "phase8_score": null
     },
@@ -92755,7 +92755,7 @@
       "architecture_id": "GemmaForCausalLM",
       "model_id": "google/gemma-2b",
       "status": 1,
-      "verified_date": "2026-03-30",
+      "verified_date": "2026-05-19",
       "metadata": null,
       "note": "Full verification completed",
       "phase1_score": 100.0,
@@ -92797,12 +92797,12 @@
       "architecture_id": "GemmaForCausalLM",
       "model_id": "google/gemma-2b-it",
       "status": 1,
-      "verified_date": "2026-03-10",
+      "verified_date": "2026-05-19",
       "metadata": null,
-      "note": "Config unavailable: Gated repo (google/gemma-2b-it)",
+      "note": "Full verification completed",
       "phase1_score": 100.0,
-      "phase2_score": 92.9,
-      "phase3_score": 90.5,
+      "phase2_score": 100.0,
+      "phase3_score": 100.0,
       "phase4_score": 92.6,
       "phase7_score": null,
       "phase8_score": null
@@ -93069,13 +93069,13 @@
       "architecture_id": "GemmaForCausalLM",
       "model_id": "google/gemma-7b",
       "status": 1,
-      "verified_date": "2026-02-25",
+      "verified_date": "2026-05-19",
       "metadata": null,
-      "note": "Core verification completed",
+      "note": "Full verification completed with issues: P2=93.3% (failed: backward_hooks)",
       "phase1_score": 100.0,
-      "phase2_score": null,
-      "phase3_score": null,
-      "phase4_score": 99.4,
+      "phase2_score": 93.3,
+      "phase3_score": 100.0,
+      "phase4_score": 97.2,
       "phase7_score": null,
       "phase8_score": null
     },
@@ -93111,11 +93111,11 @@
       "architecture_id": "GemmaForCausalLM",
       "model_id": "google/gemma-7b-it",
       "status": 1,
-      "verified_date": "2026-03-30",
+      "verified_date": "2026-05-19",
       "metadata": null,
-      "note": "Full verification completed with issues: P2=92.9% (failed: backward_hooks)",
+      "note": "Full verification completed with issues: P2=93.3% (failed: backward_hooks)",
       "phase1_score": 100.0,
-      "phase2_score": 92.9,
+      "phase2_score": 93.3,
       "phase3_score": 100.0,
       "phase4_score": 93.4,
       "phase7_score": null,
@@ -98519,17 +98519,17 @@
     {
       "architecture_id": "XGLMForCausalLM",
       "model_id": "hf-tiny-model-private/tiny-random-XGLMForCausalLM",
-      "status": 0,
-      "verified_date": null,
+      "status": 1,
+      "verified_date": "2026-05-19",
       "metadata": {
         "downloads": 1969,
         "total_params": null
       },
-      "note": null,
-      "phase1_score": null,
-      "phase2_score": null,
-      "phase3_score": null,
-      "phase4_score": null,
+      "note": "Full verification completed",
+      "phase1_score": 100.0,
+      "phase2_score": 100.0,
+      "phase3_score": 100.0,
+      "phase4_score": 86.8,
       "phase7_score": null,
       "phase8_score": null
     },
@@ -156054,4 +156054,4 @@
       "phase8_score": null
     }
   ]
-}
\ No newline at end of file
+}
diff --git a/transformer_lens/tools/model_registry/data/verification_history.json b/transformer_lens/tools/model_registry/data/verification_history.json
index d6dd1bada..32aaad603 100644
--- a/transformer_lens/tools/model_registry/data/verification_history.json
+++ b/transformer_lens/tools/model_registry/data/verification_history.json
@@ -1,5 +1,5 @@
 {
-  "last_updated": "2026-05-08T10:35:57.497430",
+  "last_updated": "2026-05-19T15:11:14.577399",
   "records": [
     {
       "model_id": "Macropodus/macbert4mdcspell_v1",
@@ -12030,6 +12030,116 @@
       "notes": "Full verification completed",
       "invalidated": false,
       "invalidation_reason": null
+    },
+    {
+      "model_id": "google/gemma-2b",
+      "architecture_id": "GemmaForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "google/gemma-2b-it",
+      "architecture_id": "GemmaForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "google/gemma-7b",
+      "architecture_id": "GemmaForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed with issues: P2=93.3% (failed: backward_hooks)",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "google/gemma-7b-it",
+      "architecture_id": "GemmaForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed with issues: P2=93.3% (failed: backward_hooks)",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "google/gemma-2-2b",
+      "architecture_id": "Gemma2ForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed with issues: P3=95.5% (failed: unembed_centering)",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "google/gemma-2-2b-it",
+      "architecture_id": "Gemma2ForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed with issues: P3=95.5% (failed: unembed_centering)",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "google/gemma-2-9b",
+      "architecture_id": "Gemma2ForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed with issues: P3=95.5% (failed: unembed_centering)",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "facebook/xglm-564M",
+      "architecture_id": "XGLMForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "hf-tiny-model-private/tiny-random-XGLMForCausalLM",
+      "architecture_id": "XGLMForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "facebook/xglm-1.7B",
+      "architecture_id": "XGLMForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed",
+      "invalidated": false,
+      "invalidation_reason": null
+    },
+    {
+      "model_id": "facebook/xglm-2.9B",
+      "architecture_id": "XGLMForCausalLM",
+      "verified_date": "2026-05-19",
+      "verified_by": "verify_models",
+      "transformerlens_version": null,
+      "notes": "Full verification completed",
+      "invalidated": false,
+      "invalidation_reason": null
     }
   ]
 }
diff --git a/uv.lock b/uv.lock
index 1fd85adf4..a0bb02a8b 100644
--- a/uv.lock
+++ b/uv.lock
@@ -6404,6 +6404,7 @@ dependencies = [
     { name = "huggingface-hub" },
     { name = "jaxtyping" },
     { name = "numpy", marker = "python_full_version < '3.13'" },
+    { name = "packaging" },
     { name = "pandas" },
     { name = "protobuf" },
     { name = "rich" },
@@ -6425,10 +6426,6 @@ evals = [
 lit = [
     { name = "lit-nlp" },
 ]
-qwen35 = [
-    { name = "packaging" },
-    { name = "transformers" },
-]
 
 [package.dev-dependencies]
 demo = [
@@ -6489,21 +6486,20 @@ requires-dist = [
     { name = "lm-eval", marker = "extra == 'evals'", specifier = ">=0.4" },
     { name = "numpy", marker = "python_full_version >= '3.10' and python_full_version < '3.12'", specifier = ">=1.24" },
     { name = "numpy", marker = "python_full_version == '3.12.*'", specifier = ">=1.26" },
+    { name = "packaging", specifier = ">=23.0" },
     { name = "pandas", specifier = ">=1.1.5" },
-    { name = "packaging", marker = "extra == 'qwen35'", specifier = ">=23.0" },
     { name = "protobuf", specifier = ">=3.20.0" },
     { name = "rich", specifier = ">=12.6.0" },
     { name = "sentencepiece" },
     { name = "torch", specifier = ">=2.6" },
     { name = "tqdm", specifier = ">=4.64.1" },
-    { name = "transformers", specifier = ">=4.56" },
-    { name = "transformers", marker = "extra == 'qwen35'", specifier = ">=5.2.0" },
+    { name = "transformers", specifier = ">=5.4.0" },
     { name = "transformers-stream-generator", specifier = ">=0.0.5,<0.1" },
     { name = "typeguard", specifier = ">=4.2,<5" },
     { name = "typing-extensions" },
     { name = "wandb", specifier = ">=0.13.5" },
 ]
-provides-extras = ["evals", "lit", "qwen35"]
+provides-extras = ["evals", "lit"]
 
 [package.metadata.requires-dev]
 demo = [