Bbq support by akhauriyash · Pull Request #5 · LLM360/Megatron-LM

akhauriyash · 2026-05-20T17:33:54Z

Summary

Adds an opt-in Megatron-LM RoPE path for xLLM checkpoints that use partial RoPE with the HF/SGLang head-dimension layout.

Why

For xLLM 375B, rope_head_dim=64 and head_dim=128. Megatron’s standard rotary_percent=0.5 path rotates the first contiguous 64 head dims, while the xLLM HF/SGLang implementation applies RoPE after converting through the xLLM head layout. This mismatch can produce large trainer-vs-rollout logprob differences.

Changes

Add --xllm-partial-rope-layout
Add TransformerConfig.xllm_partial_rope_layout
Route unfused RoPE through an xLLM-specific partial-RoPE layout path when enabled
Disable fused RoPE for this opt-in path

Scope

The new behavior is disabled by default. Existing Megatron RoPE behavior is unchanged unless --xllm-partial-rope-layout is passed.

Validation

python3 -m py_compile megatron/core/models/common/embeddings/rope_utils.py megatron/core/transformer/transformer_config.py megatron/training/arguments.py
git diff --check

…ansformer_config.py: adds layernorm_num_groups, exposed as --layernorm-num-groups. - Megatron-LM/megatron/core/transformer/torch_norm.py: adds native GroupRMSNorm. - Megatron-LM/megatron/core/extensions/transformer_engine.py: makes TENorm return GroupRMSNorm when groups > 1. - Megatron-LM/megatron/core/extensions/transformer_engine_spec_provider.py and Megatron-LM/ megatron/core/models/gpt/gpt_layer_specs.py: disable TE fused LN+linear when grouped RMSNorm is used and add the checkpoint key mapping for unfused norms.

akhauriyash added 4 commits May 19, 2026 20:56

8b support

fa5f026

Add xLLM partial RoPE layout support

b3a025a

Avoid duplicate xLLM partial RoPE CLI registration

e534d16

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Bbq support#5

Bbq support#5
akhauriyash wants to merge 4 commits into
prodfrom
bbq_support

akhauriyash commented May 20, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

akhauriyash commented May 20, 2026

Summary

Why

Changes

Scope

Validation

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant