[Misc][Model][Refactor] Pass the prefix into Linear layers (#31669)

Signed-off-by: Wang Kunpeng <1289706727@qq.com>
2026-01-06 04:03:18 +08:00
parent 02dbb933cb
commit 5708297e4e
17 changed files with 181 additions and 40 deletions
--- a/vllm/model_executor/models/minicpm.py
+++ b/vllm/model_executor/models/minicpm.py
@@ -90,6 +90,7 @@ class MiniCPMMoE(nn.Module):
        intermediate_size: int,
        params_dtype: torch.dtype | None = None,
        tp_size: int | None = None,
+        prefix: str = "",
    ):
        super().__init__()
        self.tp_size = tp_size or get_tensor_model_parallel_world_size()
@@ -108,6 +109,7 @@ class MiniCPMMoE(nn.Module):
            bias=False,
            params_dtype=self.params_dtype,
            quant_config=None,
+            prefix=f"{prefix}.gate",
        )

        self.ws = nn.Parameter(
@@ -352,6 +354,7 @@ class MiniCPMDecoderLayer(nn.Module):
                hidden_act=self.config.hidden_act,
                hidden_act_param=getattr(self.config, "hidden_act_param", 0.0),
                quant_config=self.quant_config,
+                prefix=f"{self.prefix}.mlp",
            )
        else:
            self.mlp = MiniCPMMoE(
@@ -359,6 +362,7 @@ class MiniCPMDecoderLayer(nn.Module):
                top_k=self.config.num_experts_per_tok,
                hidden_size=self.config.hidden_size,
                intermediate_size=self.config.intermediate_size,
+                prefix=f"{self.prefix}.mlp",
            )

    def forward(