[Model] Standardize common vision encoders (#31947)

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
2026-01-08 18:33:16 +08:00
parent d1b6fe007f
commit 5576227bc1
19 changed files with 253 additions and 173 deletions
--- a/vllm/model_executor/models/isaac.py
+++ b/vllm/model_executor/models/isaac.py
@@ -1226,8 +1226,8 @@ class IsaacVisionEmbedding(nn.Module):
        self.transformer = Siglip2VisionTransformer(
            vision_cfg,
            quant_config=quant_config,
-            prefix=maybe_prefix(prefix, "0"),
            multimodal_config=multimodal_config,
+            prefix=maybe_prefix(prefix, "0"),
        )
        self.linear_fc1 = ColumnParallelLinear(
            hidden_dim,