Inclusion of InternVLChatModel In PP_SUPPORTED_MODELS(Pipeline Parallelism) (#7860)

2024-09-05 17:03:37 +05:30
parent 288a938872
commit 8685ba1a1e
6 changed files with 90 additions and 35 deletions
--- a/vllm/config.py
+++ b/vllm/config.py
@@ -35,18 +35,20 @@ _EMBEDDING_MODEL_MAX_NUM_BATCHED_TOKENS = 32768
 _MULTIMODAL_MODEL_MAX_NUM_BATCHED_TOKENS = 4096

 _PP_SUPPORTED_MODELS = [
-    "AquilaModel",
    "AquilaForCausalLM",
+    "AquilaModel",
    "DeepseekV2ForCausalLM",
+    "GPT2LMHeadModel",
+    "InternLM2ForCausalLM",
    "InternLMForCausalLM",
+    "InternVLChatModel",
    "JAISLMHeadModel",
    "LlamaForCausalLM",
    "LLaMAForCausalLM",
    "MistralForCausalLM",
-    "Phi3ForCausalLM",
-    "GPT2LMHeadModel",
    "MixtralForCausalLM",
    "NemotronForCausalLM",
+    "Phi3ForCausalLM",
    "Qwen2ForCausalLM",
    "Qwen2MoeForCausalLM",
    "QWenLMHeadModel",