[Frontend][VLM] Add support for multiple multi-modal items (#8049)

2024-08-31 16:35:53 -07:00
parent 8423aef4c8
commit 5231f0898e
8 changed files with 524 additions and 136 deletions
--- a/tests/entrypoints/openai/test_serving_chat.py
+++ b/tests/entrypoints/openai/test_serving_chat.py
@@ -3,6 +3,7 @@ from contextlib import suppress
 from dataclasses import dataclass
 from unittest.mock import MagicMock

+from vllm.config import MultiModalConfig
 from vllm.engine.async_llm_engine import AsyncLLMEngine
 from vllm.entrypoints.openai.protocol import ChatCompletionRequest
 from vllm.entrypoints.openai.serving_chat import OpenAIServingChat
@@ -20,6 +21,7 @@ class MockModelConfig:
    max_model_len = 100
    tokenizer_revision = None
    embedding_mode = False
+    multimodal_config = MultiModalConfig()


@dataclass