[Frontend] re-enable multi-modality input in the new beam search implementation (#9427)

Signed-off-by: Qishuai Ferdinandzhong@gmail.com
2024-10-29 19:49:47 +08:00
parent eae3d48181
commit ef7865b4f9
7 changed files with 150 additions and 40 deletions
--- a/vllm/beam_search.py
+++ b/vllm/beam_search.py
@@ -1,8 +1,11 @@
 from dataclasses import dataclass
-from typing import Dict, List, Optional
+from typing import TYPE_CHECKING, Any, Dict, List, Optional, Union

 from vllm.sequence import Logprob

+if TYPE_CHECKING:
+    from vllm.multimodal import MultiModalDataDict
+

@dataclass
 class BeamSearchSequence:
@@ -16,6 +19,10 @@ class BeamSearchSequence:
    logprobs: List[Dict[int, Logprob]]
    cum_logprob: float = 0.0
    text: Optional[str] = None
+    finish_reason: Optional[str] = None
+    stop_reason: Union[int, str, None] = None
+    multi_modal_data: Optional["MultiModalDataDict"] = None
+    mm_processor_kwargs: Optional[Dict[str, Any]] = None


@dataclass