[Bugfix][VLM] Fix failing Phi-4-MM multi-images tests and add vision-speech test (#16424)

Signed-off-by: Isotr0py <2037008807@qq.com>
2025-04-11 12:57:16 +08:00
parent ed37599544
commit 93195146ea
5 changed files with 118 additions and 45 deletions
--- a/examples/offline_inference/vision_language_multi_image.py
+++ b/examples/offline_inference/vision_language_multi_image.py
@@ -661,13 +661,6 @@ def run_generate(model, question: str, image_urls: list[str],
    engine_args = asdict(req_data.engine_args) | {"seed": args.seed}
    llm = LLM(**engine_args)

-    # To maintain code compatibility in this script, we add LoRA here.
-    # You can also add LoRA using:
-    # llm.generate(prompts, lora_request=lora_request,...)
-    if req_data.lora_requests:
-        for lora_request in req_data.lora_requests:
-            llm.llm_engine.add_lora(lora_request=lora_request)
-
    sampling_params = SamplingParams(temperature=0.0,
                                     max_tokens=256,
                                     stop_token_ids=req_data.stop_token_ids)
@@ -679,7 +672,9 @@ def run_generate(model, question: str, image_urls: list[str],
                "image": req_data.image_data
            },
        },
-        sampling_params=sampling_params)
+        sampling_params=sampling_params,
+        lora_request=req_data.lora_requests,
+    )

    print("-" * 50)
    for o in outputs:
@@ -724,6 +719,7 @@ def run_chat(model: str, question: str, image_urls: list[str],
        }],
        sampling_params=sampling_params,
        chat_template=req_data.chat_template,
+        lora_request=req_data.lora_requests,
    )

    print("-" * 50)