examples/offline_inference/vision_language_pooling.py

# SPDX-License-Identifier: Apache-2.0
# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
"""
This example shows how to use vLLM for running offline inference with
the correct prompt format on vision language models for multimodal pooling.

For most models, the prompt format should follow corresponding examples
on HuggingFace model repository.
"""

from argparse import Namespace
from dataclasses import asdict
from typing import Literal, NamedTuple, Optional, TypedDict, Union, get_args

from PIL.Image import Image

from vllm import LLM, EngineArgs
from vllm.entrypoints.score_utils import ScoreMultiModalParam
from vllm.multimodal.utils import fetch_image
from vllm.utils import FlexibleArgumentParser


class TextQuery(TypedDict):
    modality: Literal["text"]
    text: str


class ImageQuery(TypedDict):
    modality: Literal["image"]
    image: Image


class TextImageQuery(TypedDict):
    modality: Literal["text+image"]
    text: str
    image: Image


class TextImagesQuery(TypedDict):
    modality: Literal["text+images"]
    text: str
    image: ScoreMultiModalParam


QueryModality = Literal["text", "image", "text+image", "text+images"]
Query = Union[TextQuery, ImageQuery, TextImageQuery, TextImagesQuery]


class ModelRequestData(NamedTuple):
    engine_args: EngineArgs
    prompt: Optional[str] = None
    image: Optional[Image] = None
    query: Optional[str] = None
    documents: Optional[ScoreMultiModalParam] = None


def run_e5_v(query: Query) -> ModelRequestData:
    llama3_template = "<|start_header_id|>user<|end_header_id|>\n\n{}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n \n"  # noqa: E501

    if query["modality"] == "text":
        text = query["text"]
        prompt = llama3_template.format(f"{text}\nSummary above sentence in one word: ")
        image = None
    elif query["modality"] == "image":
        prompt = llama3_template.format("<image>\nSummary above image in one word: ")
        image = query["image"]
    else:
        modality = query["modality"]
        raise ValueError(f"Unsupported query modality: '{modality}'")

    engine_args = EngineArgs(
        model="royokong/e5-v",
        runner="pooling",
        max_model_len=4096,
        limit_mm_per_prompt={"image": 1},
    )

    return ModelRequestData(
        engine_args=engine_args,
        prompt=prompt,
        image=image,
    )


def run_vlm2vec(query: Query) -> ModelRequestData:
    if query["modality"] == "text":
        text = query["text"]
        prompt = f"Find me an everyday image that matches the given caption: {text}"  # noqa: E501
        image = None
    elif query["modality"] == "image":
        prompt = "<|image_1|> Find a day-to-day image that looks similar to the provided image."  # noqa: E501
        image = query["image"]
    elif query["modality"] == "text+image":
        text = query["text"]
        prompt = (
            f"<|image_1|> Represent the given image with the following question: {text}"  # noqa: E501
        )
        image = query["image"]
    else:
        modality = query["modality"]
        raise ValueError(f"Unsupported query modality: '{modality}'")

    engine_args = EngineArgs(
        model="TIGER-Lab/VLM2Vec-Full",
        runner="pooling",
        max_model_len=4096,
        trust_remote_code=True,
        mm_processor_kwargs={"num_crops": 4},
        limit_mm_per_prompt={"image": 1},
    )

    return ModelRequestData(
        engine_args=engine_args,
        prompt=prompt,
        image=image,
    )


def run_jinavl_reranker(query: Query) -> ModelRequestData:
    if query["modality"] != "text+images":
        raise ValueError(f"Unsupported query modality: '{query['modality']}'")

    engine_args = EngineArgs(
        model="jinaai/jina-reranker-m0",
        runner="pooling",
        max_model_len=32768,
        trust_remote_code=True,
        mm_processor_kwargs={
            "min_pixels": 3136,
            "max_pixels": 602112,
        },
        limit_mm_per_prompt={"image": 1},
    )

    return ModelRequestData(
        engine_args=engine_args,
        query=query["text"],
        documents=query["image"],
    )


def get_query(modality: QueryModality):
    if modality == "text":
        return TextQuery(modality="text", text="A dog sitting in the grass")

    if modality == "image":
        return ImageQuery(
            modality="image",
            image=fetch_image(
                "https://upload.wikimedia.org/wikipedia/commons/thumb/4/47/American_Eskimo_Dog.jpg/360px-American_Eskimo_Dog.jpg"  # noqa: E501
            ),
        )

    if modality == "text+image":
        return TextImageQuery(
            modality="text+image",
            text="A cat standing in the snow.",
            image=fetch_image(
                "https://upload.wikimedia.org/wikipedia/commons/thumb/b/b6/Felis_catus-cat_on_snow.jpg/179px-Felis_catus-cat_on_snow.jpg"  # noqa: E501
            ),
        )

    if modality == "text+images":
        return TextImagesQuery(
            modality="text+images",
            text="slm markdown",
            image={
                "content": [
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/handelsblatt-preview.png"
                        },
                    },
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/paper-11.png"
                        },
                    },
                ]
            },
        )

    msg = f"Modality {modality} is not supported."
    raise ValueError(msg)


def run_encode(model: str, modality: QueryModality, seed: Optional[int]):
    query = get_query(modality)
    req_data = model_example_map[model](query)

    # Disable other modalities to save memory
    default_limits = {"image": 0, "video": 0, "audio": 0}
    req_data.engine_args.limit_mm_per_prompt = default_limits | dict(
        req_data.engine_args.limit_mm_per_prompt or {}
    )

    engine_args = asdict(req_data.engine_args) | {"seed": seed}
    llm = LLM(**engine_args)

    mm_data = {}
    if req_data.image is not None:
        mm_data["image"] = req_data.image

    outputs = llm.embed(
        {
            "prompt": req_data.prompt,
            "multi_modal_data": mm_data,
        }
    )

    print("-" * 50)
    for output in outputs:
        print(output.outputs.embedding)
        print("-" * 50)


def run_score(model: str, modality: QueryModality, seed: Optional[int]):
    query = get_query(modality)
    req_data = model_example_map[model](query)

    engine_args = asdict(req_data.engine_args) | {"seed": seed}
    llm = LLM(**engine_args)

    outputs = llm.score(req_data.query, req_data.documents)

    print("-" * 30)
    print([output.outputs.score for output in outputs])
    print("-" * 30)


model_example_map = {
    "e5_v": run_e5_v,
    "vlm2vec": run_vlm2vec,
    "jinavl_reranker": run_jinavl_reranker,
}


def parse_args():
    parser = FlexibleArgumentParser(
        description="Demo on using vLLM for offline inference with "
        "vision language models for multimodal pooling tasks."
    )
    parser.add_argument(
        "--model-name",
        "-m",
        type=str,
        default="vlm2vec",
        choices=model_example_map.keys(),
        help="The name of the embedding model.",
    )
    parser.add_argument(
        "--task",
        "-t",
        type=str,
        default="embedding",
        choices=["embedding", "scoring"],
        help="The task type.",
    )
    parser.add_argument(
        "--modality",
        type=str,
        default="image",
        choices=get_args(QueryModality),
        help="Modality of the input.",
    )
    parser.add_argument(
        "--seed",
        type=int,
        default=None,
        help="Set the seed when initializing `vllm.LLM`.",
    )
    return parser.parse_args()


def main(args: Namespace):
    if args.task == "embedding":
        run_encode(args.model_name, args.modality, args.seed)
    elif args.task == "scoring":
        run_score(args.model_name, args.modality, args.seed)
    else:
        raise ValueError(f"Unsupported task: {args.task}")


if __name__ == "__main__":
    args = parse_args()
    main(args)
[Misc] Add SPDX-License-Identifier headers to python source files (#12628) - Add SPDX license headers to python source files - Check for SPDX headers using pre-commit commit 9d7ef44c3cfb72ca4c32e1c677d99259d10d4745 Author: Russell Bryant <rbryant@redhat.com> Date: Fri Jan 31 14:18:24 2025 -0500 Add SPDX license headers to python source files This commit adds SPDX license headers to python source files as recommended to the project by the Linux Foundation. These headers provide a concise way that is both human and machine readable for communicating license information for each source file. It helps avoid any ambiguity about the license of the code and can also be easily used by tools to help manage license compliance. The Linux Foundation runs license scans against the codebase to help ensure we are in compliance with the licenses of the code we use, including dependencies. Having these headers in place helps that tool do its job. More information can be found on the SPDX site: - https://spdx.dev/learn/handling-license-info/ Signed-off-by: Russell Bryant <rbryant@redhat.com> commit 5a1cf1cb3b80759131c73f6a9dddebccac039dea Author: Russell Bryant <rbryant@redhat.com> Date: Fri Jan 31 14:36:32 2025 -0500 Check for SPDX headers using pre-commit Signed-off-by: Russell Bryant <rbryant@redhat.com> --------- Signed-off-by: Russell Bryant <rbryant@redhat.com> 2025-02-02 14:58:18 -05:00			`# SPDX-License-Identifier: Apache-2.0`
[Misc] Add SPDX-FileCopyrightText (#19100) Signed-off-by: simon-mo <simon.mo@hey.com> 2025-06-03 11:20:17 -07:00			`# SPDX-FileCopyrightText: Copyright contributors to the vLLM project`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`"""`
			`This example shows how to use vLLM for running offline inference with`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`the correct prompt format on vision language models for multimodal pooling.`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00
			`For most models, the prompt format should follow corresponding examples`
			`on HuggingFace model repository.`
			`"""`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`from argparse import Namespace`
[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`from dataclasses import asdict`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`from typing import Literal, NamedTuple, Optional, TypedDict, Union, get_args`

			`from PIL.Image import Image`

[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`from vllm import LLM, EngineArgs`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`from vllm.entrypoints.score_utils import ScoreMultiModalParam`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`from vllm.multimodal.utils import fetch_image`
			`from vllm.utils import FlexibleArgumentParser`


			`class TextQuery(TypedDict):`
			`modality: Literal["text"]`
			`text: str`


			`class ImageQuery(TypedDict):`
			`modality: Literal["image"]`
			`image: Image`


			`class TextImageQuery(TypedDict):`
			`modality: Literal["text+image"]`
			`text: str`
			`image: Image`


[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`class TextImagesQuery(TypedDict):`
			`modality: Literal["text+images"]`
			`text: str`
			`image: ScoreMultiModalParam`


			`QueryModality = Literal["text", "image", "text+image", "text+images"]`
			`Query = Union[TextQuery, ImageQuery, TextImageQuery, TextImagesQuery]`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00

			`class ModelRequestData(NamedTuple):`
[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`engine_args: EngineArgs`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`prompt: Optional[str] = None`
			`image: Optional[Image] = None`
			`query: Optional[str] = None`
			`documents: Optional[ScoreMultiModalParam] = None`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00

[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`def run_e5_v(query: Query) -> ModelRequestData:`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`llama3_template = "<\|start_header_id\|>user<\|end_header_id\|>\n\n{}<\|eot_id\|><\|start_header_id\|>assistant<\|end_header_id\|>\n\n \n" # noqa: E501`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00
			`if query["modality"] == "text":`
			`text = query["text"]`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`prompt = llama3_template.format(f"{text}\nSummary above sentence in one word: ")`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`image = None`
			`elif query["modality"] == "image":`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`prompt = llama3_template.format("<image>\nSummary above image in one word: ")`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`image = query["image"]`
			`else:`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`modality = query["modality"]`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`raise ValueError(f"Unsupported query modality: '{modality}'")`

[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`engine_args = EngineArgs(`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`model="royokong/e5-v",`
[Deprecation][2/N] Replace `--task` with `--runner` and `--convert` (#21470) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-07-28 10:42:40 +08:00			`runner="pooling",`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`max_model_len=4096,`
[V1] Enable multi-input by default (#15799) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-04-12 16:52:39 +08:00			`limit_mm_per_prompt={"image": 1},`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`)`

			`return ModelRequestData(`
[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`engine_args=engine_args,`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`prompt=prompt,`
			`image=image,`
			`)`


[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`def run_vlm2vec(query: Query) -> ModelRequestData:`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`if query["modality"] == "text":`
			`text = query["text"]`
			`prompt = f"Find me an everyday image that matches the given caption: {text}" # noqa: E501`
			`image = None`
			`elif query["modality"] == "image":`
			`prompt = "<\|image_1\|> Find a day-to-day image that looks similar to the provided image." # noqa: E501`
			`image = query["image"]`
			`elif query["modality"] == "text+image":`
			`text = query["text"]`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`prompt = (`
			`f"<\|image_1\|> Represent the given image with the following question: {text}" # noqa: E501`
			`)`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`image = query["image"]`
			`else:`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`modality = query["modality"]`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`raise ValueError(f"Unsupported query modality: '{modality}'")`

[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`engine_args = EngineArgs(`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`model="TIGER-Lab/VLM2Vec-Full",`
[Deprecation][2/N] Replace `--task` with `--runner` and `--convert` (#21470) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-07-28 10:42:40 +08:00			`runner="pooling",`
Support embedding models in V1 (#16188) Signed-off-by: Max de Bayser <mbayser@br.ibm.com> Signed-off-by: Max de Bayser <maxdebayser@gmail.com> Signed-off-by: 22quinn <33176974+22quinn@users.noreply.github.com> Co-authored-by: 22quinn <33176974+22quinn@users.noreply.github.com> 2025-06-19 01:36:33 -03:00			`max_model_len=4096,`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`trust_remote_code=True,`
			`mm_processor_kwargs={"num_crops": 4},`
[V1] Enable multi-input by default (#15799) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-04-12 16:52:39 +08:00			`limit_mm_per_prompt={"image": 1},`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`)`

			`return ModelRequestData(`
[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`engine_args=engine_args,`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`prompt=prompt,`
			`image=image,`
			`)`


[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`def run_jinavl_reranker(query: Query) -> ModelRequestData:`
			`if query["modality"] != "text+images":`
			`raise ValueError(f"Unsupported query modality: '{query['modality']}'")`

			`engine_args = EngineArgs(`
			`model="jinaai/jina-reranker-m0",`
[Deprecation][2/N] Replace `--task` with `--runner` and `--convert` (#21470) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-07-28 10:42:40 +08:00			`runner="pooling",`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`max_model_len=32768,`
			`trust_remote_code=True,`
			`mm_processor_kwargs={`
			`"min_pixels": 3136,`
			`"max_pixels": 602112,`
			`},`
			`limit_mm_per_prompt={"image": 1},`
			`)`

			`return ModelRequestData(`
			`engine_args=engine_args,`
			`query=query["text"],`
			`documents=query["image"],`
			`)`


[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`def get_query(modality: QueryModality):`
			`if modality == "text":`
			`return TextQuery(modality="text", text="A dog sitting in the grass")`

			`if modality == "image":`
			`return ImageQuery(`
			`modality="image",`
			`image=fetch_image(`
			`"https://upload.wikimedia.org/wikipedia/commons/thumb/4/47/American_Eskimo_Dog.jpg/360px-American_Eskimo_Dog.jpg" # noqa: E501`
			`),`
			`)`

			`if modality == "text+image":`
			`return TextImageQuery(`
			`modality="text+image",`
			`text="A cat standing in the snow.",`
			`image=fetch_image(`
			`"https://upload.wikimedia.org/wikipedia/commons/thumb/b/b6/Felis_catus-cat_on_snow.jpg/179px-Felis_catus-cat_on_snow.jpg" # noqa: E501`
			`),`
			`)`

[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`if modality == "text+images":`
			`return TextImagesQuery(`
			`modality="text+images",`
			`text="slm markdown",`
			`image={`
			`"content": [`
			`{`
			`"type": "image_url",`
			`"image_url": {`
			`"url": "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/handelsblatt-preview.png"`
			`},`
			`},`
			`{`
			`"type": "image_url",`
			`"image_url": {`
			`"url": "https://raw.githubusercontent.com/jina-ai/multimodal-reranker-test/main/paper-11.png"`
			`},`
			`},`
			`]`
			`},`
			`)`

[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`msg = f"Modality {modality} is not supported."`
			`raise ValueError(msg)`


[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`def run_encode(model: str, modality: QueryModality, seed: Optional[int]):`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`query = get_query(modality)`
			`req_data = model_example_map[model](query)`

[V1] Enable multi-input by default (#15799) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-04-12 16:52:39 +08:00			`# Disable other modalities to save memory`
			`default_limits = {"image": 0, "video": 0, "audio": 0}`
			`req_data.engine_args.limit_mm_per_prompt = default_limits \| dict(`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`req_data.engine_args.limit_mm_per_prompt or {}`
			`)`
[V1] Enable multi-input by default (#15799) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-04-12 16:52:39 +08:00
[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00			`engine_args = asdict(req_data.engine_args) \| {"seed": seed}`
			`llm = LLM(**engine_args)`

[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`mm_data = {}`
			`if req_data.image is not None:`
			`mm_data["image"] = req_data.image`

Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`outputs = llm.embed(`
			`{`
			`"prompt": req_data.prompt,`
			`"multi_modal_data": mm_data,`
			`}`
			`)`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00
[Misc] format and refactor some examples (#16252) Signed-off-by: reidliu41 <reid201711@gmail.com> Co-authored-by: reidliu41 <reid201711@gmail.com> 2025-04-08 18:42:32 +08:00			`print("-" * 50)`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`for output in outputs:`
			`print(output.outputs.embedding)`
[Misc] format and refactor some examples (#16252) Signed-off-by: reidliu41 <reid201711@gmail.com> Co-authored-by: reidliu41 <reid201711@gmail.com> 2025-04-08 18:42:32 +08:00			`print("-" * 50)`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00

[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`def run_score(model: str, modality: QueryModality, seed: Optional[int]):`
			`query = get_query(modality)`
			`req_data = model_example_map[model](query)`

			`engine_args = asdict(req_data.engine_args) \| {"seed": seed}`
			`llm = LLM(**engine_args)`

			`outputs = llm.score(req_data.query, req_data.documents)`

			`print("-" * 30)`
			`print([output.outputs.score for output in outputs])`
			`print("-" * 30)`


[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`model_example_map = {`
			`"e5_v": run_e5_v,`
			`"vlm2vec": run_vlm2vec,`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`"jinavl_reranker": run_jinavl_reranker,`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`}`

[Misc] refactor argument parsing in examples (#16635) Signed-off-by: reidliu41 <reid201711@gmail.com> Co-authored-by: reidliu41 <reid201711@gmail.com> 2025-04-15 16:05:30 +08:00
			`def parse_args():`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`parser = FlexibleArgumentParser(`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`description="Demo on using vLLM for offline inference with "`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`"vision language models for multimodal pooling tasks."`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`)`
			`parser.add_argument(`
			`"--model-name",`
			`"-m",`
			`type=str,`
			`default="vlm2vec",`
			`choices=model_example_map.keys(),`
			`help="The name of the embedding model.",`
			`)`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`parser.add_argument(`
			`"--task",`
			`"-t",`
			`type=str,`
			`default="embedding",`
			`choices=["embedding", "scoring"],`
			`help="The task type.",`
			`)`
Convert `examples` to `ruff-format` (#18400) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> 2025-05-26 17:57:54 +01:00			`parser.add_argument(`
			`"--modality",`
			`type=str,`
			`default="image",`
			`choices=get_args(QueryModality),`
			`help="Modality of the input.",`
			`)`
			`parser.add_argument(`
			`"--seed",`
			`type=int,`
			`default=None,`
			help="Set the seed when initializing `vllm.LLM`.",
			`)`
[Misc] refactor argument parsing in examples (#16635) Signed-off-by: reidliu41 <reid201711@gmail.com> Co-authored-by: reidliu41 <reid201711@gmail.com> 2025-04-15 16:05:30 +08:00			`return parser.parse_args()`
[Misc] Add `--seed` option to offline multi-modal examples (#14934) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> 2025-03-17 18:00:17 +08:00
[Misc] refactor argument parsing in examples (#16635) Signed-off-by: reidliu41 <reid201711@gmail.com> Co-authored-by: reidliu41 <reid201711@gmail.com> 2025-04-15 16:05:30 +08:00
			`def main(args: Namespace):`
[Model][VLM] Support JinaVL Reranker (#20260) Signed-off-by: shineran96 <shinewang96@gmail.com> 2025-07-11 01:43:43 +08:00			`if args.task == "embedding":`
			`run_encode(args.model_name, args.modality, args.seed)`
			`elif args.task == "scoring":`
			`run_score(args.model_name, args.modality, args.seed)`
			`else:`
			`raise ValueError(f"Unsupported task: {args.task}")`
[Misc] refactor argument parsing in examples (#16635) Signed-off-by: reidliu41 <reid201711@gmail.com> Co-authored-by: reidliu41 <reid201711@gmail.com> 2025-04-15 16:05:30 +08:00

			`if __name__ == "__main__":`
			`args = parse_args()`
[Model] Support E5-V (#9576) 2024-10-23 11:35:29 +08:00			`main(args)`