[Frontend][4/n] Improve pooling entrypoints | pooling. (#39153)

Signed-off-by: wang.yuqi <yuqi.wang@daocloud.io>
2026-04-09 18:09:45 +08:00
parent b6c9be509e
commit 66c079ae83
43 changed files with 554 additions and 733 deletions
--- a/tests/entrypoints/pooling/token_embed/test_offline.py
+++ b/tests/entrypoints/pooling/token_embed/test_offline.py
@@ -62,14 +62,17 @@ def test_token_ids_prompts(llm: LLM):
    assert outputs[0].outputs.data.shape == (11, 384)


-@pytest.mark.parametrize("task", ["embed", "classify", "token_classify"])
+@pytest.mark.parametrize("task", ["embed", "classify", "token_classify", "plugin"])
 def test_unsupported_tasks(llm: LLM, task: PoolingTask, caplog_vllm):
    if task == "embed":
        with caplog_vllm.at_level(level=logging.WARNING, logger="vllm"):
            llm.encode(prompt, pooling_task=task, use_tqdm=False)
        assert "deprecated" in caplog_vllm.text
    else:
-        err_msg = "Classification API is not supported by this model.+"
+        if task == "plugin":
+            err_msg = "No IOProcessor plugin installed."
+        else:
+            err_msg = "Classification API is not supported by this model.+"

        with pytest.raises(ValueError, match=err_msg):
            llm.encode(prompt, pooling_task=task, use_tqdm=False)