[CI] Split pooling from entrypoints Test (#24632)

Signed-off-by: wang.yuqi <noooop@126.com>
2025-09-11 16:53:09 +08:00
parent ed5ae4aace
commit a8b0361c92
21 changed files with 32 additions and 30 deletions
--- a/tests/entrypoints/openai/correctness/test_mteb_embed.py
+++ b/tests/entrypoints/openai/correctness/test_mteb_embed.py
@@ -1,42 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-import os
-
-import pytest
-
-from tests.models.language.pooling.mteb_utils import (MTEB_EMBED_TASKS,
-                                                      MTEB_EMBED_TOL,
-                                                      OpenAIClientMtebEncoder,
-                                                      run_mteb_embed_task)
-from tests.utils import RemoteOpenAIServer
-
-os.environ["VLLM_LOGGING_LEVEL"] = "WARNING"
-
-MODEL_NAME = "intfloat/e5-small"
-MAIN_SCORE = 0.7422994752439667
-
-
-@pytest.fixture(scope="module")
-def server():
-    args = [
-        "--runner", "pooling", "--enforce-eager",
-        "--disable-uvicorn-access-log"
-    ]
-
-    with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
-        yield remote_server
-
-
-def test_mteb_embed(server):
-    client = server.get_client()
-    encoder = OpenAIClientMtebEncoder(MODEL_NAME, client)
-    vllm_main_score = run_mteb_embed_task(encoder, MTEB_EMBED_TASKS)
-    st_main_score = MAIN_SCORE
-
-    print("VLLM main score: ", vllm_main_score)
-    print("SentenceTransformer main score: ", st_main_score)
-    print("Difference: ", st_main_score - vllm_main_score)
-
-    # We are not concerned that the vllm mteb results are better
-    # than SentenceTransformers, so we only perform one-sided testing.
-    assert st_main_score - vllm_main_score < MTEB_EMBED_TOL
--- a/tests/entrypoints/openai/correctness/test_mteb_score.py
+++ b/tests/entrypoints/openai/correctness/test_mteb_score.py
@@ -1,62 +0,0 @@
-# SPDX-License-Identifier: Apache-2.0
-# SPDX-FileCopyrightText: Copyright contributors to the vLLM project
-import os
-
-import pytest
-
-# yapf conflicts with isort for this block
-# yapf: disable
-from tests.models.language.pooling.mteb_utils import (MTEB_RERANK_LANGS,
-                                                      MTEB_RERANK_TASKS,
-                                                      MTEB_RERANK_TOL,
-                                                      RerankClientMtebEncoder,
-                                                      ScoreClientMtebEncoder,
-                                                      run_mteb_rerank)
-# yapf: enable
-from tests.utils import RemoteOpenAIServer
-
-os.environ["VLLM_LOGGING_LEVEL"] = "WARNING"
-
-MODEL_NAME = "cross-encoder/ms-marco-MiniLM-L-6-v2"
-st_main_score = 0.33457
-
-
-@pytest.fixture(scope="module")
-def server():
-    args = [
-        "--runner", "pooling", "--enforce-eager",
-        "--disable-uvicorn-access-log"
-    ]
-
-    with RemoteOpenAIServer(MODEL_NAME, args) as remote_server:
-        yield remote_server
-
-
-def test_mteb_score(server):
-    url = server.url_for("score")
-    encoder = ScoreClientMtebEncoder(MODEL_NAME, url)
-    vllm_main_score = run_mteb_rerank(encoder, MTEB_RERANK_TASKS,
-                                      MTEB_RERANK_LANGS)
-
-    print("VLLM main score: ", vllm_main_score)
-    print("SentenceTransformer main score: ", st_main_score)
-    print("Difference: ", st_main_score - vllm_main_score)
-
-    # We are not concerned that the vllm mteb results are better
-    # than SentenceTransformers, so we only perform one-sided testing.
-    assert st_main_score - vllm_main_score < MTEB_RERANK_TOL
-
-
-def test_mteb_rerank(server):
-    url = server.url_for("rerank")
-    encoder = RerankClientMtebEncoder(MODEL_NAME, url)
-    vllm_main_score = run_mteb_rerank(encoder, MTEB_RERANK_TASKS,
-                                      MTEB_RERANK_LANGS)
-
-    print("VLLM main score: ", vllm_main_score)
-    print("SentenceTransformer main score: ", st_main_score)
-    print("Difference: ", st_main_score - vllm_main_score)
-
-    # We are not concerned that the vllm mteb results are better
-    # than SentenceTransformers, so we only perform one-sided testing.
-    assert st_main_score - vllm_main_score < MTEB_RERANK_TOL