vllm/tests/entrypoints/pooling at e5b807607c8493155e6eccd665772d4c19b2114e - vllm

Files

Wentao Ye c34ba6b961 [Perf] Optimize compute maxsim using batched version, 3.2% E2E throughput improvement (#36710 )

Signed-off-by: yewentao256 <zhyanwentao@126.com>

2026-03-12 08:37:01 +08:00

2026-01-31 04:51:15 -08:00

2026-03-10 12:05:34 +00:00

2026-03-07 04:27:04 +00:00

2026-02-03 10:29:18 +00:00

2025-12-04 13:44:15 +00:00

2026-03-12 08:37:01 +08:00

__init__.py

2025-09-11 01:53:09 -07:00