vllm/tests/entrypoints/pooling at 8b346309a5efbe80ee64f7d3633d2d7dedcc202b - vllm

Files

Wentao Ye c34ba6b961 [Perf] Optimize compute maxsim using batched version, 3.2% E2E throughput improvement (#36710 )

Signed-off-by: yewentao256 <zhyanwentao@126.com>

2026-03-12 08:37:01 +08:00

2026-01-31 04:51:15 -08:00

2026-03-10 12:05:34 +00:00

2026-03-07 04:27:04 +00:00

2026-02-03 10:29:18 +00:00

2025-12-04 13:44:15 +00:00

2026-03-12 08:37:01 +08:00

__init__.py

2025-09-11 01:53:09 -07:00