vllm/vllm/model_executor/layers/pooler at 0be9516ea43df0fcb24bf50021e22768a49d61cf - vllm

Files

Wentao Ye 7b01d97a22 [Perf] Optimize mean pooling using chunks and index_add, 5.9% E2E throughput improvement (#38559 )

Signed-off-by: yewentao256 <zhyanwentao@126.com>

2026-04-01 03:54:58 +00:00

2026-04-01 03:54:58 +00:00

2026-03-20 08:07:56 +00:00

__init__.py

2026-01-09 11:02:14 +00:00

abstract.py

2026-01-09 11:02:14 +00:00

activations.py

2026-03-20 08:07:56 +00:00

common.py

2026-03-29 18:12:50 +00:00

special.py

2026-03-29 18:12:50 +00:00