vllm/csrc/moe at e27078ea807cf5655c6be3b59608e55c1682756d - vllm

Files

Wentao Ye f28125d87b [Perf] Optimize grouped topk kernel, 1.2%~2% E2E Throughput improvement (#32058 )

Signed-off-by: yewentao256 <zhyanwentao@126.com>

2026-01-13 10:58:18 -08:00

2026-01-06 09:07:19 -08:00

2025-07-27 07:08:00 -07:00

dynamic_4bit_int_moe_cpu.cpp

2025-12-02 06:21:39 +00:00

grouped_topk_kernels.cu

2026-01-13 10:58:18 -08:00

moe_align_sum_kernels.cu

2025-12-09 10:35:16 +08:00

moe_ops.h

2025-12-09 10:35:16 +08:00

moe_permute_unpermute_op.cu

2025-08-20 10:35:26 -04:00

moe_wna16_utils.h

2025-04-29 06:46:55 -07:00

moe_wna16.cu

2025-04-17 22:13:29 -07:00

topk_softmax_kernels.cu

2025-10-17 07:30:35 +00:00

torch_bindings.cpp

2026-01-06 09:07:19 -08:00