vllm/csrc/moe at a2ef06e1b3a1c0dc4f7bf6587fbdcf1dad287c31 - vllm

Files

Wentao Ye c4e744dbd4 [Perf] Optimize moe_permute for CUTLASS FP8 (#32892 )

Signed-off-by: yewentao256 <zhyanwentao@126.com>

2026-01-28 10:15:24 -08:00

2026-01-23 16:48:12 -05:00

2026-01-28 10:15:24 -08:00

dynamic_4bit_int_moe_cpu.cpp

2025-12-02 06:21:39 +00:00

grouped_topk_kernels.cu

2026-01-13 10:58:18 -08:00

moe_align_sum_kernels.cu

2025-12-09 10:35:16 +08:00

moe_ops.h

2026-01-21 22:49:51 +00:00

moe_permute_unpermute_op.cu

2026-01-28 10:15:24 -08:00

moe_wna16_utils.h

2025-04-29 06:46:55 -07:00

moe_wna16.cu

2025-04-17 22:13:29 -07:00

topk_softmax_kernels.cu

2026-01-21 22:49:51 +00:00

torch_bindings.cpp

2026-01-21 22:49:51 +00:00