vllm/csrc/moe at 4e67a8f616f4f202fd7a549978914f398a738d49 - vllm

Files

Jinzhen Lin 2f4bdee61e [Quantization][MoE] remove unused ep logic from moe marlin (#31571 )

Signed-off-by: Jinzhen Lin <jinzhen.ljz@antgroup.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>

2026-01-06 09:07:19 -08:00

2026-01-06 09:07:19 -08:00

2025-07-27 07:08:00 -07:00

dynamic_4bit_int_moe_cpu.cpp

2025-12-02 06:21:39 +00:00

grouped_topk_kernels.cu

2025-12-16 14:50:59 -05:00

moe_align_sum_kernels.cu

2025-12-09 10:35:16 +08:00

moe_ops.h

2025-12-09 10:35:16 +08:00

moe_permute_unpermute_op.cu

2025-08-20 10:35:26 -04:00

moe_wna16_utils.h

2025-04-29 06:46:55 -07:00

moe_wna16.cu

2025-04-17 22:13:29 -07:00

topk_softmax_kernels.cu

2025-10-17 07:30:35 +00:00

torch_bindings.cpp

2026-01-06 09:07:19 -08:00