vllm/csrc/moe at 197473c4e71c99025a0fd3925d0f130bdbfa1e42 - vllm

Files

Bhanu Prakash Voutharoja 6a6fc41c79 gptq marlin quantization support for fused moe with lora (#30254 )

Signed-off-by: Bhanu068 <voutharoja.bhanu06@gmail.com>

2025-12-12 02:27:22 +00:00

2025-12-12 02:27:22 +00:00

2025-07-27 07:08:00 -07:00

dynamic_4bit_int_moe_cpu.cpp

2025-12-02 06:21:39 +00:00

grouped_topk_kernels.cu

2025-12-11 17:43:41 -05:00

moe_align_sum_kernels.cu

2025-12-09 10:35:16 +08:00

moe_ops.h

2025-12-09 10:35:16 +08:00

moe_permute_unpermute_op.cu

2025-08-20 10:35:26 -04:00

moe_wna16_utils.h

2025-04-29 06:46:55 -07:00

moe_wna16.cu

2025-04-17 22:13:29 -07:00

topk_softmax_kernels.cu

2025-10-17 07:30:35 +00:00

torch_bindings.cpp

2025-12-09 10:35:16 +08:00