vllm/csrc/moe/marlin_moe_wna16 at c01d589813f40c9ea25db3cdaa2c6c2144ab4e53 - vllm

Files

Bhanu Prakash Voutharoja 6a6fc41c79 gptq marlin quantization support for fused moe with lora (#30254 )

Signed-off-by: Bhanu068 <voutharoja.bhanu06@gmail.com>

2025-12-12 02:27:22 +00:00

.gitignore

2025-11-29 07:19:33 -08:00

generate_kernels.py

2025-11-29 07:19:33 -08:00

kernel.h

2025-11-29 07:19:33 -08:00

marlin_template.h

2025-11-29 07:19:33 -08:00

ops.cu

2025-12-12 02:27:22 +00:00