vllm/csrc/moe/marlin_moe_wna16 at 197473c4e71c99025a0fd3925d0f130bdbfa1e42 - vllm

Files

Bhanu Prakash Voutharoja 6a6fc41c79 gptq marlin quantization support for fused moe with lora (#30254 )

Signed-off-by: Bhanu068 <voutharoja.bhanu06@gmail.com>

2025-12-12 02:27:22 +00:00

.gitignore

2025-11-29 07:19:33 -08:00

generate_kernels.py

2025-11-29 07:19:33 -08:00

kernel.h

2025-11-29 07:19:33 -08:00

marlin_template.h

2025-11-29 07:19:33 -08:00

ops.cu

2025-12-12 02:27:22 +00:00