vllm/csrc/quantization/gptq_marlin at 7a05d2dc65065da3d6fd54c67a670ab08ffaf600 - vllm

Files

Jinzhen Lin ce96857fdd [Kernel][Quantization][MoE] add marlin kernel support for turing (sm75) (#29901 )

Signed-off-by: Jinzhen Lin <jinzhen.ljz@antgroup.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>

2025-12-16 14:35:28 -08:00

.gitignore

2025-12-16 14:35:28 -08:00

awq_marlin_repack.cu

2025-11-29 07:19:33 -08:00

dequant.h

2025-12-16 14:35:28 -08:00

generate_kernels.py

2025-12-16 14:35:28 -08:00

gptq_marlin_repack.cu

2025-11-29 07:19:33 -08:00

gptq_marlin.cu

2025-12-16 14:35:28 -08:00

kernel.h

2025-11-29 07:19:33 -08:00

marlin_dtypes.cuh

2025-11-29 07:19:33 -08:00

marlin_int4_fp8_preprocess.cu

2025-11-29 07:19:33 -08:00

marlin_mma.h

2025-12-16 14:35:28 -08:00

marlin_template.h

2025-12-16 14:35:28 -08:00

marlin.cuh

2025-12-16 14:35:28 -08:00