vllm/csrc/quantization/gptq_marlin at 6f1355a1b74e4502e6a4e6ba9a811cc50729ee1f - vllm

Files

Jane (Yuan) Xu 06c4873d95 Rewrite C++ meta funcs to Python (#28595 )

Signed-off-by: Jane Xu <janeyx@meta.com>

2025-11-14 00:52:50 +08:00

.gitignore

2025-05-05 09:39:30 -07:00

awq_marlin_repack.cu

2025-11-14 00:52:50 +08:00

dequant.h

2025-08-14 11:23:22 -07:00

generate_kernels.py

2025-10-05 07:06:22 -07:00

gptq_marlin_repack.cu

2025-11-14 00:52:50 +08:00

gptq_marlin.cu

2025-08-14 11:23:22 -07:00

kernel.h

2025-08-14 11:23:22 -07:00

marlin_dtypes.cuh

2025-04-14 20:05:22 -07:00

marlin_template.h

2025-08-14 11:23:22 -07:00

marlin.cuh

2025-04-14 20:05:22 -07:00