vllm/csrc/quantization/marlin/dense at b6be6f8d1e49d4aa884603e8675dc216be1cbd79 - vllm

Files

Lu Fang 051da7efe3 Fix CUDA kernel index data type in vllm/csrc/quantization/gptq_marlin/awq_marlin_repack.cu +10 (#15160 )

Signed-off-by: Lu Fang <lufang@fb.com>
Co-authored-by: Richard Barnes <rbarnes@meta.com>

2025-03-25 15:36:45 +08:00

2024-07-31 07:55:21 -06:00

LICENSE

2024-05-16 12:56:15 -04:00

marlin_cuda_kernel.cu

2025-03-25 15:36:45 +08:00