vllm/csrc/quantization/gptq_marlin at 87b4ac56c2f9c61bd1d2e0cdcfd2db43c8c52d91 - vllm

Files

Jinzhen Lin 2fa66ef713 [Bugfix] fix use_atomic_add support of marlin kernel when using v1 engine (#15946 )

Signed-off-by: Jinzhen Lin <linjinzhen@hotmail.com>

2025-04-05 20:04:22 -07:00

awq_marlin_repack.cu

2025-03-25 15:36:45 +08:00

gptq_marlin_repack.cu

2025-03-25 15:36:45 +08:00

gptq_marlin.cu

2025-04-05 20:04:22 -07:00

marlin_dtypes.cuh

2024-07-21 19:41:42 -04:00

marlin.cuh

2024-07-21 19:41:42 -04:00