vllm/csrc/quantization/gptq at ccd3e55e51d44bf3a17b2203a304c9609aa5dfe2 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

History

Xiangyu Li 5cc6bddb6e [Kernel] Add GPTQv2 format support for low-bit or asymmetric quantization, by adapting gptq_gemm (#26092 )

2025-10-23 23:26:13 -04:00

..

compat.cuh

…

matrix_view.cuh

…

q_gemm.cu

[Kernel] Add GPTQv2 format support for low-bit or asymmetric quantization, by adapting gptq_gemm (#26092 )

2025-10-23 23:26:13 -04:00

qdq_2.cuh

…

qdq_3.cuh

…

qdq_4.cuh

…

qdq_8.cuh

…

qdq_util.cuh

…