vllm/vllm/model_executor/layers/quantization/kernels at 449de9001af69592618516b298aa1c5f321ded34 - vllm

Files

Xiangyu Li 5cc6bddb6e [Kernel] Add GPTQv2 format support for low-bit or asymmetric quantization, by adapting gptq_gemm (#26092 )

2025-10-23 23:26:13 -04:00

2025-10-23 23:26:13 -04:00

2025-10-18 09:48:22 -07:00

__init__.py

2025-01-08 19:33:29 +00:00