vllm/csrc/quantization at 9a4548bae73a8831f668116d8a6e88491d933a4e - vllm

Files

Robert Shaw c0c2335ce0 Integrate Marlin Kernels for Int4 GPTQ inference (#2497 )

Co-authored-by: Robert Shaw <114415538+rib-2@users.noreply.github.com>
Co-authored-by: alexm <alexm@neuralmagic.com>

2024-03-01 12:47:51 -08:00

2024-02-12 11:02:17 -08:00

2024-02-01 09:35:09 -08:00

2024-02-28 21:52:23 -08:00

2024-03-01 12:47:51 -08:00

2024-01-03 09:52:29 -08:00