vllm/csrc/quantization/gguf at 04668ebe7a35b69f1d2f8b04ef255bb16c8d2a01 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

History

kliuae 7c25fe45a6 [AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

..

dequantize.cuh

[Bugfix][Kernel] Add IQ1_M quantization implementation to GGUF kernel (#8357 )

2024-09-15 16:51:44 -06:00

ggml-common.h

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

gguf_kernel.cu

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

mmq.cuh

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

mmvq.cuh

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

vecdotq.cuh

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00