vllm/csrc/quantization/gguf at b5b647b084de3a5a29d35ca527c9901f8e6a4e7e - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

History

kliuae 7c25fe45a6 [AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

..

dequantize.cuh

[Bugfix][Kernel] Add IQ1_M quantization implementation to GGUF kernel (#8357 )

2024-09-15 16:51:44 -06:00

ggml-common.h

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

gguf_kernel.cu

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

mmq.cuh

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

mmvq.cuh

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00

vecdotq.cuh

[AMD] Add support for GGUF quantization on ROCm (#10254 )

2024-11-22 21:14:49 -08:00