vllm/csrc/quantization/gguf at 14e53ed11f5134381bde03484148cb3cd1b69cd6 - vllm

Files

LukasBluebaum 90969fb39a [Kernel] Add more dtype support for GGUF dequantization (#15879 )

Signed-off-by: lukas.bluebaum <lukas.bluebaum@aleph-alpha.com>

2025-04-02 01:58:48 -07:00

dequantize.cuh

2025-04-02 01:58:48 -07:00

ggml-common.h

2025-04-02 01:58:48 -07:00

gguf_kernel.cu

2025-04-02 01:58:48 -07:00

mmq.cuh

2025-03-21 10:01:11 +08:00

mmvq.cuh

2025-03-21 10:01:11 +08:00

moe.cuh

2025-03-25 13:50:49 +00:00

vecdotq.cuh

2025-02-20 22:06:54 -08:00