vllm/csrc/quantization/gguf at 9528e3a05e4264e7477bfe4e30a4e1d8fa54e1dc - vllm

Files

Szymon Ożóg dec66d253b [Kernel] GGUF MMVQ kernel for multiple input vectors (#18754 )

Signed-off-by: SzymonOzog <szymon.ozog@gmail.com>

2025-06-16 17:33:26 +08:00

dequantize.cuh

2025-04-02 01:58:48 -07:00

ggml-common.h

2025-04-04 09:38:58 -07:00

gguf_kernel.cu

2025-06-16 17:33:26 +08:00

mmq.cuh

2025-03-21 10:01:11 +08:00

mmvq.cuh

2025-06-16 17:33:26 +08:00

moe_vec.cuh

2025-05-06 23:07:23 -07:00

moe.cuh

2025-04-08 05:10:26 -07:00

vecdotq.cuh

2025-02-20 22:06:54 -08:00