vllm/csrc/quantization at 537c9755a736b4e206107a99e1c8961448a3d63b - vllm

Files

Rex 563836496a Refactor 2 awq gemm kernels into m16nXk32 (#2723 )

Co-authored-by: Chunan Zeng <chunanzeng@Chunans-Air.attlocal.net>

2024-02-12 11:02:17 -08:00

2024-02-12 11:02:17 -08:00

2024-02-01 09:35:09 -08:00

2024-01-03 09:52:29 -08:00

2024-01-03 09:52:29 -08:00