vllm/csrc/quantization/cutlass_w8a8 at 0408efc6d0c17fba17b2be38d0d0f02e96d2bf9d - vllm

Files

Tyler Michael Smith c11de33dad [Bugfix][Kernel] Fix per-token/per-channel quantization for Hopper scaled mm (#12696 )

Signed-off-by: Tyler Michael Smith <tyler@neuralmagic.com>

2025-02-03 13:04:59 -08:00

2025-01-30 18:33:00 -08:00

Epilogues.md

2024-08-06 18:17:08 +00:00

scaled_mm_c2x_sm75_dispatch.cuh

2024-07-31 14:40:32 -07:00

scaled_mm_c2x_sm80_dispatch.cuh

2024-07-29 09:42:35 -06:00

scaled_mm_c2x_sm89_fp8_dispatch.cuh

2024-07-29 20:24:58 -06:00

scaled_mm_c2x_sm89_int8_dispatch.cuh

2024-07-29 20:24:58 -06:00

scaled_mm_c2x.cu

2025-01-05 10:20:34 +09:00

scaled_mm_c2x.cuh

2024-12-19 07:00:18 +00:00

scaled_mm_c3x.cu

2025-02-03 13:04:59 -08:00

scaled_mm_entry.cu

2025-01-31 15:29:11 -08:00