vllm/csrc/quantization/cutlass_w8a8 at 77a6bf07aedf132aad2b6719f6d87abc5d3311ab - vllm

Files

Junhao Li 3303f134e0 [Kernel] Add support for block FP8 on SM120 (NVIDIA 5090 and RTX PRO 6000) (#22131 )

Signed-off-by: Junhao Li <junhao@ubicloud.com>

2025-08-07 19:18:28 -07:00

2025-08-07 19:18:28 -07:00

2025-07-24 08:13:24 -07:00

Epilogues.md

2025-07-29 19:45:08 -07:00

scaled_mm_c2x_sm75_dispatch.cuh

…

scaled_mm_c2x_sm80_dispatch.cuh

…

scaled_mm_c2x_sm89_fp8_dispatch.cuh

2025-04-27 19:38:42 -07:00

scaled_mm_c2x_sm89_int8_dispatch.cuh

2025-04-27 19:38:42 -07:00

scaled_mm_c2x.cu

…

scaled_mm_c2x.cuh

…

scaled_mm_c3x_sm90.cu

2025-05-08 15:09:55 -07:00

scaled_mm_c3x_sm100.cu

2025-05-08 15:09:55 -07:00

scaled_mm_c3x_sm120.cu

2025-08-07 19:18:28 -07:00

scaled_mm_entry.cu

2025-07-22 07:27:12 -07:00