vllm/csrc/quantization/w8a8/cutlass/c3x at 6951fcd44fdd8a3a4d6b39b19b000604885a295f - vllm

Files

wenshuai cd43673668 [Perf] Optimize FP8 gemm of sm120. (#34424 )

Signed-off-by: wenshuai <wenshuai@xiaomi.com>

2026-02-24 22:25:24 -08:00

cutlass_gemm_caller.cuh

…

scaled_mm_azp_sm90_int8.cu

…

scaled_mm_blockwise_sm90_fp8_dispatch.cuh

2025-11-11 11:46:04 -05:00

scaled_mm_blockwise_sm90_fp8.cu

…

scaled_mm_blockwise_sm100_fp8_dispatch.cuh

2026-02-02 11:47:46 -08:00

scaled_mm_blockwise_sm100_fp8.cu

…

scaled_mm_blockwise_sm120_fp8_dispatch.cuh

2026-02-06 20:28:01 -08:00

scaled_mm_blockwise_sm120_fp8.cu

…

scaled_mm_helper.hpp

…

scaled_mm_kernels.hpp

…

scaled_mm_sm90_fp8_dispatch.cuh

2025-11-14 09:59:11 -08:00

scaled_mm_sm90_fp8.cu

…

scaled_mm_sm90_int8_dispatch.cuh

…

scaled_mm_sm90_int8.cu

…

scaled_mm_sm100_fp8_dispatch.cuh

2026-02-02 11:47:46 -08:00

scaled_mm_sm100_fp8.cu

…

scaled_mm_sm120_fp8_dispatch.cuh

2026-02-24 22:25:24 -08:00

scaled_mm_sm120_fp8.cu

…

scaled_mm.cuh

2026-02-02 11:47:46 -08:00