vllm/csrc/quantization/w8a8/cutlass/c3x at 8a24842765ba9b45b0116d65b16c2d5b1fcb7e05 - vllm

Files

wenshuai cd43673668 [Perf] Optimize FP8 gemm of sm120. (#34424 )

Signed-off-by: wenshuai <wenshuai@xiaomi.com>

2026-02-24 22:25:24 -08:00

cutlass_gemm_caller.cuh

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_azp_sm90_int8.cu

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_blockwise_sm90_fp8_dispatch.cuh

Remove weight_scale.T special case for SM90 Block FP8 CUTLASS kernel (#28431 )

2025-11-11 11:46:04 -05:00

scaled_mm_blockwise_sm90_fp8.cu

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_blockwise_sm100_fp8_dispatch.cuh

fix cutlass_3x_gemm_fp8_blockwise on sm103a (#32224 )

2026-02-02 11:47:46 -08:00

scaled_mm_blockwise_sm100_fp8.cu

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_blockwise_sm120_fp8_dispatch.cuh

[Kernel] Add enable_sm120_or_later for SM121 (DGX Spark) CUTLASS support (#33517 )

2026-02-06 20:28:01 -08:00

scaled_mm_blockwise_sm120_fp8.cu

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_helper.hpp

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_kernels.hpp

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_sm90_fp8_dispatch.cuh

[kernel] Improve FP8 PTPC on Hopper for larger shapes (#28692 )

2025-11-14 09:59:11 -08:00

scaled_mm_sm90_fp8.cu

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_sm90_int8_dispatch.cuh

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_sm90_int8.cu

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm_sm100_fp8_dispatch.cuh

fix cutlass_3x_gemm_fp8_blockwise on sm103a (#32224 )

2026-02-02 11:47:46 -08:00

scaled_mm_sm100_fp8.cu

[Perf] SM100 - add swap AB optimization to CUTLASS FP8 GEMM (#27284 )

2025-11-04 07:49:25 -08:00

scaled_mm_sm120_fp8_dispatch.cuh

[Perf] Optimize FP8 gemm of sm120. (#34424 )

2026-02-24 22:25:24 -08:00

scaled_mm_sm120_fp8.cu

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00

scaled_mm.cuh

fix cutlass_3x_gemm_fp8_blockwise on sm103a (#32224 )

2026-02-02 11:47:46 -08:00