vllm/csrc/quantization/cutlass_w8a8/moe at 57f94e88ea1ed2e48ea8ea9b01e9591f0d79557b - vllm

Files

shixianc b17109beea [Kernel] CUTLASS MoE FP8: Integrate cuda moe permute/unpermute (#23045 )

Signed-off-by: Shixian Cui <shixian@amazon.com>

2025-08-20 10:35:26 -04:00

blockwise_scaled_group_mm_sm100.cu

2025-07-11 02:39:18 +00:00

get_group_starts.cuh

2025-08-20 10:35:26 -04:00

grouped_mm_c3x_sm90.cu

2025-07-22 07:27:12 -07:00

grouped_mm_c3x_sm100.cu

2025-07-22 07:27:12 -07:00

grouped_mm_c3x.cuh

2025-07-22 07:27:12 -07:00

moe_data.cu

2025-08-20 10:35:26 -04:00