vllm/csrc/quantization/fp4 at b634e619bbcfed0abe4e01d0e2d97fb1fdfdbbd5 - vllm

Files

Michael Goin f347ac6c34 [Perf] Fuse stride preparation for NVFP4 cutlass_moe (#31837 )

Signed-off-by: mgoin <mgoin64@gmail.com>

2026-01-07 13:31:26 -05:00

activation_nvfp4_quant_fusion_kernels.cu

2025-12-21 09:41:57 -08:00

nvfp4_blockwise_moe_kernel.cu

2026-01-07 13:31:26 -05:00

nvfp4_experts_quant.cu

2025-12-21 09:41:57 -08:00

nvfp4_quant_entry.cu

2025-11-25 06:59:07 -08:00

nvfp4_quant_kernels.cu

2025-12-23 08:45:18 -08:00

nvfp4_scaled_mm_entry.cu

2025-12-01 17:24:18 -08:00

nvfp4_scaled_mm_kernels.cu

2025-07-11 10:05:33 -06:00

nvfp4_scaled_mm_sm120_kernels.cu

2025-08-03 00:54:22 -07:00

nvfp4_utils.cuh

2025-12-21 09:41:57 -08:00