vllm/csrc/quantization/fp4 at 44d3b1df3d6416b76d84c360d751b8f5220c0b11 - vllm

Files

Hendrik Holtmann c0dfc89485 SM120 / NVFP4: add device guard and runtime SM dispatch to cutlass_scaled_fp4_mm (#29711 )

Signed-off-by: mgoin <mgoin64@gmail.com>
Co-authored-by: mgoin <mgoin64@gmail.com>

2025-12-01 17:24:18 -08:00

activation_nvfp4_quant_fusion_kernels.cu

2025-09-19 16:23:19 -06:00

nvfp4_blockwise_moe_kernel.cu

2025-11-25 06:59:07 -08:00

nvfp4_experts_quant.cu

2025-11-25 06:59:07 -08:00

nvfp4_quant_entry.cu

2025-11-25 06:59:07 -08:00

nvfp4_quant_kernels.cu

2025-11-07 04:18:39 -08:00

nvfp4_scaled_mm_entry.cu

2025-12-01 17:24:18 -08:00

nvfp4_scaled_mm_kernels.cu

2025-07-11 10:05:33 -06:00

nvfp4_scaled_mm_sm120_kernels.cu

2025-08-03 00:54:22 -07:00

nvfp4_utils.cuh

2025-09-04 14:25:45 -07:00