vllm/csrc/quantization/fp4 at 1ac66942975e163d3cc8a4bbb9b1832f9f7edc05 - vllm

Files

Johnny b4a2f3ac36 [NVIDIA] Bugfix NVFP4 DGX Spark and RTX50 (#38423 )

Signed-off-by: johnnynunez <johnnynuca14@gmail.com>
Signed-off-by: Johnny <johnnynuca14@gmail.com>

2026-03-30 09:36:18 -07:00

activation_nvfp4_quant_fusion_kernels.cu

2026-02-27 16:28:17 -08:00

nvfp4_blockwise_moe_kernel.cu

2026-01-07 13:31:26 -05:00

nvfp4_experts_quant.cu

2026-02-27 16:28:17 -08:00

nvfp4_quant_entry.cu

2026-03-30 09:36:18 -07:00

nvfp4_quant_kernels.cu

2026-02-27 16:28:17 -08:00

nvfp4_scaled_mm_entry.cu

2026-03-30 09:36:18 -07:00

nvfp4_scaled_mm_kernels.cu

2025-07-11 10:05:33 -06:00

nvfp4_scaled_mm_sm120_kernels.cu

2025-08-03 00:54:22 -07:00

nvfp4_utils.cuh

2026-03-16 18:51:46 -04:00