vllm/csrc/quantization/fp4 at 12c007e288bf5c0ae3bd438036fbafbad88e706b - vllm

Files

Pavani Majety 72b1c2ae2c [Bugfix] Use latency MOE backend as default for Flashinfer and other misc fixes (#27439 )

Signed-off-by: Pavani Majety <pmajety@nvidia.com>

2025-11-07 04:18:39 -08:00

activation_nvfp4_quant_fusion_kernels.cu

2025-09-19 16:23:19 -06:00

nvfp4_blockwise_moe_kernel.cu

2025-10-02 20:32:38 -07:00

nvfp4_experts_quant.cu

2025-09-19 16:23:19 -06:00

nvfp4_quant_entry.cu

2025-09-04 14:25:45 -07:00

nvfp4_quant_kernels.cu

2025-11-07 04:18:39 -08:00

nvfp4_scaled_mm_entry.cu

2025-08-03 00:54:22 -07:00

nvfp4_scaled_mm_kernels.cu

2025-07-11 10:05:33 -06:00

nvfp4_scaled_mm_sm120_kernels.cu

2025-08-03 00:54:22 -07:00

nvfp4_utils.cuh

2025-09-04 14:25:45 -07:00