vllm/csrc/quantization/fp4 at 2ac74d098ef7b8748db0cdaa255eeceb5cdd5366 - vllm

Files

Kaixi Hou ed7a29d9f8 [NVIDIA] Support Cutlass MLA for Blackwell GPUs (#16032 )

Signed-off-by: kaixih <kaixih@nvidia.com>

2025-04-27 06:29:21 -07:00

nvfp4_quant_entry.cu

2025-02-12 19:51:51 -08:00

nvfp4_quant_kernels.cu

2025-02-20 22:01:48 -08:00

nvfp4_scaled_mm_entry.cu

2025-03-12 05:13:11 +00:00

nvfp4_scaled_mm_kernels.cu

2025-04-27 06:29:21 -07:00