vllm/csrc/quantization/w8a8 at 1d367a738e9098ad4af1f6865747914ccd2c65ca - vllm

Files

Lain 089cd4f002 fix cutlass_3x_gemm_fp8_blockwise on sm103a (#32224 )

Signed-off-by: Siyuan Fu <siyuanf@nvidia.com>
Co-authored-by: Pavani Majety <pmajety@nvidia.com>

2026-02-02 11:47:46 -08:00

2026-02-02 11:47:46 -08:00

2026-01-09 12:49:27 -08:00

2025-11-08 14:31:33 -08:00

per_token_group_quant_8bit.h

2025-10-08 10:20:48 -04:00