vllm/csrc/quantization/w8a8 at 9f14c9224d3d6664e2f5a2e7fecd012fd048fcb1 - vllm

Files

Lain 089cd4f002 fix cutlass_3x_gemm_fp8_blockwise on sm103a (#32224 )

Signed-off-by: Siyuan Fu <siyuanf@nvidia.com>
Co-authored-by: Pavani Majety <pmajety@nvidia.com>

2026-02-02 11:47:46 -08:00

2026-02-02 11:47:46 -08:00

2026-01-09 12:49:27 -08:00

2025-11-08 14:31:33 -08:00

per_token_group_quant_8bit.h

2025-10-08 10:20:48 -04:00