vllm/csrc/quantization/fused_kernels at 650d5dbd04e92f5043a11e4a4d86d4f39ee1b694 - vllm

Files

Michael Goin e31446b6c8 [Perf] Tune scaled_fp8_quant by increasing vectorization (#18844 )

Signed-off-by: mgoin <mgoin64@gmail.com>

2025-06-03 13:48:25 -07:00

fused_layernorm_dynamic_per_token_quant.cu

2025-04-28 19:23:18 -07:00

layernorm_utils.cuh

2025-06-03 13:48:25 -07:00

quant_conversions.cuh

2025-05-12 20:36:33 -07:00