vllm/csrc/quantization/fused_kernels at fb25e956885e464cb309b53e5e92d36a59542607 - vllm

Files

Michael Goin e31446b6c8 [Perf] Tune scaled_fp8_quant by increasing vectorization (#18844 )

Signed-off-by: mgoin <mgoin64@gmail.com>

2025-06-03 13:48:25 -07:00

fused_layernorm_dynamic_per_token_quant.cu

2025-04-28 19:23:18 -07:00

layernorm_utils.cuh

2025-06-03 13:48:25 -07:00

quant_conversions.cuh

2025-05-12 20:36:33 -07:00