vllm/csrc/quantization/fused_kernels at 37f86d90489dd47b3f9ac4dba8cd38d5907b016f - vllm

Files

Michael Goin e31446b6c8 [Perf] Tune scaled_fp8_quant by increasing vectorization (#18844 )

Signed-off-by: mgoin <mgoin64@gmail.com>

2025-06-03 13:48:25 -07:00

fused_layernorm_dynamic_per_token_quant.cu

2025-04-28 19:23:18 -07:00

layernorm_utils.cuh

2025-06-03 13:48:25 -07:00

quant_conversions.cuh

2025-05-12 20:36:33 -07:00