vllm/csrc/quantization/fused_kernels at 51d41265ad841a3b6efea665c83cdc5d54eb7c1d - vllm

Files

Michael Goin e31446b6c8 [Perf] Tune scaled_fp8_quant by increasing vectorization (#18844 )

Signed-off-by: mgoin <mgoin64@gmail.com>

2025-06-03 13:48:25 -07:00

fused_layernorm_dynamic_per_token_quant.cu

2025-04-28 19:23:18 -07:00

layernorm_utils.cuh

2025-06-03 13:48:25 -07:00

quant_conversions.cuh

2025-05-12 20:36:33 -07:00