vllm/csrc/quantization/fused_kernels at 9d2a44606d6b95b4e6aa7b6c75ae3a87f0560ede - vllm

Files

Michael Goin e31446b6c8 [Perf] Tune scaled_fp8_quant by increasing vectorization (#18844 )

Signed-off-by: mgoin <mgoin64@gmail.com>

2025-06-03 13:48:25 -07:00

fused_layernorm_dynamic_per_token_quant.cu

2025-04-28 19:23:18 -07:00

layernorm_utils.cuh

2025-06-03 13:48:25 -07:00

quant_conversions.cuh

2025-05-12 20:36:33 -07:00