vllm/csrc/quantization/fused_kernels at cd32d6f5868a040430a88c4423e3307116feb433 - vllm

Files

Luka Govedič 9556af87d5 [torch.compile] Add support for non-contiguous fused RMSNorm + group quant (#36551 )

Signed-off-by: Luka Govedič <lgovedic@redhat.com>
Signed-off-by: Luka Govedič <ProExpertProg@users.noreply.github.com>
Co-authored-by: Copilot <198982749+Copilot@users.noreply.github.com>
Co-authored-by: ProExpertProg <11367180+ProExpertProg@users.noreply.github.com>

2026-03-11 10:56:55 -07:00

fused_layernorm_dynamic_per_token_quant.cu

[torch.compile] Add support for non-contiguous fused RMSNorm + group quant (#36551 )

2026-03-11 10:56:55 -07:00

layernorm_utils.cuh

[torch.compile] Add support for non-contiguous fused RMSNorm + group quant (#36551 )

2026-03-11 10:56:55 -07:00

quant_conversions.cuh

[Refactor] Refactor FP8 & INT8 Quant Folder inside w8a8 (#25293 )

2025-10-08 10:20:48 -04:00