vllm/csrc/quantization/fp8 at fc5f756db4ce3d0cc5b1c495bd70a4b5601cffe2 - vllm

Files

Wentao Ye 774d0c014b [Perf] Cuda Kernel for Per Token Group Quant (#21083 )

Signed-off-by: yewentao256 <zhyanwentao@126.com>

2025-07-22 07:27:15 -07:00

2025-06-15 20:05:28 -07:00

2024-08-05 16:00:01 -04:00

common.cu

2025-07-22 07:07:44 -07:00

common.cuh

2025-06-03 13:48:25 -07:00

per_token_group_quant.cu

2025-07-22 07:27:15 -07:00