vllm/csrc/moe at 33f8dba7c68a0dfae762f902da5e894cd27e2c3a - vllm

Files

Chiyue Wei 61059bee40 [Hardware][NVIDIA] FP4 MoE kernel optimization (#19110 )

Signed-off-by: Chiyue Wei <chiyuew@nvidia.com>
Co-authored-by: Chiyue Wei <chiyuew@nvidia.com>

2025-06-05 09:48:26 -07:00

2025-06-03 11:20:17 -07:00

2025-06-05 09:48:26 -07:00

moe_align_sum_kernels.cu

2025-05-14 13:11:54 -07:00

moe_ops.h

2025-06-05 09:48:26 -07:00

moe_permute_unpermute_op.cu

2025-06-05 09:48:26 -07:00

moe_wna16_utils.h

2025-04-29 06:46:55 -07:00

moe_wna16.cu

2025-04-17 22:13:29 -07:00

topk_softmax_kernels.cu

2025-06-03 12:30:02 -07:00

torch_bindings.cpp

2025-06-05 09:48:26 -07:00