vllm/csrc/moe at 12e582922145bc7441e2f20e451dd161d4ffe828 - vllm

Files

Chiyue Wei 61059bee40 [Hardware][NVIDIA] FP4 MoE kernel optimization (#19110 )

Signed-off-by: Chiyue Wei <chiyuew@nvidia.com>
Co-authored-by: Chiyue Wei <chiyuew@nvidia.com>

2025-06-05 09:48:26 -07:00

2025-06-03 11:20:17 -07:00

2025-06-05 09:48:26 -07:00

moe_align_sum_kernels.cu

2025-05-14 13:11:54 -07:00

moe_ops.h

2025-06-05 09:48:26 -07:00

moe_permute_unpermute_op.cu

2025-06-05 09:48:26 -07:00

moe_wna16_utils.h

2025-04-29 06:46:55 -07:00

moe_wna16.cu

2025-04-17 22:13:29 -07:00

topk_softmax_kernels.cu

2025-06-03 12:30:02 -07:00

torch_bindings.cpp

2025-06-05 09:48:26 -07:00