vllm/vllm/model_executor at 557389473755bff50b6d00c03ca5c68e5c37c9a0 - vllm

Files

Jhao-Ting Chen 5573894737 Kimi k2.5 MLA based eagle3 (#36361 )

Signed-off-by: Izzy Putterman <iputterman@nvidia.com>
Signed-off-by: Jhao-Ting Chen <jhaotingc@nvidia.com>
Co-authored-by: Izzy Putterman <iputterman@nvidia.com>

2026-03-11 11:36:11 -04:00

kernels

[Misc] Use envs module to get VLLM_DISABLED_KERNELS (#35776 )

2026-03-11 13:37:46 +00:00

layers

Add XPU MLA Sparse backend for DeepSeek v3.2 (#33230 )

2026-03-11 19:19:15 +08:00

model_loader

fix: Use iterator as not to store all the file loads in memory at once (#36149 )

2026-03-08 20:25:21 -07:00

models

Kimi k2.5 MLA based eagle3 (#36361 )

2026-03-11 11:36:11 -04:00

offloader

[UX] Remove NoOpOffloader log (#35678 )

2026-03-04 12:13:40 -08:00

warmup

[MoE Refactor] Create MK for TRTLLM Kernels (#32564 )

2026-03-03 10:39:50 -08:00

__init__.py

[Platform] Deprecate seed_everything (#31659 )

2026-01-04 18:34:04 -08:00

custom_op.py

[Model Bash][DSR1] Add selective dynamic shape marking for CustomOp (#34900 )

2026-02-21 19:28:01 -05:00

parameter.py

[QeRL] Layerwise Reloading (#32133 )

2026-01-30 08:50:05 -07:00

utils.py

[BugFix] Fix EPLB fail for MoeFP4 model with Marlin backend (#33262 )

2026-01-29 16:52:11 +08:00