vllm/vllm/platforms at ec61ea20a83d56aaad83cb36bf6098625c564801 - vllm

Files

vllmellm 3c9396a64f [FEAT][ROCm]: Support AITER MLA on V1 Engine (#17523 )

Signed-off-by: vllmellm <vllm.ellm@embeddedllm.com>
Co-authored-by: qli88 <qiang.li2@amd.com>
Co-authored-by: Hongxia Yang <62075498+hongxiayang@users.noreply.github.com>

2025-05-09 10:42:05 +08:00

__init__.py

Add NeuronxDistributedInference support, Speculative Decoding, Dynamic on-device sampling (#16357 )

2025-05-07 00:07:30 -07:00

cpu.py

Add full API docs and improve the UX of navigating them (#17485 )

2025-05-03 19:42:43 -07:00

cuda.py

Add full API docs and improve the UX of navigating them (#17485 )

2025-05-03 19:42:43 -07:00

hpu.py

[Hardware][Intel-Gaudi] Multi-step scheduling implementation for HPU (#12779 )

2025-04-11 07:38:36 -07:00

interface.py

[FEAT][ROCm]: Support AITER MLA on V1 Engine (#17523 )

2025-05-09 10:42:05 +08:00

neuron.py

Add NeuronxDistributedInference support, Speculative Decoding, Dynamic on-device sampling (#16357 )

2025-05-07 00:07:30 -07:00

rocm.py

[FEAT][ROCm]: Support AITER MLA on V1 Engine (#17523 )

2025-05-09 10:42:05 +08:00

tpu.py

[Hardware][TPU][V1] Multi-LoRA implementation for the V1 TPU backend (#14238 )

2025-05-07 16:28:47 -04:00

xpu.py

[Hardware] add platform-specific request validation api (#16291 )

2025-04-09 12:50:01 -07:00