vllm/vllm/v1/spec_decode at d1b837f0ae6a0152d820194a181e809ffaef6864 - vllm

Files

Zhengkai Zhang 6f2f59f2b3 [Misc][Spec Decode] support different load config for draft model (#34022 )

Signed-off-by: zzhengkai <zzhengkai@devgpu049.ldc1.facebook.com>
Co-authored-by: zzhengkai <zzhengkai@devgpu049.ldc1.facebook.com>

2026-02-10 14:52:43 -08:00

__init__.py

2025-02-16 09:39:08 -08:00

draft_model.py

2026-02-05 12:37:18 -05:00

eagle.py

2026-02-10 14:52:43 -08:00

medusa.py

2026-01-30 06:43:32 +00:00

metadata.py

2025-10-22 22:59:59 -07:00

metrics.py

2025-11-28 08:39:27 -08:00

ngram_proposer.py

2026-01-23 17:28:06 -08:00

suffix_decoding.py

2026-01-30 06:43:32 +00:00

utils.py

2026-02-05 12:37:18 -05:00