vllm/vllm/v1/spec_decode at d215d1efca7a18eb2a19007f229bbb070bfbee93 - vllm

Files

Matthias Gehre a889b7f584 [Bugfix] Pass drafter quant_config to ParallelLMHead in Eagle3 (#37280 )

Signed-off-by: Matthias Gehre <matthias.gehre@amd.com>

2026-03-25 11:42:58 +00:00

__init__.py

2025-02-16 09:39:08 -08:00

draft_model.py

2026-02-05 12:37:18 -05:00

eagle.py

2026-03-25 11:42:58 +00:00

extract_hidden_states.py

2026-03-23 15:37:22 -04:00

medusa.py

2026-01-30 06:43:32 +00:00

metadata.py

2025-10-22 22:59:59 -07:00

metrics.py

2026-03-20 16:11:34 +00:00

ngram_proposer_gpu.py

2026-03-17 05:19:55 +00:00

ngram_proposer.py

2026-01-23 17:28:06 -08:00

suffix_decoding.py

2026-01-30 06:43:32 +00:00

utils.py

2026-03-23 15:37:22 -04:00