vllm/tests/v1/spec_decode at 6de3d431d911eff03a3e1b69233f68b5e7f8a472 - vllm

Files

Ekagra Ranjan e71b8e210d [Spec Decode] Add Batch Parallel Ngram. Upto 8x lower overhead. (#24986 )

Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>
Co-authored-by: Nick Hill <nhill@redhat.com>

2025-09-25 15:22:03 -07:00

test_eagle.py

2025-09-25 17:37:50 +00:00

test_max_len.py

2025-09-25 17:37:50 +00:00

test_ngram.py

2025-09-25 15:22:03 -07:00

test_tree_attention.py

2025-09-25 17:37:50 +00:00