vllm/tests/v1/spec_decode at c2fa2d4dc9f5db97635496c0019372c65266e12f - vllm

Files

Ekagra Ranjan e71b8e210d [Spec Decode] Add Batch Parallel Ngram. Upto 8x lower overhead. (#24986 )

Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>
Co-authored-by: Nick Hill <nhill@redhat.com>

2025-09-25 15:22:03 -07:00

test_eagle.py

2025-09-25 17:37:50 +00:00

test_max_len.py

2025-09-25 17:37:50 +00:00

test_ngram.py

2025-09-25 15:22:03 -07:00

test_tree_attention.py

2025-09-25 17:37:50 +00:00