vllm/tests/v1/spec_decode at 8d52f2b3a7b75c9efe9eba906ab37780f6e4e5f3 - vllm

Files

Ekagra Ranjan e71b8e210d [Spec Decode] Add Batch Parallel Ngram. Upto 8x lower overhead. (#24986 )

Signed-off-by: Ekagra Ranjan <3116519+ekagra-ranjan@users.noreply.github.com>
Co-authored-by: Nick Hill <nhill@redhat.com>

2025-09-25 15:22:03 -07:00

test_eagle.py

2025-09-25 17:37:50 +00:00

test_max_len.py

2025-09-25 17:37:50 +00:00

test_ngram.py

2025-09-25 15:22:03 -07:00

test_tree_attention.py

2025-09-25 17:37:50 +00:00