vllm/vllm/v1/sample at 65e262b93bef6e32482dbeed4027fe4ced680fe9 - vllm

Files

Woosuk Kwon 41fb013d29 [V1][Spec Decode] Always use argmax for sampling draft tokens (#16899 )

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

2025-04-23 14:57:43 -07:00

2025-04-17 18:18:11 +00:00

2025-04-22 00:46:07 +00:00

__init__.py

2024-10-22 01:24:07 -07:00

metadata.py

2025-03-08 14:50:26 -08:00

rejection_sampler.py

2025-04-23 14:57:43 -07:00

sampler.py

2025-04-12 20:19:19 +00:00