vllm/tests/v1 at b7954776fd338cab442a8004d240f7fe74e4e51b - vllm

Files

Woosuk Kwon a79b122400 [V1] Do not allocate beyond the max_model_len (#10730 )

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

2024-11-28 00:13:15 -08:00

2024-11-28 00:13:15 -08:00

2024-11-27 23:59:28 -08:00

__init__.py

2024-11-11 23:05:38 +00:00