vllm/tests/models/language at 3a7e3bbdd255b470d37727a31cc0471aa0fe6ecb - vllm

Files

wang.yuqi 84cf78acee [Model] Pooling models default to using chunked prefill & prefix caching if supported. (#20930 )

Signed-off-by: wang.yuqi <noooop@126.com>

2025-08-11 09:41:37 -07:00

2025-08-09 20:16:11 -07:00

2025-08-11 09:41:37 -07:00

__init__.py

2025-04-30 23:03:08 -07:00