vllm/vllm/v1/core at 6edd43de3ce2aa9ca93b8ece656af7547526afd3 - vllm

Files

jaime campos salas 891c60dcd5 fix(kv-cache): increase hybrid attention grouping threshold from 1.25 to 1.5 (#36684 )

Signed-off-by: Jaime Campos Salas <jaime.campos.salas@gmail.com>

2026-03-12 23:28:27 -04:00

2026-03-11 19:40:17 +00:00

__init__.py

…

block_pool.py

2026-02-20 20:11:40 -08:00

encoder_cache_manager.py

2026-02-02 23:27:00 +08:00

kv_cache_coordinator.py

2026-02-10 07:41:16 +00:00

kv_cache_manager.py

2026-03-10 03:32:20 -07:00

kv_cache_metrics.py

2025-12-01 18:27:53 +00:00

kv_cache_utils.py

2026-03-12 23:28:27 -04:00

single_type_kv_cache_manager.py

2026-03-10 03:32:20 -07:00