vllm/vllm/v1/core at 48ddb02b79d7e22e2eefbf5294bf70de50afd1b2 - vllm

Files

Yifan Qiao 48ddb02b79 [Hybrid Allocator] Support KV cache groups with different block_size (#29143 )

Signed-off-by: Yifan Qiao <yifanqiao@berkeley.edu>
Co-authored-by: Chen Zhang <zhangch99@outlook.com>

2025-11-25 10:30:57 -05:00

2025-11-25 10:30:57 -05:00

__init__.py

2024-10-22 01:24:07 -07:00

block_pool.py

2025-11-25 10:30:57 -05:00

encoder_cache_manager.py

2025-10-24 23:56:01 -07:00

kv_cache_coordinator.py

2025-11-25 10:30:57 -05:00

kv_cache_manager.py

2025-11-25 10:30:57 -05:00

kv_cache_utils.py

2025-11-25 10:30:57 -05:00

single_type_kv_cache_manager.py

2025-11-25 10:30:57 -05:00