vllm/vllm/lora at fd8e055ffba508e094cd1793e49bbdc5e53b7266 - vllm

Files

Varun Sundar Rabindranath 0b1cfa6180 [Kernel] LoRA - Enable CUDAGraphs for V1 (#14626 )

Signed-off-by: Varun Sundar Rabindranath <varun@neuralmagic.com>
Co-authored-by: Varun Sundar Rabindranath <varun@neuralmagic.com>

2025-03-13 20:42:04 -07:00

2025-03-10 17:27:53 -04:00

2025-03-13 20:42:04 -07:00

__init__.py

2024-01-23 15:26:37 -08:00

fully_sharded_layers.py

2025-02-25 23:43:01 -08:00

layers.py

2025-03-13 20:42:04 -07:00

lora.py

2025-02-02 11:58:18 -08:00

models.py

2025-03-10 17:27:53 -04:00

peft_helper.py

2025-02-25 23:43:01 -08:00

request.py

2025-02-02 11:58:18 -08:00

utils.py

2025-03-05 15:06:28 +00:00

worker_manager.py

2025-02-22 00:21:30 -08:00