vllm/vllm/lora at 5ff0d32580eb4daadadece5ee39d33f43f230108 - vllm

Files

Varun Sundar Rabindranath 5ff0d32580 [V1] LoRA - Add triton kernels for V1 (#13096 )

Signed-off-by: Varun Sundar Rabindranath <varun@neuralmagic.com>
Co-authored-by: Varun Sundar Rabindranath <varun@neuralmagic.com>

2025-03-10 17:27:53 -04:00

2025-03-10 17:27:53 -04:00

2025-03-10 17:27:53 -04:00

__init__.py

2024-01-23 15:26:37 -08:00

fully_sharded_layers.py

2025-02-25 23:43:01 -08:00

layers.py

2025-03-06 22:05:47 -08:00

lora.py

2025-02-02 11:58:18 -08:00

models.py

2025-03-10 17:27:53 -04:00

peft_helper.py

2025-02-25 23:43:01 -08:00

request.py

2025-02-02 11:58:18 -08:00

utils.py

2025-03-05 15:06:28 +00:00

worker_manager.py

2025-02-22 00:21:30 -08:00