vllm/vllm/worker at c09dade2a263b6f684d2fbf390c9c1c64761e953 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

History

Antoni Baum ccdc490dda [Core] Change LoRA embedding sharding to support loading methods (#5038 )

2024-06-06 19:07:57 -07:00

..

__init__.py

Change the name to vLLM (#150 )

2023-06-17 03:07:40 -07:00

cache_engine.py

[Core] Sliding window for block manager v2 (#4545 )

2024-05-28 11:07:07 +09:00

cpu_model_runner.py

[Core] Support image processor (#4197 )

2024-06-02 22:56:41 -07:00

cpu_worker.py

[Misc] Enhance attention selector (#4751 )

2024-05-13 10:47:25 -07:00

embedding_model_runner.py

[Core] Support image processor (#4197 )

2024-06-02 22:56:41 -07:00

model_runner.py

[Core] Change LoRA embedding sharding to support loading methods (#5038 )

2024-06-06 19:07:57 -07:00

neuron_model_runner.py

[Core][Model runner refactoring 1/N] Refactor attn metadata term (#4518 )

2024-05-03 10:20:12 -07:00

neuron_worker.py

[Core] RayWorkerVllm --> WorkerWrapper to reduce duplication (#4024 )

2024-04-17 08:34:33 +00:00

worker_base.py

[Core][Optimization] remove vllm-nccl (#5091 )

2024-05-29 05:13:52 +00:00

worker.py

[Core] Eliminate parallel worker per-step task scheduling overhead (#4894 )

2024-05-23 06:17:27 +09:00