vllm/tests/worker at fa0c114fad4e2b807503e78d5110558cfee92ba4 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

History

sroy745 1009e93c5d [Encoder decoder] Add cuda graph support during decoding for encoder-decoder models (#7631 )

2024-09-17 07:35:01 -07:00

..

__init__.py

[Speculative decoding 2/9] Multi-step worker for draft model (#2424 )

2024-01-21 16:31:47 -08:00

test_encoder_decoder_model_runner.py

[Encoder decoder] Add cuda graph support during decoding for encoder-decoder models (#7631 )

2024-09-17 07:35:01 -07:00

test_model_input.py

[Core] Add AttentionState abstraction (#7663 )

2024-08-20 18:50:45 +00:00

test_model_runner.py

[Core] Optimize SPMD architecture with delta + serialization optimization (#7109 )

2024-08-18 17:57:20 -07:00

test_swap.py

[Core] Pipeline Parallel Support (#4412 )

2024-07-02 10:58:08 -07:00