vllm/tests/v1/tpu at e74ff409e0f8f3cacb8a251a1cae8b478721cead - vllm

Files

Chenyaaang ac3cd6e83c [core] add bucket padding to tpu_model_runner (#14995 )

Signed-off-by: Chenyaaang <llccyy1212@gmail.com>
Signed-off-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>
Co-authored-by: rshaw@neuralmagic.com <robertgshaw2@gmail.com>

2025-03-25 17:27:22 -04:00

worker

[core] add bucket padding to tpu_model_runner (#14995 )

2025-03-25 17:27:22 -04:00

__init__.py

[V1] TPU - Add tensor parallel support via Ray (#13618 )

2025-03-08 08:19:38 -05:00

test_basic.py

[V1] TPU - CI/CD use smaller model (#15054 )

2025-03-18 21:39:21 +00:00

test_mha_attn.py

[TPU][V1] MHA Pallas backend (#15288 )

2025-03-21 08:50:39 -07:00

test_sampler.py

[V1][TPU] Speed up top-k on TPU by using torch.topk (#15242 )

2025-03-20 19:19:40 -07:00