vllm/tests/entrypoints/llm at 1bbbcc0b1d96384a72b13d34600b1bdd24cb0f7f - vllm

Files

Joe Runde de4008e2ab [Bugfix][Core] Use torch.cuda.memory_stats() to profile peak memory usage (#9352 )

Signed-off-by: Joe Runde <Joseph.Runde@ibm.com>

2024-10-17 22:47:27 -04:00

__init__.py

2024-06-30 12:58:49 +08:00

test_encode.py

2024-09-26 20:35:15 -07:00

test_generate_multiple_loras.py

2024-09-05 18:10:33 -07:00

test_generate.py

2024-09-26 20:35:15 -07:00

test_guided_generate.py

2024-10-01 09:34:25 +08:00

test_lazy_outlines.py

2024-10-17 22:47:27 -04:00

test_prompt_validation.py

2024-08-23 13:12:44 +00:00