vllm/vllm/model_executor/warmup at c4afdb69cc22a23d23886528147b956796c1000c - vllm

Files

Lucas Wilkinson 2e6bc46821 [Startup] Make DeepGEMM warmup scale with max-num-batched-tokens (#24693 )

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>

2025-09-11 20:10:19 -04:00

__init__.py

2025-08-10 05:49:51 -07:00

deep_gemm_warmup.py

2025-09-11 20:10:19 -04:00

kernel_warmup.py

2025-09-11 17:04:56 -04:00