vllm/benchmarks/kernels/benchmark_trtllm_decode_attention.py at 998720859caadd8a8d2a3e2af8b3e6e34a42e8da

Files

Pavani Majety 1d353b6352 [Core] Always use tensor cores for Flashinfer Decode Wrapper (#23214 )

Signed-off-by: Pavani Majety <pmajety@nvidia.com>

2025-08-21 16:02:11 -04:00

View Raw