vllm/vllm/v1/attention/backends at 0578e5a462dff347ee475913da7c2f91f60c9bc3 - vllm

Files

Chengji Yao 0578e5a462 [Hardware][TPU]Enable ragged paged attention kernel and resolve recompilation issue (#14310 )

Signed-off-by: Chengji Yao <chengjiyao@google.com>

2025-03-06 23:31:05 +00:00

2025-03-06 14:18:29 -08:00

__init__.py

2024-10-22 01:24:07 -07:00

flash_attn.py

2025-03-06 14:18:29 -08:00

pallas.py

2025-03-06 23:31:05 +00:00

rocm_attn.py

2025-03-06 07:39:16 -08:00