vllm/vllm/v1/attention/backends at 61e20828da1639c05a7bb7d1592c4834e10b33b7 - vllm

Files

Cyrus Leung e8cc53af5e [Misc] Log the reason for falling back to FlexAttention (#20699 )

Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>

2025-07-14 04:16:51 -07:00

2025-07-14 04:16:51 -07:00

__init__.py

2024-10-22 01:24:07 -07:00

cpu_attn.py

2025-07-14 04:16:51 -07:00

flash_attn.py

2025-07-14 04:16:51 -07:00

flashinfer.py

2025-07-14 04:16:51 -07:00

flex_attention.py

2025-07-14 04:16:51 -07:00

mamba_attn.py

2025-07-11 05:53:31 +00:00

pallas.py

2025-07-08 05:16:16 +00:00

rocm_aiter_fa.py

2025-07-14 04:16:51 -07:00

triton_attn.py

2025-07-14 04:16:51 -07:00

utils.py

2025-07-11 09:23:23 +00:00