vllm/vllm/v1/attention/ops at a28b94e6ef60b7f5aa1b97bc8d966a8d12cbc1da - vllm

Files

Lucas Wilkinson 889722f3bf [FlashMLA] Update FlashMLA to expose new arguments (#32810 )

Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>

2026-01-21 22:02:39 -07:00

__init__.py

…

chunked_prefill_paged_decode.py

…

common.py

…

flashmla.py

2026-01-21 22:02:39 -07:00

merge_attn_states.py

…

paged_attn.py

2026-01-10 00:27:15 +00:00

prefix_prefill.py

…

rocm_aiter_mla_sparse.py

2026-01-21 23:16:30 +08:00

triton_decode_attention.py

…

triton_merge_attn_states.py

…

triton_prefill_attention.py

2026-01-17 20:19:59 -08:00

triton_reshape_and_cache_flash.py

…

triton_unified_attention.py

2026-01-18 10:20:46 +00:00

vit_attn_wrappers.py

2026-01-09 22:01:38 -05:00