vllm/benchmarks/attention_benchmarks/configs at 9f9ecff4cdff5b8847f541b896c0ca081397cc51 - vllm

Files

Matthew Bonanni f444c05c32 [Attention] Use FA4 for MLA prefill (#34732 )

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>

2026-03-12 12:10:17 -04:00

mla_decode.yaml

2026-02-12 17:21:54 +00:00

mla_mixed_batch.yaml

2026-02-12 17:21:54 +00:00

mla_prefill.yaml

2026-03-12 12:10:17 -04:00

mla_sparse_prefill.yaml

2026-03-12 12:10:17 -04:00

reorder_threshold.yaml

2026-02-12 17:21:54 +00:00

speculative_decode.yaml

2026-02-12 17:21:54 +00:00

standard_attention.yaml

2026-02-12 17:21:54 +00:00