vllm/benchmarks/attention_benchmarks/configs at 2f2c1d73a745d8a38d1a21a5865a7d53d8d616b7 - vllm

Files

Matthew Bonanni f2c47886fd [Attention] Add FlashInfer Sparse MLA backend (#33451 )

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Co-authored-by: Lucas Wilkinson <lwilkins@redhat.com>
Co-authored-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>

2026-02-12 17:21:54 +00:00

mla_decode.yaml

[Attention] Add FlashInfer Sparse MLA backend (#33451 )

2026-02-12 17:21:54 +00:00

mla_mixed_batch.yaml

[Attention] Add FlashInfer Sparse MLA backend (#33451 )

2026-02-12 17:21:54 +00:00

mla_prefill.yaml

[Attention] Add FlashInfer Sparse MLA backend (#33451 )

2026-02-12 17:21:54 +00:00

reorder_threshold.yaml

[Attention] Add FlashInfer Sparse MLA backend (#33451 )

2026-02-12 17:21:54 +00:00

speculative_decode.yaml

[Attention] Add FlashInfer Sparse MLA backend (#33451 )

2026-02-12 17:21:54 +00:00

standard_attention.yaml

[Attention] Add FlashInfer Sparse MLA backend (#33451 )

2026-02-12 17:21:54 +00:00