vllm/vllm/model_executor/layers/fla at 2612ba9285d828f3179801334b6d2db0046b9b6c - vllm

Files

Vadim Gimpelson 22dffca982 [PERF] Speed-up of GDN attention decode part (Qwen3-Next) (#31722 )

Signed-off-by: Vadim Gimpelson <vadim.gimpelson@gmail.com>

2026-01-06 17:32:46 +00:00

2026-01-06 17:32:46 +00:00

__init__.py

2025-09-10 00:04:41 +08:00