vllm/vllm/model_executor/layers/mamba at 4f6eed3bd4a92c6bd513460ee85b917d6df88a17 - vllm

Files

Xu Jinyang b779eb3363 [Model] Sync upstream BT=chunk_size fix for GDN chunk_fwd_kernel_o, simplify warmup to single pass (#38343 )

Signed-off-by: AuYang <459461160@qq.com>
Co-authored-by: Jiangyun Zhu <riverclouds.zhu@qq.com>

2026-03-31 23:03:24 +04:00

2026-03-31 17:35:51 +02:00

__init__.py

2024-08-28 15:06:52 -07:00

abstract.py

2026-02-24 09:49:56 -08:00

gdn_linear_attn.py

2026-03-31 23:03:24 +04:00

linear_attn.py

2026-03-23 20:10:11 -07:00

mamba_mixer2.py

2026-03-30 12:33:49 -04:00

mamba_mixer.py

2026-03-30 12:33:49 -04:00

mamba_utils.py

2026-02-28 17:32:37 +00:00

short_conv.py

2026-03-23 20:10:11 -07:00