vllm/vllm/attention at 36fb68f94792a8cec8df5b58bab7ab4d4d6158b4 - vllm

Files

Lily Liu 43c413ec57 [Kernel] Use flashinfer for decoding (#4353 )

Co-authored-by: LiuXiaoxuanPKU <llilyliupku@gmail.com>

2024-05-03 15:51:27 -07:00

2024-05-03 15:51:27 -07:00

2024-05-03 10:20:12 -07:00

__init__.py

2024-04-10 17:56:48 -07:00

layer.py

2024-04-30 21:18:14 -07:00

selector.py

2024-05-03 15:51:27 -07:00