vllm/tests/kernels/utils.py at 252357793dd1fe9d30c34e68e4b8b2143a4c5138 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

afeldman-nm 543aa48573 [Kernel] Correctly invoke prefill & decode kernels for cross-attention (towards eventual encoder/decoder model support) (#4888 )

Co-authored-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

2024-07-08 17:12:15 +00:00

32 KiB

Raw Blame History

View Raw