vllm/tests/neuron at 8354f6640c85d6aadb0a439dad4eaf288f512780 - vllm

Files

Lingfan Yu 33170081f1 [Neuron][Kernel] Vectorize KV cache load in FlashPagedAttention to maximize DMA bandwidth (#13245 )

Signed-off-by: Lingfan Yu <lingfany@amazon.com>

2025-02-20 17:45:45 -08:00

test_block_table.py

2025-02-20 17:45:45 -08:00

test_prefix_prefill.py

2025-02-20 17:45:45 -08:00