vllm/tests/neuron at a30c093502f0a671969ab561aacc80bc430f8ed6 - vllm

Files

Lingfan Yu 33170081f1 [Neuron][Kernel] Vectorize KV cache load in FlashPagedAttention to maximize DMA bandwidth (#13245 )

Signed-off-by: Lingfan Yu <lingfany@amazon.com>

2025-02-20 17:45:45 -08:00

test_block_table.py

2025-02-20 17:45:45 -08:00

test_prefix_prefill.py

2025-02-20 17:45:45 -08:00