vllm/tests/neuron at 18e505930d789a2ad57c8a048ff7d84c025530bd - vllm

Files

Lingfan Yu 33170081f1 [Neuron][Kernel] Vectorize KV cache load in FlashPagedAttention to maximize DMA bandwidth (#13245 )

Signed-off-by: Lingfan Yu <lingfany@amazon.com>

2025-02-20 17:45:45 -08:00

test_block_table.py

2025-02-20 17:45:45 -08:00

test_prefix_prefill.py

2025-02-20 17:45:45 -08:00