fix QERL attention import path (#33432)

Signed-off-by: vasiliy <vasiliy@fb.com> Signed-off-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: Michael Goin <mgoin64@gmail.com>
2026-01-30 12:29:09 -05:00
parent 6c1f9e4c18
commit 3f96fcf646
1 changed files with 1 additions and 1 deletions
--- a/vllm/model_executor/model_loader/reload/layerwise.py
+++ b/vllm/model_executor/model_loader/reload/layerwise.py
@@ -7,9 +7,9 @@ from weakref import WeakKeyDictionary

 import torch

-from vllm.attention.layer import Attention, MLAAttention
 from vllm.config import ModelConfig
 from vllm.logger import init_logger
+from vllm.model_executor.layers.attention import Attention, MLAAttention
 from vllm.model_executor.layers.quantization.base_config import QuantizeMethodBase
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader