[Refactor] Consolidate SupportsEagle (#36063)

Signed-off-by: Benjamin Chislett <bchislett@nvidia.com>
2026-03-13 19:22:40 -04:00
parent 54a6db827f
commit 8b346309a5
24 changed files with 229 additions and 235 deletions
--- a/tests/v1/kv_connector/extract_hidden_states_integration/predictable_llama.py
+++ b/tests/v1/kv_connector/extract_hidden_states_integration/predictable_llama.py
@@ -13,15 +13,15 @@ import torch
 import torch.nn as nn

 from vllm.config import VllmConfig
+from vllm.model_executor.models.interfaces import EagleModelMixin
 from vllm.model_executor.models.llama import LlamaForCausalLM
 from vllm.sequence import IntermediateTensors


-class PredictableLlamaModel(nn.Module):
+class PredictableLlamaModel(nn.Module, EagleModelMixin):
    def __init__(self, *, vllm_config: VllmConfig, prefix: str = ""):
        super().__init__()
        self.config = vllm_config.model_config.hf_config
-        self.aux_hidden_state_layers = tuple[int, ...]()

        # Create minimal embed_tokens for embedding
        from vllm.model_executor.layers.vocab_parallel_embedding import (