[Misc] Remove Gemma RoPE (#7638)

2024-08-19 09:29:31 -07:00
parent 1a36287b89
commit df845b2b46
3 changed files with 7 additions and 26 deletions
--- a/vllm/model_executor/models/gemma2.py
+++ b/vllm/model_executor/models/gemma2.py
@@ -32,7 +32,7 @@ from vllm.model_executor.layers.linear import (MergedColumnParallelLinear,
 from vllm.model_executor.layers.logits_processor import LogitsProcessor
 from vllm.model_executor.layers.quantization.base_config import (
    QuantizationConfig)
-from vllm.model_executor.layers.rotary_embedding import GemmaRotaryEmbedding
+from vllm.model_executor.layers.rotary_embedding import get_rope
 from vllm.model_executor.layers.sampler import Sampler
 from vllm.model_executor.layers.vocab_parallel_embedding import (
    VocabParallelEmbedding)
@@ -130,14 +130,12 @@ class Gemma2Attention(nn.Module):
            bias=config.attention_bias,
            quant_config=quant_config,
        )
-        # TODO(woosuk): Use the `get_rope` interface.
-        self.rotary_emb = GemmaRotaryEmbedding(
+        self.rotary_emb = get_rope(
            self.head_dim,
-            self.head_dim,
-            max_position_embeddings,
+            rotary_dim=self.head_dim,
+            max_position=max_position_embeddings,
            base=self.rope_theta,
            is_neox_style=True,
-            dtype=torch.get_default_dtype(),
        )

        # FIXME(woosuk): While Gemma 2 uses sliding window attention for every