[Tokenizer] Add an option to specify tokenizer (#284)

2023-06-28 09:46:58 -07:00
parent bdd6b4c8bc
commit 4338cc4750
10 changed files with 61 additions and 60 deletions
--- a/vllm/engine/arg_utils.py
+++ b/vllm/engine/arg_utils.py
@@ -11,6 +11,7 @@ from vllm.config import (CacheConfig, ModelConfig, ParallelConfig,
 class EngineArgs:
    """Arguments for vLLM engine."""
    model: str
+    tokenizer: Optional[str] = None
    download_dir: Optional[str] = None
    use_np_weights: bool = False
    use_dummy_weights: bool = False
@@ -27,6 +28,8 @@ class EngineArgs:
    disable_log_stats: bool = False

    def __post_init__(self):
+        if self.tokenizer is None:
+            self.tokenizer = self.model
        self.max_num_seqs = min(self.max_num_seqs, self.max_num_batched_tokens)

    @staticmethod
@@ -37,6 +40,8 @@ class EngineArgs:
        # Model arguments
        parser.add_argument('--model', type=str, default='facebook/opt-125m',
                            help='name or path of the huggingface model to use')
+        parser.add_argument('--tokenizer', type=str, default=EngineArgs.tokenizer,
+                            help='name or path of the huggingface tokenizer to use')
        parser.add_argument('--download-dir', type=str,
                            default=EngineArgs.download_dir,
                            help='directory to download and load the weights, '
@@ -104,7 +109,7 @@ class EngineArgs:
    ) -> Tuple[ModelConfig, CacheConfig, ParallelConfig, SchedulerConfig]:
        # Initialize the configs.
        model_config = ModelConfig(
-            self.model, self.download_dir, self.use_np_weights,
+            self.model, self.tokenizer, self.download_dir, self.use_np_weights,
            self.use_dummy_weights, self.dtype, self.seed)
        cache_config = CacheConfig(self.block_size, self.gpu_memory_utilization,
                                   self.swap_space)