[Core][Bugfix] Accept GGUF model without .gguf extension (#8056)

2024-09-02 20:43:26 +08:00
parent e2b2aa5a0f
commit 4ca65a9763
4 changed files with 23 additions and 5 deletions
--- a/vllm/transformers_utils/tokenizer.py
+++ b/vllm/transformers_utils/tokenizer.py
@@ -12,6 +12,7 @@ from vllm.logger import init_logger
 from vllm.lora.request import LoRARequest
 from vllm.transformers_utils.tokenizers import (BaichuanTokenizer,
                                                MistralTokenizer)
+from vllm.transformers_utils.utils import check_gguf_file
 from vllm.utils import make_async

 logger = init_logger(__name__)
@@ -96,8 +97,7 @@ def get_tokenizer(
        kwargs["truncation_side"] = "left"

    # Separate model folder from file path for GGUF models
-    is_gguf = Path(tokenizer_name).is_file() and Path(
-        tokenizer_name).suffix == ".gguf"
+    is_gguf = check_gguf_file(tokenizer_name)
    if is_gguf:
        kwargs["gguf_file"] = Path(tokenizer_name).name
        tokenizer_name = Path(tokenizer_name).parent