[Feature] OTEL tracing during loading (#31162)

2026-02-06 01:59:28 +01:00
parent 91a07ff618
commit 325ab6b0a8
29 changed files with 873 additions and 280 deletions
--- a/vllm/model_executor/model_loader/default_loader.py
+++ b/vllm/model_executor/model_loader/default_loader.py
@@ -30,6 +30,7 @@ from vllm.model_executor.model_loader.weight_utils import (
    pt_weights_iterator,
    safetensors_weights_iterator,
 )
+from vllm.tracing import instrument
 from vllm.transformers_utils.repo_utils import list_filtered_repo_files

 logger = init_logger(__name__)
@@ -274,6 +275,7 @@ class DefaultModelLoader(BaseModelLoader):
            allow_patterns_overrides=None,
        )

+    @instrument(span_name="Load weights")
    def load_weights(self, model: nn.Module, model_config: ModelConfig) -> None:
        if model_config.quantization == "torchao":
            quant_config = get_quant_config(model_config, self.load_config)