vllm/vllm/model_executor at c4afdb69cc22a23d23886528147b956796c1000c - vllm

Files

Harry Mellor c4afdb69cc Move MultiModalConfig from config/__init__.py to config/multimodal.py (#24659 )

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com>

2025-09-15 17:43:16 +00:00

layers

[USAGE] Improve error handling for weight initialization in Unquantized… (#20321 )

2025-09-15 16:45:49 +00:00

model_loader

[Docs] Fix warnings in mkdocs build (continued) (#24740 )

2025-09-12 06:43:15 -07:00

models

Move MultiModalConfig from config/__init__.py to config/multimodal.py (#24659 )

2025-09-15 17:43:16 +00:00

warmup

[Startup] Make DeepGEMM warmup scale with max-num-batched-tokens (#24693 )

2025-09-11 20:10:19 -04:00

__init__.py

[Misc] Add SPDX-FileCopyrightText (#19100 )

2025-06-03 11:20:17 -07:00

custom_op.py

[V0 deprecation] Deprecate V0 Neuron backend (#21159 )

2025-09-06 16:15:18 -07:00

parameter.py

[Core] Allow disabling TP sharding for parallel Linear layer (#23024 )

2025-09-05 22:53:58 -07:00

sampling_metadata.py

[Doc]: fix typos in Python comments (#24042 )

2025-09-01 19:07:45 -07:00

utils.py

[Bugfix] Fix _synced_weight_loader (#24565 )

2025-09-11 16:52:33 +08:00