[New Model] DeepSeek-V3.2 (Rebased to Main) (#25896)

Signed-off-by: Chen Zhang <zhangch99@outlook.com>
Signed-off-by: youkaichao <youkaichao@gmail.com>
Signed-off-by: Lucas Wilkinson <lwilkins@redhat.com>
Signed-off-by: mgoin <mgoin64@gmail.com>
Signed-off-by: NickLucche <nlucches@redhat.com>
Signed-off-by: Yongye Zhu <zyy1102000@gmail.com>
Signed-off-by: Barry Kang <43644113+Barry-Delaney@users.noreply.github.com>
Signed-off-by: Lucia Fang <fanglu@meta.com>
Co-authored-by: Chen Zhang <zhangch99@outlook.com>
Co-authored-by: youkaichao <youkaichao@gmail.com>
Co-authored-by: Lucas Wilkinson <lwilkins@redhat.com>
Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com>
Co-authored-by: Lucas Wilkinson <LucasWilkinson@users.noreply.github.com>
Co-authored-by: yewentao256 <zhyanwentao@126.com>
Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>
Co-authored-by: mgoin <mgoin64@gmail.com>
Co-authored-by: Lucia Fang <116399278+luccafong@users.noreply.github.com>
Co-authored-by: Lucia Fang <fanglu@meta.com>
Co-authored-by: NickLucche <nlucches@redhat.com>
Co-authored-by: Siyuan Fu <siyuanf@nvidia.com>
Co-authored-by: Matthew Bonanni <mbonanni@redhat.com>
Co-authored-by: Xiaozhu Meng <mxz297@gmail.com>
Co-authored-by: Barry Kang <43644113+Barry-Delaney@users.noreply.github.com>

This commit is contained in:

Yongye Zhu

2025-09-30 05:14:41 -04:00

committed by

GitHub

parent e23cacda35

commit fa7e254a7f

71 changed files with 3915 additions and 218 deletions

									
										1

tests/v1/worker/test_gpu_model_runner.py
									
												View File
												
				@@ -39,7 +39,6 @@ def initialize_kv_cache(runner: GPUModelRunner):

				            runner.parallel_config),

				        head_size=runner.model_config.get_head_size(),

				        dtype=runner.kv_cache_dtype,

				        use_mla=False,

				    )

				    tensor_size = attn_spec.page_size_bytes * NUM_BLOCKS

				    kv_cache_config = KVCacheConfig(

[New Model] DeepSeek-V3.2 (Rebased to Main) (#25896)

1 tests/v1/worker/test_gpu_model_runner.py Unescape Escape View File

1

tests/v1/worker/test_gpu_model_runner.py

View File