vllm/tests/evals/gsm8k/configs/Qwen3.5-397B-A17B-NVFP4-DEP2.yaml at 1dbbafd3f34ab5ca9394e719a4e290f60252f401 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

Jiangyun Zhu bcc0fdd0f3 [CI] fix LM Eval Qwen3.5 Models (B200) (#38632 )

Signed-off-by: zjy0516 <riverclouds.zhu@qq.com>
(cherry picked from commit ea7bfde6e4)

2026-04-01 01:02:20 -07:00

11 lines

233 B

YAML

Raw Blame History

 model_name: "nvidia/Qwen3.5-397B-A17B-NVFP4"
 accuracy_threshold: 0.88
 tolerance: 0.03
 num_questions: 1319
 num_fewshot: 5
 server_args: >-
   --max-model-len 4096
   --data-parallel-size 2
   --enable-expert-parallel
   --max-num-seqs 512