vllm/tests/evals/gsm8k/configs/Qwen3-Next-FP8-EP2.yaml at ea37530b474fa738a99a53a8975af4e389b968c7 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

Vadim Gimpelson bc0a5a0c08 [CI] Add Qwen3-Next-FP8 to Blackwell model tests (#31049 )

Signed-off-by: Vadim Gimpelson <vadim.gimpelson@gmail.com>

2025-12-23 17:21:50 -08:00

12 lines

265 B

YAML

Raw Blame History

 model_name: "Qwen/Qwen3-Next-80B-A3B-Instruct-FP8"
 accuracy_threshold: 0.85
 num_questions: 1319
 num_fewshot: 5
 server_args: >-
   --max-model-len 4096
   --tensor-parallel-size 2
   --enable-expert-parallel
   --async-scheduling
 env:
   VLLM_USE_FLASHINFER_MOE_FP8: "1"