vllm/tests/evals/gsm8k/configs/models-small.txt at ea37530b474fa738a99a53a8975af4e389b968c7 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

Dipika Sikka 361dfdc9d8 [Quant] Support MXFP4 W4A16 for compressed-tensors MoE models (#32285 )

Signed-off-by: Dipika Sikka <dipikasikka1@gmail.com>
Co-authored-by: Michael Goin <mgoin64@gmail.com>

2026-01-15 07:25:55 -08:00

7 lines

222 B

Plaintext

Raw Blame History

 Qwen3-0.6B-FP8.yaml
 Llama-3.2-1B-Instruct-INT8-CT.yaml
 Llama-3-8B-Instruct-nonuniform-CT.yaml
 Qwen2.5-VL-3B-Instruct-FP8-dynamic.yaml
 Qwen1.5-MoE-W4A16-CT.yaml
 DeepSeek-V2-Lite-Instruct-FP8.yaml
 Qwen3-30B-A3B-MXFP4A16.yaml