deepseek-v4-quant

Files

biondizzle 6008cf128d Add model_opt_nvfp4_experts_only.py

Quantizes only MoE expert weights to NVFP4, leaving attention untouched.
Includes comments documenting all available NVFP4 strategies.
Copy to model_opt_nvfp4_<strategy>.py for each new strategy.

2026-05-07 15:16:08 +00:00

model_opt_nvfp4_experts_only.py

Add model_opt_nvfp4_experts_only.py

2026-05-07 15:16:08 +00:00

run_modelopt_nvfp4.sh

Add ModelOpt NVFP4 pipeline: patch, run script, README

2026-05-07 07:22:54 +00:00

upcast_to_bf16.py

Add BF16 upcast script and Blackwell DeepGEMM patch

2026-05-07 14:25:30 +00:00