vllm/.buildkite/lm-eval-harness/configs/Meta-Llama-3-8B-Instruct-INT8-compressed-tensors.yaml at dd6a3a02cb3bf2a7bc6cb84c85dcd57c6eaf2bf9

Files

Robert Shaw abfe705a02 [ Misc ] Support Fp8 via llm-compressor (#6110 )

Co-authored-by: Robert Shaw <rshaw@neuralmagic>

2024-07-07 20:42:11 +00:00

View Raw