vllm/vllm/model_executor/layers/quantization/compressed_tensors at d272415e57c95da63c798c22c7d87cc5c0cda21f - vllm

Files

Dipika Sikka d272415e57 [Quantization] Expand compressed-tensors MoE matching logic to support NFP4 + FP8 MoEs (#22674 )

Signed-off-by: Dipika Sikka <dipikasikka1@gmail.com>
Signed-off-by: Dipika <dipikasikka1@gmail.com>

2025-08-27 05:00:21 +00:00

2025-08-26 18:23:23 -07:00

__init__.py

2024-05-23 21:29:18 +00:00

compressed_tensors_moe.py

2025-08-27 05:00:21 +00:00

compressed_tensors.py

2025-08-27 05:00:21 +00:00

triton_scaled_mm.py

2025-06-12 07:14:24 +00:00

utils.py

2025-06-08 09:05:55 -04:00