vllm/vllm/model_executor at 9de25c294b92e42a12d1fbbb3ab3f633fa80291c - vllm

Files

Dipika Sikka d272415e57 [Quantization] Expand compressed-tensors MoE matching logic to support NFP4 + FP8 MoEs (#22674 )

Signed-off-by: Dipika Sikka <dipikasikka1@gmail.com>
Signed-off-by: Dipika <dipikasikka1@gmail.com>

2025-08-27 05:00:21 +00:00

2025-08-27 05:00:21 +00:00

2025-08-22 13:04:22 -06:00

2025-08-26 21:02:55 -07:00

2025-08-14 16:03:55 -04:00

__init__.py

2025-06-03 11:20:17 -07:00

custom_op.py

2025-08-04 21:43:24 -07:00

parameter.py

2025-06-03 11:20:17 -07:00

pooling_metadata.py

2025-08-21 13:26:09 +00:00

sampling_metadata.py

2025-08-01 05:24:46 -07:00

utils.py

2025-08-01 11:09:54 +00:00