vllm/cmake at e515668edf510d86a0543ac5d7981dd91b2026d7 - vllm

Files

Akash kaothalkar e515668edf [Hardware][Power] Enable compressed tensor W8A8 INT8 quantization for POWER (#17153 )

Signed-off-by: Akash Kaothalkar <akash.kaothalkar@ibm.com>
Co-authored-by: Akash Kaothalkar <akash.kaothalkar@ibm.com>
Co-authored-by: mgoin <mgoin64@gmail.com>

2025-05-07 22:35:03 -07:00

external_projects

[Perf]Optimize rotary_emb implementation to use Triton operator for improved inference performance (#16457 )

2025-04-25 14:52:28 +08:00

cpu_extension.cmake

[Hardware][Power] Enable compressed tensor W8A8 INT8 quantization for POWER (#17153 )

2025-05-07 22:35:03 -07:00

hipify.py

[Misc] Fix improper placement of SPDX header in scripts (#12694 )

2025-02-03 11:16:59 -08:00

utils.cmake

[NVIDIA] Support nvfp4 quantization (#12784 )

2025-02-12 19:51:51 -08:00