vllm/benchmarks/kernels at 37464a0f745a0204da7443d2a6ef4b8f65e5af12 - vllm - Gitea: Git with a cup of tea

biondizzle/vllm

Files

History

Cody Yu e9899fb7a4 [Model] Enable FP8 QKV in MoE and refine kernel tuning script (#5039 )

2024-05-31 14:29:19 -07:00

..

benchmark_aqlm.py

[Core]refactor aqlm quant ops (#4351 )

2024-04-25 15:03:56 -04:00

benchmark_marlin.py

Marlin 24 prefill performance improvement (about 25% better on average) (#4983 )

2024-05-23 02:39:27 -04:00

benchmark_mixtral_moe.py

[Model] Enable FP8 QKV in MoE and refine kernel tuning script (#5039 )

2024-05-31 14:29:19 -07:00

benchmark_paged_attention.py

[Model] Support MAP-NEO model (#5081 )

2024-05-30 19:24:41 -07:00

benchmark_rope.py

[Model] Support MAP-NEO model (#5081 )

2024-05-30 19:24:41 -07:00

benchmark_shapes.py

Add marlin unit tests and marlin benchmark script (#4815 )

2024-05-16 09:36:49 -04:00