[VLLM] Improve performance of MOE GEMM kernel #5258

Open

Assignees

Labels

benchmarksperformancetests: ecosystem

Milestone

5. Ecosystem enabling and performance

opened

We need to improve performance of MOE GEMM kernels including FP8 case

https://github.com/vllm-project/vllm/blob/main/vllm/model_executor/layers/fused_moe/fused_batched_moe.py#L356

Metadata

Assignees

Egor-Krivov

Labels

benchmarksperformancetests: ecosystem

Type

Projects

No projects

Milestone

5. Ecosystem enabling and performance

Relationships

None yet

Development

No branches or pull requests