feature: dynamic quantized model support by dsrenesanse · Pull Request #1155 · ml-explore/mlx-lm

dsrenesanse · 2026-04-15T15:11:44Z

Proposal: developers would like to use bigger and more intelligent models locally.

Problem: We need more flexibility for quantization to optimize memory footprint , but current state of mlx-lm allows to run a model only if all layers have same quantization.

Solution: be able to run models with aggressive quantization on knowledge layers for example, but with less aggressive quantization on reasoning and attention layers.

Edge cases: change of config file is required to support this feature.

Regards, Daniil.

feature: dynamic quantization model support

feb67cc

dsrenesanse marked this pull request as draft April 25, 2026 02:55

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feature: dynamic quantized model support#1155

feature: dynamic quantized model support#1155
dsrenesanse wants to merge 1 commit intoml-explore:mainfrom
dsrenesanse:main

dsrenesanse commented Apr 15, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

dsrenesanse commented Apr 15, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant