Qwen3-4B quantized to 4-bit with bitsandbytes. Original model is here.

Note: This model is for being used with diffusers, this repository doesn't contain the tokenizer

Safetensors

Model size

4B params

Tensor type

F32

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support