Function quantize_4bit

pub fn quantize_4bit(
    tensor: &Tensor,
    config: &BitsAndBytesConfig,
) -> Result<QuantState>

Expand description

4-bit quantization (NF4/FP4)

quantize_4bit