Skip to main content

Module weight_quantization

god_graph::transformer::quantization

Module weight_quantization

Expand description

Quantization utilities for model weights

Functions§

quantize_embeddings: Quantize embedding weights
quantize_linear_weights: Quantize linear layer weights (output channel quantization)
quantize_weights: Quantize model weights to INT8
quantize_weights_per_channel: Quantize model weights with per-channel quantization