Module conversions

Expand description

Quantization conversion functions

This module contains functions for converting between floating-point and quantized data, including matrix and vector quantization/dequantization and fake quantization.

Functions§

dequantize_matrix: Dequantize a matrix back to floating-point
dequantize_vector_public: Dequantize a vector back to floating-point (public API version)
fake_quantize: Apply fake quantization to a floating-point matrix
fake_quantize_vector: Apply fake quantization to a floating-point vector
quantize_matrix: Quantize a floating-point matrix to a lower precision representation
quantize_matrix_per_channel: Quantize a floating-point matrix using per-channel quantization
quantize_vector: Quantize a floating-point vector to a lower precision representation

Module conversions

Module conversions Copy item path

Functions§

Module conversions