Module quantization

Expand description

Scalar Quantization (SQ8) for memory-efficient vector storage.

This module implements 8-bit scalar quantization to reduce memory usage by 4x while maintaining >95% recall accuracy.

Structs§

cosine_similarity_quantized: Computes approximate cosine similarity between a query (f32) and quantized vector.
dot_product_quantized: Computes the approximate dot product between a query vector (f32) and a quantized vector.
euclidean_squared_quantized: Computes the approximate squared Euclidean distance between a query (f32) and quantized vector.