Skip to main content

REMEMBER_MAX_CONTROLLED_BATCH_CHUNKS

Constant REMEMBER_MAX_CONTROLLED_BATCH_CHUNKS 

Source
pub const REMEMBER_MAX_CONTROLLED_BATCH_CHUNKS: usize = 4;
Expand description

Teto de chunks por micro-batch controlado no remember.

O runtime do fastembed usa padding BatchLongest, então batches muito grandes amplificam o custo do maior chunk. Este teto mantém batches pequenos mesmo quando os chunks são curtos.