Expand description
Token-aware chunking utilities for bodies that exceed the embedding window.
Structs§
Constants§
Functions§
- aggregate_
embeddings - chunk_
text - needs_
chunking - split_
into_ chunks - split_
into_ chunks_ by_ token_ offsets - split_
into_ chunks_ hierarchical - Divide body em chunks usando MarkdownSplitter com tokenizer real. Respeita limites semânticos de Markdown (H1-H6, parágrafos, blocos). Para texto puro sem marcadores Markdown, cai sobre quebras de parágrafo e sentenças.