Skip to main content

Module ingest_heuristics

Module ingest_heuristics 

Source
Expand description

Heurística determinística para gerar descriptions de memórias ingeridas.

GAP-E2E-011 (FALTA-6): toda memória ingerida recebia description hardcoded "ingested from <path>", o que tornava a listagem inútil e empobrecia o resultado de buscas. Esta heurística pure-Rust extrai a primeira linha significativa do body, ignorando headers markdown.

Regras:

  • Primeira linha não-vazia com mais de 20 caracteres
  • Ignora linhas que começam com # (markdown headers)
  • Trunca em 100 caracteres via chars().take(100)
  • Fallback: "ingested document" quando nenhuma linha válida

Determinismo: zero alocação baseada em ordem de hash, zero LLM, zero dependência de ordem de filesystem. Saída reproduzível byte a byte.

Functions§

extract_heuristic_description
Extrai uma description heurística do body de um documento ingerido.