Skip to main content

Module extraction

Module extraction 

Source
Expand description

Hybrid entity extraction: regex pre-filter + candle BERT NER (graceful degradation).

Structs§

ExtractedEntity
ExtractedUrl
URL com offset de origem extraída do corpo da memória.
ExtractionResult
RegexExtractor

Traits§

Extractor

Functions§

extract_graph_auto
extract_urls
Extrai URLs do corpo de uma memória, desduplicadas por texto. URLs são armazenadas na tabela memory_urls separadamente do grafo de entidades. v1.0.24: split do bloco URL que poluía apply_regex_prefilter com entity_type=‘concept’.