Crate vectorless

Expand description

§Vectorless

A hierarchical, reasoning-native document intelligence engine.

Replace your vector database with LLM-powered tree navigation. No embeddings. No vector search. Just reasoning.

§Overview

Traditional RAG systems chunk documents into flat vectors, losing structure. Vectorless preserves your document’s hierarchy and uses an LLM to navigate it — like a human skimming a table of contents, then drilling into relevant sections.

§Architecture

┌─────────────────────────────────────────────────────────────────┐
│                          client                                  │
│                     (Engine, EngineBuilder)                      │
└────────────────────────────┬────────────────────────────────────┘
                             │
          ┌──────────────────┼──────────────────┐
          ▼                  ▼                  ▼
    ┌──────────┐       ┌───────────┐      ┌──────────┐
    │  index   │       │ retrieval │      │ storage  │
    │ (write)  │       │  (read)   │      │ (persist)│
    └────┬─────┘       └─────┬─────┘      └────┬─────┘
         │                   │                 │
         └───────────┬───────┘                 │
                     ▼                         │
               ┌───────────┐                   │
               │  domain   │                   │
               │(Tree/Node)│                   │
               └─────┬─────┘                   │
                     │                         │
      ┌──────────────┼──────────────┐          │
      ▼              ▼              ▼          │
 ┌────────┐    ┌──────────┐   ┌────────┐      │
 │ parser │    │   llm    │   │ config │◄─────┘
 └────────┘    └──────────┘   └────────┘

§Features

🌳 Tree-Based Indexing — Documents as hierarchical trees, not flat chunks
🧠 LLM Navigation — Reasoning-based traversal to find relevant content
🚀 Zero Infrastructure — No vector database, no embedding models
📄 Multi-Format — Markdown, PDF, DOCX support
💾 Persistent Workspace — LRU-cached storage with lazy loading
🔄 Retry & Fallback — Resilient LLM calls with automatic recovery

§Quick Start

use vectorless::{EngineBuilder, Engine};

#[tokio::main]
async fn main() -> vectorless::domain::Result<()> {
    // Create client
    let mut client = EngineBuilder::new()
        .with_workspace("./workspace")
        .build()?;

    // Index a document
    let doc_id = client.index("./document.md").await?;

    // Query with natural language
    let result = client.query(&doc_id, "What is this about?").await?;
    println!("{}", result.content);

    Ok(())
}

§Modules

Module	Description
`client`	High-level API (`Engine`, `EngineBuilder`)
`domain`	Core domain types (`DocumentTree`, `TreeNode`, `NodeId`)
`index`	Document indexing pipeline
`retrieval`	Retrieval strategies and search algorithms
`config`	Configuration management
`llm`	LLM client with retry & fallback
`parser`	Document parsers (Markdown, PDF, DOCX)
`storage`	Workspace persistence
`throttle`	Rate limiting

Re-exports§

pub use client::DocumentInfo;
pub use client::Engine;
pub use client::EngineBuilder;
pub use client::IndexedDocument;
pub use domain::DocumentStructure;
pub use domain::DocumentTree;
pub use domain::Error;
pub use domain::NodeId;
pub use domain::Result;
pub use domain::StructureNode;
pub use domain::TocConfig;
pub use domain::TocEntry;
pub use domain::TocNode;
pub use domain::TocView;
pub use domain::TreeNode;
pub use domain::estimate_tokens;
pub use domain::estimate_tokens_fast;
pub use config::Config;
pub use config::ConfigLoader;
pub use config::RetrievalConfig;
pub use config::SummaryConfig;
pub use llm::LlmClient;
pub use llm::LlmConfig;
pub use llm::LlmConfigs;
pub use llm::LlmError;
pub use llm::LlmPool;
pub use llm::RetryConfig;
pub use parser::DocumentFormat;
pub use parser::DocumentParser;
pub use parser::DocxParser;
pub use parser::MarkdownParser;
pub use parser::ParseResult;
pub use parser::PdfParser;
pub use parser::RawNode;
pub use index::pipeline::CustomStageBuilder;
pub use index::pipeline::PipelineOrchestrator;
pub use index::ChangeDetector;
pub use index::ChangeSet;
pub use index::IndexContext;
pub use index::IndexInput;
pub use index::IndexMetrics;
pub use index::IndexMode;
pub use index::IndexResult;
pub use index::IndexStage;
pub use index::PartialUpdater;
pub use index::PipelineExecutor;
pub use index::PipelineOptions;
pub use index::SummaryStrategy;
pub use retrieval::ContextBuilder;
pub use retrieval::NavigationDecision;
pub use retrieval::NavigationStep;
pub use retrieval::PipelineRetriever;
pub use retrieval::PruningStrategy;
pub use retrieval::QueryComplexity;
pub use retrieval::RetrievalContext;
pub use retrieval::RetrievalResult;
pub use retrieval::RetrieveOptions;
pub use retrieval::RetrieveResponse;
pub use retrieval::Retriever;
pub use retrieval::RetrieverError;
pub use retrieval::RetrieverResult;
pub use retrieval::SearchPath;
pub use retrieval::StrategyPreference;
pub use retrieval::SufficiencyLevel;
pub use retrieval::TokenEstimation;
pub use retrieval::format_for_llm;
pub use retrieval::format_for_llm_async;
pub use retrieval::format_tree_for_llm;
pub use retrieval::format_tree_for_llm_async;
pub use storage::DocumentMeta as StorageDocumentMeta;
pub use storage::PersistedDocument;
pub use storage::Workspace;
pub use throttle::ConcurrencyConfig;
pub use throttle::ConcurrencyController;
pub use throttle::RateLimiter;

Modules§

client: High-level client API for document indexing and retrieval.
config: Configuration management for vectorless.
domain: Domain layer - pure data structures with zero business logic.
index: Index Pipeline module.
llm: Unified LLM client module.
parser: Document parsing module.
retrieval: Retrieval system for Vectorless document trees.
storage: Storage module for persisting document indices.
throttle: Concurrency control for LLM API calls.

Crate vectorless

Crate vectorless Copy item path

§Vectorless

§Vectorless

§Overview

§Architecture

§Features

§Quick Start

§Modules

Re-exports§

Modules§

Crate vectorless