Crate mnem_bench

Expand description

§mnem-bench

0.1.0 benchmark harness for mnem.

§Scope

Benches:

Bench::LongMemEval (per-session chunking, R@5 / R@10).
Bench::Locomo (session granularity, R@5 / R@10).
Bench::Convomem (5 evidence categories, avg_recall).
Bench::MembenchSimpleRoles (R@5 over the simple/roles slice).
Bench::MembenchHighlevelMovie (R@5 over highlevel/movie).
Bench::LongMemEvalHybridV4 (BM25-boost post-fusion variant).

Adapter: adapters::MnemAdapter (in-process via mnem-core). Run mode: RunMode::CpuLocal (single-threaded, in-process). Cache: SHA-256 verified dataset cache at ~/.mnem/bench-data/. Output: RESULTS.md + per-bench .json + .jsonl. TUI: tui::run_tui interactive setup wizard.

§Embedders

EmbedderChoice::OnnxMiniLm - real sentence-transformers/all-MiniLM-L6-v2 via mnem-embed-providers (onnx-bundled). 384-dim. Default; matches headline benchmark numbers. Gated on the default-on onnx-minilm Cargo feature.
EmbedderChoice::BagOfTokens - hashed bag-of-tokens, always compiled. Network-free, toy. Useful as the --no-default-features fallback for CI smoke tests.

See `` for the design rationale.

§Quick start

use mnem_bench::{
    bench::{AdapterKind, Bench, EmbedderChoice, RunMode},
    runner::{self, RunPlan},
};
use std::path::PathBuf;

let plan = RunPlan {
    benches: vec![Bench::LongMemEval],
    adapters: vec![AdapterKind::Mnem],
    mode: RunMode::CpuLocal,
    embedder: EmbedderChoice::BagOfTokens,
    out: PathBuf::from("./out"),
    top_k: 10,
    limit: Some(5),
    no_cache: false,
    quiet: true,
};
let _outcomes = runner::run(&plan).unwrap();

Re-exports§

pub use adapter::BenchAdapter;
pub use adapter::Hit;
pub use adapter::IngestDoc;
pub use bench::AdapterKind;
pub use bench::Bench;
pub use bench::EmbedderChoice;
pub use bench::RunMode;
pub use runner::BenchOutcome;
pub use runner::RunPlan;

Modules§

adapter: BenchAdapter trait - what every system-under-test (mnem, mem0, MemPalace) implements so the scorers can drive it.
adapters: Concrete BenchAdapter implementations.
bench: Benchmark catalog + dataset metadata.
datasets: Dataset cache + sha256 verification + download.
embed: Embedder used by crate::adapters::MnemAdapter.
output: Markdown + JSON output writers.
runner: Top-level dispatch: take a RunPlan, run each shipped bench, emit RESULTS.md + per-bench JSON / JSONL into the output dir.
score: Scoring engines per benchmark.
tui: Interactive TUI driven by dialoguer. Surfaces every option the 0.1.0 harness supports and routes to the runner.

Constants§

VERSION: Library version (tracks the workspace package version).

Crate mnem_bench

Crate mnem_bench Copy item path

§mnem-bench

§Scope

§Embedders

§Quick start

Re-exports§

Modules§

Constants§

Crate mnem_bench