Skip to main content

Crate gradatum_engine

Crate gradatum_engine 

Source
Expand description

§gradatum-engine

Superviseur Rust d’un sous-process llama-server natif — axum OpenAI-compat.

§Architecture PIVOT v2

gradatum-engine est un superviseur qui :

  1. spawn llama-server via tokio::process::Command (jamais via shell).
  2. wait-ready : poll GET /health enfant jusqu’à 200.
  3. proxy : handlers /v1/chat/completions + /v1/embeddings → reqwest vers l’enfant.
  4. supervise : restart-on-failure borné + shutdown gracieux.

L’engine ne charge plus de modèle lui-même (zéro duplication VRAM/RAM).

§Stability

0.x — aucune garantie de stabilité API. Voir docs/internal/.

§Feature gates

  • serve : compile le serveur axum + superviseur llama-server.

Sans feature : crate stub (seule VERSION est exposée).

§Anti-cycle invariant

gradatum-engine peut dépendre de gradatum-core et gradatum-dto. gradatum-core et gradatum-dto ne doivent JAMAIS dépendre de gradatum-engine.

Constants§

VERSION
Version du crate (depuis workspace.package.version).