Expand description
§gradatum-engine
Superviseur Rust d’un sous-process llama-server natif — axum OpenAI-compat.
§Architecture PIVOT v2
gradatum-engine est un superviseur qui :
- spawn
llama-serverviatokio::process::Command(jamais via shell). - wait-ready : poll
GET /healthenfant jusqu’à 200. - proxy : handlers
/v1/chat/completions+/v1/embeddings→ reqwest vers l’enfant. - supervise : restart-on-failure borné + shutdown gracieux.
L’engine ne charge plus de modèle lui-même (zéro duplication VRAM/RAM).
§Stability
0.x — aucune garantie de stabilité API. Voir docs/internal/.
§Feature gates
serve: compile le serveur axum + superviseur llama-server.
Sans feature : crate stub (seule VERSION est exposée).
§Anti-cycle invariant
gradatum-engine peut dépendre de gradatum-core et gradatum-dto.
gradatum-core et gradatum-dto ne doivent JAMAIS dépendre de gradatum-engine.
Constants§
- VERSION
- Version du crate (depuis
workspace.package.version).