gradatum-engine
Superviseur Rust d'un sous-process llama-server natif — axum OpenAI-compat.
Architecture PIVOT v2
gradatum-engine est un superviseur qui :
- spawn
llama-serverviatokio::process::Command(jamais via shell). - wait-ready : poll
GET /healthenfant jusqu'à 200. - proxy : handlers
/v1/chat/completions+/v1/embeddings→ reqwest vers l'enfant. - supervise : restart-on-failure borné + shutdown gracieux.
L'engine ne charge plus de modèle lui-même (zéro duplication VRAM/RAM).
Stability
0.x — aucune garantie de stabilité API. Voir docs/internal/.
Feature gates
serve: compile le serveur axum + superviseur llama-server.
Sans feature : crate stub (seule VERSION est exposée).
Anti-cycle invariant
gradatum-engine peut dépendre de gradatum-core et gradatum-dto.
gradatum-core et gradatum-dto ne doivent JAMAIS dépendre de gradatum-engine.