gradatum-engine

Superviseur Rust d'un sous-process llama-server natif — axum OpenAI-compat.

Architecture PIVOT v2

gradatum-engine est un superviseur qui :

spawn llama-server via tokio::process::Command (jamais via shell).
wait-ready : poll GET /health enfant jusqu'à 200.
proxy : handlers /v1/chat/completions + /v1/embeddings → reqwest vers l'enfant.
supervise : restart-on-failure borné + shutdown gracieux.

L'engine ne charge plus de modèle lui-même (zéro duplication VRAM/RAM).

Stability

0.x — aucune garantie de stabilité API. Voir docs/internal/.

Feature gates

serve : compile le serveur axum + superviseur llama-server.

Sans feature : crate stub (seule VERSION est exposée).

Anti-cycle invariant

gradatum-engine peut dépendre de gradatum-core et gradatum-dto. gradatum-core et gradatum-dto ne doivent JAMAIS dépendre de gradatum-engine.

gradatum-engine 0.3.5

gradatum-engine

Architecture PIVOT v2

Stability

Feature gates

Anti-cycle invariant