ai_tokenopt 0.5.6

Adaptive token optimization engine for LLM inference pipelines — compresses prompts, conversation history, tool schemas, and output streams to minimize token usage while preserving response quality.

Documentation

//! Output token control — query complexity classification and dynamic budget

pub mod budget;
pub mod complexity;