agent-context 0.1.0

Multi-backend agent context manager with three-zone memory model
Documentation
//! 后端 trait 定义。
//!
//! [`ContextBackend`] 封装 LLM 后端的消息工厂、格式转换、模型对话和配置信息。
//! [`ContextBackendResponse`] 约束后端 Response 类型,提供统一的响应访问接口。

use crate::error::AgentError;
use crate::message::ContextMessage;

/// 工具定义(供应商无关)。调用方声明工具,backend 内部转为 vendor 格式。
#[derive(Debug, Clone)]
pub struct AgentTool {
    /// 函数名(1~64 字符)
    pub name: String,
    /// 函数描述
    pub description: String,
    /// JSON Schema 参数定义
    pub parameters: serde_json::Value,
}

// ---------------------------------------------------------------------------
// ContextBackendResponse — Response 类型约束
// ---------------------------------------------------------------------------

/// 后端 Response 类型约束,流式/非流式 Response 均需实现。
///
/// 提供:
/// - [`response_type`](Self::response_type):内容分类,供 [`ContextBackend::classify_chunk`] 默认实现
/// - [`reasoning_content`](Self::reasoning_content):思考链文本
/// - [`content`](Self::content):正文文本
pub trait ContextBackendResponse {
    /// 返回响应包含的内容类型。
    fn response_type(&self) -> ResponseType;

    /// 提取思考链文本(流式为 delta,非流式为完整内容)。
    ///
    /// `None` 表示字段不存在/null,`Some("")` 表示空字符串。
    fn reasoning_content(&self) -> Option<String>;

    /// 提取正文文本(流式为 delta,非流式为完整内容)。
    ///
    /// `None` 表示字段不存在/null,`Some("")` 表示空字符串。
    fn content(&self) -> Option<String>;
}

/// 响应内容类型枚举。
#[derive(Debug, Clone, PartialEq, Eq)]
pub enum ResponseType {
    /// 无增量内容
    Empty,
    /// 仅思考链
    Reasoning,
    /// 仅正文
    Content,
    /// 同时包含思考链和正文
    ReasoningAndContent,
}

// ---------------------------------------------------------------------------
// 流式输出事件
// ---------------------------------------------------------------------------

/// 流式输出事件,由 [`ContextBackend::classify_chunk`] 产出。
///
/// 每个事件持有原始后端响应引用,用户可从中提取任意数据(content、reasoning、usage 等)。
/// 事件类型仅做阶段标记,不做数据裁剪。
#[derive(Debug, Clone)]
pub enum StreamEvent<R> {
    /// 思考链增量响应
    Thinking(R),
    /// 第一个正文增量响应(思考链→正文的过渡点)
    ContentFirst(R),
    /// 后续正文增量响应
    Content(R),
}

// ---------------------------------------------------------------------------
// ContextBackend trait
// ---------------------------------------------------------------------------

/// 后端 trait:抽象 LLM 后端的完整接口。
///
/// 实现此 trait 即可让 [`AgentContext`](crate::AgentContext) 对接任意 LLM 后端(DeepSeek、智谱、OpenAI 等)。
///
/// ## 方法分类
///
/// | 类别 | 方法 | 类型 |
/// |------|------|------|
/// | 消息工厂 | [`user_message`](Self::user_message)、[`system_message`](Self::system_message)、[`tool_message`](Self::tool_message) | 关联函数 |
/// | 格式转换 | [`to_system_message`](Self::to_system_message)、[`to_request_messages`](Self::to_request_messages) | 关联函数(默认实现) |
/// | 请求选项 | 通过 [`Default::default()`] 获取 [`Self::Opts`] 默认值 | 类型约束 |
/// | 响应解析 | [`extract_messages_from_backend_response`](Self::extract_messages_from_backend_response) | 实例方法 |
/// | 模型对话 | [`estimate_tokens`](Self::estimate_tokens)、[`send`](Self::send)、[`send_stream`](Self::send_stream) | 实例方法 |
/// | 配置信息 | [`context_window`](Self::context_window) | 实例方法 |
pub trait ContextBackend: Send + Sync + Clone + 'static {
    /// 后端消息类型,必须实现 [`ContextMessage`]。
    type Message: ContextMessage;
    /// 后端自定义的请求选项类型,AC 不感知字段含义,只做透传。
    ///
    /// 典型用途:传递 `temperature`、`max_tokens`、`thinking` 等模型参数。
    /// 通过 [`default_opts`](Self::default_opts) 获取默认值,CLI 可在此基础上覆盖。
    type Opts: Clone + Default + Send + Sync;
    /// 后端完整的 API 响应类型。
    ///
    /// - 非流式:ChatCompletion(含 choices + usage)
    /// - 流式:ChatCompletionChunk(含 delta content / reasoning_content)
    type Response: Clone + Send + Sync + ContextBackendResponse;

    // 消息工厂(实例方法)
    /// 构造一条 User 角色消息。
    fn user_message(&self, content: impl Into<String> + Send) -> Self::Message;
    /// 构造一条 System 角色消息。
    fn system_message(&self, content: impl Into<String> + Send) -> Self::Message;
    /// 构造一条 Tool 角色消息(工具调用结果)。
    fn tool_message(
        &self,
        tool_call_id: impl Into<String> + Send,
        content: impl Into<String> + Send,
    ) -> Self::Message;

    // 格式转换(实例方法,含默认实现)
    /// 将消息转换为 System 角色(用于压缩摘要等场景)。
    ///
    /// 默认实现调用 [`ContextMessage::with_role`]。
    fn to_system_message(&self, msg: Self::Message) -> Self::Message {
        msg.with_role(crate::Role::System)
    }

    /// 将后端响应消息转换为请求格式。
    ///
    /// 对 `!preserve_reasoning()` 的消息剥离 `reasoning_content`,减少网络传输和 token 消耗。
    ///
    /// 默认实现调用 [`ContextMessage::without_reasoning`]。
    fn to_request_messages(&self, messages: Vec<Self::Message>) -> Result<Vec<Self::Message>, AgentError> {
        Ok(messages
            .into_iter()
            .map(|m| {
                if m.preserve_reasoning() {
                    m
                } else {
                    m.without_reasoning()
                }
            })
            .collect())
    }

    // 响应解析(实例方法)
    /// 将流式分块合并为单条消息。
    ///
    /// 累加 `content`、`reasoning_content`、`tool_calls`,构造完整的 assistant 消息。
    fn merge_chunks(&self, responses: &[Self::Response]) -> Option<Self::Message>;

    /// 从后端原始响应中提取消息列表。非流式传 `&[单个 Response]`,流式传 `&[所有累积 chunk]`。
    fn extract_messages_from_backend_response(
        &self,
        responses: &[Self::Response],
    ) -> Result<Vec<Self::Message>, AgentError>;

    // 模型对话(实例方法)
    /// 估算消息列表的 token 数量。I/O 操作(可能需要调用远程 tokenizer API)。
    fn estimate_tokens(
        &self,
        messages: &[Self::Message],
    ) -> impl std::future::Future<Output = Result<usize, AgentError>> + Send;

    /// 模型上下文窗口大小(token 数),用于 [`IsFullMsg`](crate::IsFullMsg) 检测。
    fn context_window(&self) -> usize;

    /// 非流式对话。发送全部消息,返回完整 Response(含 usage 等元数据)。
    fn send(
        &self,
        messages: &[Self::Message],
        opts: &Self::Opts,
    ) -> impl std::future::Future<Output = Result<Self::Response, AgentError>> + Send;

    /// 流式对话。参数为 owned(数据已移动),返回 `'static` 流。
    fn send_stream(
        &self,
        messages: Vec<Self::Message>,
        opts: Self::Opts,
    ) -> impl futures_core::Stream<Item = Result<Self::Response, AgentError>> + Send + 'static;

    /// 将流式分块分类为结构化事件,同时更新阶段状态。
    ///
    /// 默认实现基于 [`ContextBackendResponse::response_type`] 判断阶段:
    /// - 含 `reasoning_content` → [`StreamEvent::Thinking`]
    /// - 第一个 `content`(且之前有思考链)→ [`StreamEvent::ContentFirst`]
    /// - 后续 `content` → [`StreamEvent::Content`]
    fn classify_chunk(
        &self,
        response: &Self::Response,
        saw_thinking: &mut bool,
    ) -> Vec<StreamEvent<Self::Response>> {
        let mut events = Vec::new();
        match response.response_type() {
            ResponseType::Empty => return events,
            ResponseType::Reasoning => {
                events.push(StreamEvent::Thinking(response.clone()));
                *saw_thinking = true;
            }
            ResponseType::Content => {
                if *saw_thinking {
                    events.push(StreamEvent::ContentFirst(response.clone()));
                    *saw_thinking = false;
                } else {
                    events.push(StreamEvent::Content(response.clone()));
                }
            }
            ResponseType::ReasoningAndContent => {
                events.push(StreamEvent::Thinking(response.clone()));
                *saw_thinking = true;
                events.push(StreamEvent::ContentFirst(response.clone()));
                *saw_thinking = false;
            }
        }
        events
    }

    /// 将消息序列化为 JSONL 行(供应商原生格式)。
    ///
    /// 默认实现直接序列化 `Self::Message`。多供应商 enum 后端需覆写,
    /// 提取内层供应商原生消息序列化,跳过 enum 变体名包装。
    fn message_to_jsonl(&self, msg: &Self::Message) -> Result<String, AgentError> {
        serde_json::to_string(msg).map_err(|e| AgentError::Context(e.to_string()))
    }

    /// 从 JSONL 行反序列化为消息。
    ///
    /// 默认实现直接反序列化为 `Self::Message`。多供应商 enum 后端需覆写,
    /// 按当前供应商类型解析后包装为 enum 变体。
    fn message_from_jsonl(&self, line: &str) -> Result<Self::Message, AgentError> {
        serde_json::from_str(line)
            .map_err(|e| AgentError::Context(format!("JSONL 解析失败: {e}")))
    }
}