tidev 0.2.0 - Docs.rs

use std::collections::HashSet;

use anyhow::Result;

use crate::{
    config::ActiveModel,
    llm::LlmClient,
    prompts::{self, SessionMode, compression_system_prompt},
    session::{Conversation, Message, MessageAttachment, MessageRole, tool_output_preview},
};

#[derive(Clone, Debug)]
pub struct ContextManager {
    pub summary: Option<String>,
    pub retained_from: usize,
    pub prune_threshold_tokens: usize,
    pub retain_recent_tokens: usize,
    pub maximum_summary_chars: usize,
}

impl Default for ContextManager {
    fn default() -> Self {
        Self::new()
    }
}

impl ContextManager {
    pub fn new() -> Self {
        Self {
            summary: None,
            retained_from: 0,
            prune_threshold_tokens: 24_000,
            retain_recent_tokens: 12_000,
            maximum_summary_chars: 8_000,
        }
    }

    pub fn from_state(summary: Option<String>, retained_from: usize) -> Self {
        let mut manager = Self::new();
        manager.summary = summary;
        manager.retained_from = retained_from;
        manager
    }

    pub fn estimate_tokens_for_text(text: &str) -> usize {
        (text.chars().count() / 4).max(1)
    }

    fn message_tokens(message: &Message) -> usize {
        let tool_tokens: usize = message
            .tool_calls
            .iter()
            .map(|tool_call| {
                Self::estimate_tokens_for_text(&tool_call.name)
                    + Self::estimate_tokens_for_text(&tool_call.arguments)
            })
            .sum();

        let attachment_tokens: usize = message
            .attachments
            .iter()
            .map(|attachment| match attachment {
                MessageAttachment::FileReference { content, .. } => {
                    Self::estimate_tokens_for_text(content)
                }
                MessageAttachment::DirectoryReference { tree, .. } => {
                    Self::estimate_tokens_for_text(tree)
                }
                MessageAttachment::Image { filename, mime, .. } => {
                    Self::estimate_tokens_for_text(filename)
                        + Self::estimate_tokens_for_text(mime)
                        + 128
                }
            })
            .sum();

        Self::estimate_tokens_for_text(&message.content)
            + Self::estimate_tokens_for_text(&message.reasoning)
            + tool_tokens
            + attachment_tokens
            + 8
    }

    pub fn estimate_tokens_for_messages(messages: &[Message]) -> usize {
        messages.iter().map(Self::message_tokens).sum()
    }

    fn compaction_budget_for_model(&self, model: &ActiveModel) -> (usize, usize) {
        if model.context_window == 0 {
            return (self.prune_threshold_tokens, self.retain_recent_tokens);
        }

        let context_window = model.context_window;
        let reserved_tokens = model
            .max_output_tokens
            .max(context_window / 8)
            .max(4_000)
            .min(context_window.saturating_sub(1));
        let trigger_tokens = context_window.saturating_sub(reserved_tokens).max(1);
        let retain_recent_tokens = self
            .retain_recent_tokens
            .max(reserved_tokens)
            .min(trigger_tokens);

        (trigger_tokens, retain_recent_tokens)
    }

    pub fn needs_compaction(&self, conversation: &Conversation, model: &ActiveModel) -> bool {
        let (trigger_tokens, _) = self.compaction_budget_for_model(model);

        let last_context_tokens = conversation
            .visible_messages()
            .iter()
            .rev()
            .find_map(|message| message.input_tokens.or(message.total_tokens));

        match last_context_tokens {
            Some(tokens) => tokens as usize >= trigger_tokens,
            None => {
                Self::estimate_tokens_for_messages(conversation.visible_messages())
                    >= trigger_tokens
            }
        }
    }

    pub fn build_request_messages(
        &self,
        conversation: &Conversation,
        current_mode: SessionMode,
    ) -> Vec<Message> {
        let mut messages = Vec::new();
        let mut pending_tool_calls = HashSet::new();
        let mut was_plan_mode = current_mode == SessionMode::Plan;

        if let Some(summary) = &self.summary {
            messages.push(Message::new(
                MessageRole::System,
                format!("Context summary for continuation:\n{summary}"),
            ));
        }

        for message in conversation
            .visible_messages()
            .iter()
            .skip(self.retained_from)
        {
            if message.streaming {
                continue;
            }

            match message.role {
                MessageRole::System => {}
                MessageRole::User => {
                    pending_tool_calls.clear();
                    messages.push(message.clone());
                    if let Some(mode) = message.mode {
                        was_plan_mode = mode == SessionMode::Plan;
                    }
                }
                MessageRole::Assistant => {
                    // Skip assistant messages that have neither content nor tool_calls,
                    // as providers reject messages with both fields missing.
                    if message.content.is_empty() && message.tool_calls.is_empty() {
                        continue;
                    }
                    if let Some(mode) = message.mode {
                        was_plan_mode = mode == SessionMode::Plan;
                    } else if message.content.contains("PLAN MODE")
                        || message.content.contains("read-only")
                    {
                        was_plan_mode = true;
                    }
                    pending_tool_calls = message
                        .tool_calls
                        .iter()
                        .map(|tool_call| tool_call.id.clone())
                        .collect();
                    messages.push(message.clone());
                }
                MessageRole::Tool => {
                    let Some(tool_call_id) = message.tool_call_id.as_ref() else {
                        continue;
                    };

                    if pending_tool_calls.remove(tool_call_id) {
                        messages.push(message.clone());
                    }
                }
                MessageRole::Error => {}
            }
        }

        if current_mode == SessionMode::Plan && !was_plan_mode {
            let reminder = prompts::plan_switch_reminder();
            if let Some(last_user_msg) = messages
                .iter_mut()
                .rev()
                .find(|m| m.role == MessageRole::User)
            {
                last_user_msg.content = format!("{}\n\n{}", reminder, last_user_msg.content);
            }
        } else if current_mode == SessionMode::Build && was_plan_mode {
            let reminder = prompts::build_switch_reminder();
            if let Some(last_user_msg) = messages
                .iter_mut()
                .rev()
                .find(|m| m.role == MessageRole::User)
            {
                last_user_msg.content = format!("{}\n\n{}", reminder, last_user_msg.content);
            }
        }

        messages
    }

    pub async fn compact_if_needed(
        &mut self,
        llm: &LlmClient,
        model: &ActiveModel,
        conversation: &Conversation,
        manual: bool,
        stream_ctx: Option<(
            u64,
            tokio::sync::mpsc::UnboundedSender<crate::session::BackendEvent>,
        )>,
    ) -> Result<bool> {
        if !self.needs_compaction(conversation, model) && !manual {
            return Ok(false);
        }

        self.compact(llm, model, conversation, manual, stream_ctx)
            .await
    }

    pub async fn compact(
        &mut self,
        llm: &LlmClient,
        model: &ActiveModel,
        conversation: &Conversation,
        manual: bool,
        stream_ctx: Option<(
            u64,
            tokio::sync::mpsc::UnboundedSender<crate::session::BackendEvent>,
        )>,
    ) -> Result<bool> {
        let messages = conversation.visible_messages();
        if messages.is_empty() {
            return Ok(false);
        }

        let retain_recent_tokens = if manual {
            0
        } else {
            self.compaction_budget_for_model(model).1
        };

        let mut split_index = self.choose_split_index(messages, retain_recent_tokens);
        if !manual {
            if split_index == 0 || split_index >= messages.len() {
                if messages.len() <= 1 {
                    return Ok(false);
                }

                split_index = messages.len() - 1;
            }
            if split_index == 0 || split_index >= messages.len() {
                return Ok(false);
            }
        } else if split_index == 0 {
            split_index = messages.len();
        }

        let compressed_chunk = &messages[..split_index];
        let prompt = self.build_compression_prompt(compressed_chunk);

        let system_msg = Message::new(MessageRole::System, self.compression_system_prompt());
        let user_msg = Message::new(MessageRole::User, prompt);

        let summary = if let Some((request_id, ui_tx)) = stream_ctx {
            let (tx, mut rx) = tokio::sync::mpsc::unbounded_channel();
            let llm_clone = llm.clone();
            let model_clone = model.clone();
            let msgs = vec![system_msg.clone(), user_msg.clone()];
            let session_id = conversation.session_id;

            tokio::spawn(async move {
                let thinking_level = model_clone.thinking_level.clone();
                llm_clone
                    .stream_chat(
                        session_id,
                        request_id,
                        model_clone,
                        msgs,
                        vec![],
                        tx,
                        thinking_level,
                    )
                    .await;
            });

            let mut text = String::new();
            while let Some(event) = rx.recv().await {
                match &event {
                    crate::session::BackendEvent::Delta { content, .. } => {
                        text.push_str(content);
                        let _ = ui_tx.send(event.clone());
                    }
                    crate::session::BackendEvent::Finished { .. } => {
                        let _ = ui_tx.send(event.clone());
                        break;
                    }
                    crate::session::BackendEvent::Failed { error, .. } => {
                        let _ = ui_tx.send(event.clone());
                        return Err(anyhow::anyhow!("compaction failed: {}", error));
                    }
                    _ => {
                        let _ = ui_tx.send(event.clone());
                    }
                }
            }
            text
        } else {
            llm.complete_with_messages(model.clone(), vec![system_msg, user_msg])
                .await
                .unwrap_or_else(|error| self.fallback_summary(compressed_chunk, &error.to_string()))
        };

        self.summary = Some(summary.chars().take(self.maximum_summary_chars).collect());
        self.retained_from = split_index;
        Ok(true)
    }

    pub fn compacted_message_count(&self) -> usize {
        self.retained_from
    }

    fn choose_split_index(&self, messages: &[Message], retain_recent_tokens: usize) -> usize {
        let mut token_budget = retain_recent_tokens;
        let mut keep_from = messages.len();

        for (index, message) in messages.iter().enumerate().rev() {
            let message_tokens = Self::message_tokens(message);
            if token_budget < message_tokens {
                keep_from = index + 1;
                break;
            }

            token_budget = token_budget.saturating_sub(message_tokens);
            keep_from = index;
        }

        self.align_split_index_to_tool_boundary(messages, keep_from)
    }

    fn align_split_index_to_tool_boundary(
        &self,
        messages: &[Message],
        split_index: usize,
    ) -> usize {
        if split_index == 0 || split_index >= messages.len() {
            return split_index;
        }

        if !matches!(messages[split_index].role, MessageRole::Tool) {
            return split_index;
        }

        let mut aligned_index = split_index;
        while aligned_index > 0 && matches!(messages[aligned_index].role, MessageRole::Tool) {
            aligned_index -= 1;
        }

        aligned_index
    }

    fn build_compression_prompt(&self, messages: &[Message]) -> String {
        let mut prompt = String::from(
            "Provide a detailed continuation summary for this coding conversation.\n\n",
        );

        if let Some(summary) = &self.summary {
            prompt.push_str("Existing summary:\n");
            prompt.push_str(summary);
            prompt.push_str("\n\n");
        }

        prompt.push_str("Messages to compress:\n");
        for message in messages {
            let attachment_summary = message
                .attachments
                .iter()
                .map(|attachment| attachment.summary())
                .collect::<Vec<_>>()
                .join(" ");
            let content = if matches!(message.role, MessageRole::Tool) {
                tool_output_preview(message.tool_name.as_deref(), &message.content)
            } else {
                truncate(&message.content, 1_500)
            };
            prompt.push_str(&format!("- {}: {}\n", message.role.label(), content));

            if !attachment_summary.trim().is_empty() {
                prompt.push_str(&format!(
                    "  attachments: {}\n",
                    truncate(&attachment_summary, 240)
                ));
            }

            if !message.reasoning.trim().is_empty() {
                prompt.push_str(&format!(
                    "  thinking: {}\n",
                    truncate(&message.reasoning, 240)
                ));
            }

            for tool_call in &message.tool_calls {
                prompt.push_str(&format!(
                    "  tool call: {} {}\n",
                    tool_call.name,
                    truncate(&tool_call.arguments, 240)
                ));
            }
        }

        prompt.push_str(
            "\nFocus on: goals, decisions, file paths, code changes, active tasks, tool results, constraints, and anything needed to continue the work without re-reading prior context.",
        );
        prompt
    }

    fn compression_system_prompt(&self) -> String {
        compression_system_prompt().to_string()
    }

    fn fallback_summary(&self, messages: &[Message], error: &str) -> String {
        let mut summary = String::from("Context summary fallback\n");
        summary.push_str(&format!("Compression request failed: {error}\n"));
        for message in messages.iter().rev().take(12).rev() {
            summary.push_str(&format!(
                "- {}: {}\n",
                message.role.label(),
                truncate(&message.content, 240)
            ));

            if !message.attachments.is_empty() {
                let attachment_summary = message
                    .attachments
                    .iter()
                    .map(|attachment| attachment.summary())
                    .collect::<Vec<_>>()
                    .join(" ");
                summary.push_str(&format!(
                    "  attachments: {}\n",
                    truncate(&attachment_summary, 240)
                ));
            }
        }
        summary
    }
}

fn truncate(value: &str, max_chars: usize) -> String {
    let count = value.chars().count();
    if count <= max_chars {
        return value.to_string();
    }

    let mut shortened = value.chars().take(max_chars).collect::<String>();
    shortened.push_str("...");
    shortened
}

#[cfg(test)]
mod tests {
    use chrono::Utc;
    use uuid::Uuid;

    use super::*;
    use crate::config::{ActiveModel, ApiType};
    use crate::session::{Message, ToolCall, ToolExecutionResult};

    fn test_conversation(messages: Vec<Message>) -> Conversation {
        Conversation {
            session_id: Uuid::new_v4(),
            parent_session_id: None,
            workspace_root: String::new(),
            provider_id: "provider".to_string(),
            provider_display_name: "Provider".to_string(),
            model_id: "model".to_string(),
            model_display_name: "Model".to_string(),
            title: "Test".to_string(),
            created_at: Utc::now(),
            updated_at: Utc::now(),
            context_summary: None,
            context_retained_from: 0,
            messages,
            revert_message_id: None,
        }
    }

    fn test_model(context_window: usize, max_output_tokens: usize) -> ActiveModel {
        ActiveModel {
            provider_id: "provider".to_string(),
            provider_display_name: "Provider".to_string(),
            base_url: "https://example.com".to_string(),
            api_type: ApiType::OpenAiChatCompletions,
            model_id: "model".to_string(),
            request_model_id: "model".to_string(),
            display_name: "Model".to_string(),
            context_window,
            max_output_tokens,
            temperature: 0.0,
            supports_images: false,
            system_prompt: String::new(),
            api_key: None,
            extra_body: None,
            thinking_level: crate::config::reasoning::ThinkingLevelType::None,
        }
    }

    #[test]
    fn choose_split_index_keeps_tool_block_together() {
        let manager = ContextManager::new();

        let mut assistant = Message::new(MessageRole::Assistant, "call tools");
        assistant.tool_calls = vec![ToolCall {
            id: "tool-call-1".to_string(),
            name: "grep".to_string(),
            arguments: "{}".to_string(),
        }];

        let tool_result = Message::tool_result(
            "tool-call-1",
            "grep",
            crate::session::ToolExecutionResult::new("result"),
        );

        let messages = vec![
            Message::new(MessageRole::User, "first"),
            assistant,
            tool_result,
            Message::new(MessageRole::Assistant, "follow up"),
        ];

        let total_tokens: usize = messages.iter().map(ContextManager::message_tokens).sum();
        let first_msg_tokens = ContextManager::message_tokens(&messages[0]);
        let retain_recent_tokens = total_tokens - first_msg_tokens;

        assert_eq!(
            manager.choose_split_index(&messages, retain_recent_tokens),
            1
        );
        assert_eq!(manager.retain_recent_tokens, 12_000);
    }

    #[test]
    fn compaction_budget_scales_with_model_window() {
        let manager = ContextManager::new();
        let model = test_model(128_000, 32_768);

        let (trigger_tokens, retain_recent_tokens) = manager.compaction_budget_for_model(&model);

        assert_eq!(trigger_tokens, 95_232);
        assert_eq!(retain_recent_tokens, 32_768);
    }

    #[test]
    fn build_request_messages_keeps_valid_tool_results_and_skips_orphans() {
        let mut assistant = Message::new(MessageRole::Assistant, "call tools");
        assistant.tool_calls = vec![ToolCall {
            id: "tool-call-1".to_string(),
            name: "grep".to_string(),
            arguments: "{}".to_string(),
        }];

        let valid_conversation = test_conversation(vec![
            Message::new(MessageRole::User, "question"),
            assistant.clone(),
            Message::tool_result("tool-call-1", "grep", ToolExecutionResult::new("found")),
            Message::new(MessageRole::Assistant, "answer"),
        ]);

        let manager = ContextManager::new();
        let valid_request_messages =
            manager.build_request_messages(&valid_conversation, SessionMode::Build);
        let valid_roles: Vec<_> = valid_request_messages
            .iter()
            .map(|message| message.role.label())
            .collect();
        assert_eq!(valid_roles, vec!["user", "assistant", "tool", "assistant"]);

        let mut orphan_manager = ContextManager::new();
        orphan_manager.retained_from = 2;
        let orphan_request_messages =
            orphan_manager.build_request_messages(&valid_conversation, SessionMode::Build);
        let orphan_roles: Vec<_> = orphan_request_messages
            .iter()
            .map(|message| message.role.label())
            .collect();
        assert_eq!(orphan_roles, vec!["assistant"]);
        assert!(
            orphan_request_messages
                .iter()
                .all(|message| !matches!(message.role, MessageRole::Tool))
        );
    }
}