cartomancer 0.8.0

//! Ollama LLM provider — local-first, no API key needed.
//!
//! Uses the `/api/chat` endpoint for chat completions.

use anyhow::{Context, Result};
use async_trait::async_trait;
use serde::{Deserialize, Serialize};

use super::LlmProvider;

pub struct OllamaProvider {
    http: reqwest::Client,
    base_url: String,
    model: String,
    system_prompt: Option<String>,
}

#[derive(Serialize)]
struct ChatRequest<'a> {
    model: &'a str,
    messages: Vec<Message<'a>>,
    stream: bool,
}

#[derive(Serialize)]
struct Message<'a> {
    role: &'a str,
    content: &'a str,
}

#[derive(Deserialize)]
struct ChatResponse {
    message: ResponseMessage,
}

#[derive(Deserialize)]
struct ResponseMessage {
    content: String,
}

impl OllamaProvider {
    pub fn new(base_url: &str, model: &str, system_prompt: Option<String>) -> Self {
        Self {
            http: reqwest::Client::builder()
                .timeout(std::time::Duration::from_secs(300))
                .build()
                .expect("failed to build HTTP client"),
            base_url: base_url.trim_end_matches('/').to_string(),
            model: model.to_string(),
            system_prompt,
        }
    }
}

#[derive(Deserialize)]
struct TagsResponse {
    models: Vec<TagModel>,
}

#[derive(Deserialize)]
struct TagModel {
    name: String,
}

#[async_trait]
impl LlmProvider for OllamaProvider {
    fn name(&self) -> &str {
        "ollama"
    }

    async fn health_check(&self) -> Result<()> {
        let resp: TagsResponse = self
            .http
            .get(format!("{}/api/tags", self.base_url))
            .send()
            .await
            .context(format!(
                "cannot reach Ollama at {} — is it running?",
                self.base_url
            ))?
            .error_for_status()
            .context("Ollama health check failed")?
            .json()
            .await
            .context("failed to parse Ollama /api/tags response")?;

        let available: Vec<&str> = resp.models.iter().map(|m| m.name.as_str()).collect();
        // Ollama model names may include a `:latest` suffix
        let model_matches = available
            .iter()
            .any(|m| *m == self.model || *m == format!("{}:latest", self.model));

        if !model_matches {
            anyhow::bail!(
                "model '{}' not found in Ollama — available: [{}]. Pull it with: ollama pull {}",
                self.model,
                available.join(", "),
                self.model,
            );
        }

        Ok(())
    }

    async fn complete(&self, prompt: &str) -> Result<String> {
        let mut messages = Vec::new();
        if let Some(ref sys) = self.system_prompt {
            messages.push(Message {
                role: "system",
                content: sys,
            });
        }
        messages.push(Message {
            role: "user",
            content: prompt,
        });

        let body = ChatRequest {
            model: &self.model,
            messages,
            stream: false,
        };

        let resp = self
            .http
            .post(format!("{}/api/chat", self.base_url))
            .json(&body)
            .send()
            .await
            .context("Failed to connect to Ollama")?
            .error_for_status()
            .context("Ollama returned an error")?
            .json::<ChatResponse>()
            .await
            .context("Failed to parse Ollama response")?;

        Ok(resp.message.content)
    }
}

#[cfg(test)]
mod tests {
    use super::*;
    use wiremock::matchers::{method, path};
    use wiremock::{Mock, MockServer, ResponseTemplate};

    #[test]
    fn chat_request_serialization() {
        let req = ChatRequest {
            model: "gemma4",
            messages: vec![Message {
                role: "user",
                content: "hello",
            }],
            stream: false,
        };
        let json = serde_json::to_string(&req).unwrap();
        assert!(json.contains("gemma4"));
        assert!(json.contains("hello"));
        assert!(json.contains(r#""stream":false"#));
    }

    // --- HTTP mocking tests ---

    #[tokio::test]
    async fn health_check_passes_when_model_available() {
        let server = MockServer::start().await;
        Mock::given(method("GET"))
            .and(path("/api/tags"))
            .respond_with(ResponseTemplate::new(200).set_body_string(
                r#"{"models":[{"name":"gemma4:latest"},{"name":"llama3:latest"}]}"#,
            ))
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(&server.uri(), "gemma4", None);
        provider.health_check().await.unwrap();
    }

    #[tokio::test]
    async fn health_check_passes_with_exact_name_match() {
        let server = MockServer::start().await;
        Mock::given(method("GET"))
            .and(path("/api/tags"))
            .respond_with(
                ResponseTemplate::new(200).set_body_string(r#"{"models":[{"name":"gemma4"}]}"#),
            )
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(&server.uri(), "gemma4", None);
        provider.health_check().await.unwrap();
    }

    #[tokio::test]
    async fn health_check_fails_when_model_missing() {
        let server = MockServer::start().await;
        Mock::given(method("GET"))
            .and(path("/api/tags"))
            .respond_with(
                ResponseTemplate::new(200)
                    .set_body_string(r#"{"models":[{"name":"llama3:latest"}]}"#),
            )
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(&server.uri(), "gemma4", None);
        let err = provider.health_check().await.unwrap_err();
        assert!(err.to_string().contains("not found"));
        assert!(err.to_string().contains("ollama pull gemma4"));
    }

    #[tokio::test]
    async fn health_check_fails_when_server_returns_error() {
        let server = MockServer::start().await;
        Mock::given(method("GET"))
            .and(path("/api/tags"))
            .respond_with(ResponseTemplate::new(500))
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(&server.uri(), "gemma4", None);
        let err = provider.health_check().await.unwrap_err();
        assert!(err.to_string().contains("health check failed"));
    }

    #[tokio::test]
    async fn complete_returns_message_content() {
        let server = MockServer::start().await;
        Mock::given(method("POST"))
            .and(path("/api/chat"))
            .respond_with(ResponseTemplate::new(200).set_body_string(
                r#"{"message":{"role":"assistant","content":"This is a security issue."}}"#,
            ))
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(&server.uri(), "gemma4", None);
        let result = provider.complete("analyze this").await.unwrap();
        assert_eq!(result, "This is a security issue.");
    }

    #[tokio::test]
    async fn complete_fails_on_server_error() {
        let server = MockServer::start().await;
        Mock::given(method("POST"))
            .and(path("/api/chat"))
            .respond_with(ResponseTemplate::new(500).set_body_string("internal error"))
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(&server.uri(), "gemma4", None);
        let err = provider.complete("test").await.unwrap_err();
        assert!(err.to_string().contains("error"));
    }

    #[tokio::test]
    async fn complete_sends_stream_false() {
        let server = MockServer::start().await;
        Mock::given(method("POST"))
            .and(path("/api/chat"))
            .and(wiremock::matchers::body_partial_json(serde_json::json!({
                "model": "gemma4",
                "stream": false
            })))
            .respond_with(
                ResponseTemplate::new(200)
                    .set_body_string(r#"{"message":{"role":"assistant","content":"ok"}}"#),
            )
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(&server.uri(), "gemma4", None);
        let result = provider.complete("test").await.unwrap();
        assert_eq!(result, "ok");
    }

    #[tokio::test]
    async fn complete_includes_system_message_when_set() {
        let server = MockServer::start().await;
        Mock::given(method("POST"))
            .and(path("/api/chat"))
            .and(wiremock::matchers::body_partial_json(serde_json::json!({
                "messages": [
                    {"role": "system", "content": "You review fintech code."},
                    {"role": "user", "content": "analyze this"}
                ]
            })))
            .respond_with(
                ResponseTemplate::new(200)
                    .set_body_string(r#"{"message":{"role":"assistant","content":"ok"}}"#),
            )
            .mount(&server)
            .await;

        let provider = OllamaProvider::new(
            &server.uri(),
            "gemma4",
            Some("You review fintech code.".into()),
        );
        let result = provider.complete("analyze this").await.unwrap();
        assert_eq!(result, "ok");
    }
}