harn-vm 0.8.32 - Docs.rs

//! Provider-aware reasoning policy normalization.
//!
//! `thinking` and `reasoning_effort` are intentionally lower-level: each
//! provider exposes a different wire shape. This module owns Harn's
//! user-facing policy vocabulary (`auto`, `off`, `low`, ...), lowering it
//! into the canonical [`ThinkingConfig`] that providers already understand.

use std::collections::BTreeMap;
use std::rc::Rc;

use crate::llm::api::{ReasoningEffort, ThinkingConfig};
use crate::llm::capabilities::Capabilities;
use crate::value::{VmError, VmValue};

pub const INHERIT_POLICY_VALUE: &str = "@inherit";

const POLICY_VALUES: &[&str] = &["auto", "off", "minimal", "low", "medium", "high", "xhigh"];

#[derive(Clone, Debug, PartialEq, Eq)]
pub(crate) struct ReasoningPolicyApplication {
    pub thinking: ThinkingConfig,
    pub policy: String,
    pub task: String,
    pub scale: String,
    pub level: String,
    pub provider: String,
    pub model: String,
}

/// Normalize a selector from ACP or another string-only host surface.
///
/// `None` means "clear the session pin". `"none"` is accepted as a
/// user-friendly alias for Harn's provider-agnostic `"off"` policy; raw
/// OpenAI `reasoning_effort: "none"` remains available through the lower-level
/// per-call option.
pub fn normalize_policy_selector(raw: &str) -> Result<Option<String>, String> {
    let trimmed = raw.trim();
    if trimmed.is_empty() || trimmed == INHERIT_POLICY_VALUE {
        return Ok(None);
    }
    normalize_policy_str(trimmed).map(Some)
}

pub fn policy_values() -> &'static [&'static str] {
    POLICY_VALUES
}

pub(crate) fn resolve_for_llm_call(
    options: Option<&BTreeMap<String, VmValue>>,
    provider: &str,
    model: &str,
    caps: &Capabilities,
) -> Result<Option<ReasoningPolicyApplication>, VmError> {
    resolve_policy(options, provider, model, caps, None)
}

pub(crate) fn apply_policy_to_vm_options(
    opts: &BTreeMap<String, VmValue>,
) -> Result<BTreeMap<String, VmValue>, VmError> {
    if caller_set_reasoning(Some(opts)) {
        return Ok(opts.clone());
    }
    let Some((provider, model)) = resolved_route_from_options(opts) else {
        return Ok(opts.clone());
    };
    let caps = crate::llm::capabilities::lookup(&provider, &model);
    let Some(application) = resolve_policy(Some(opts), &provider, &model, &caps, Some("auto"))?
    else {
        return Ok(opts.clone());
    };
    let mut out = opts.clone();
    out.insert(
        "thinking".to_string(),
        thinking_to_vm_value(&application.thinking),
    );
    out.insert(
        "_agent_reasoning_policy_applied".to_string(),
        application_metadata_to_vm_value(&application),
    );
    Ok(out)
}

fn resolve_policy(
    options: Option<&BTreeMap<String, VmValue>>,
    provider: &str,
    model: &str,
    caps: &Capabilities,
    default_policy: Option<&str>,
) -> Result<Option<ReasoningPolicyApplication>, VmError> {
    if caller_set_reasoning(options) {
        return Ok(None);
    }
    let Some(policy) = selected_policy(options, default_policy)? else {
        return Ok(None);
    };
    let task = reasoning_task(options)?;
    let scale = reasoning_scale(options)?;
    let mut level = if policy == "auto" {
        auto_reasoning_level(&task, &scale)
    } else {
        policy.clone()
    };
    if policy == "auto"
        && local_qwen_route(provider, model)
        && (level == "low" || level == "medium")
    {
        level = "off".to_string();
    }
    let Some(thinking) = thinking_for_reasoning_level(&level, caps) else {
        return Ok(None);
    };
    Ok(Some(ReasoningPolicyApplication {
        thinking,
        policy,
        task,
        scale,
        level,
        provider: provider.to_string(),
        model: model.to_string(),
    }))
}

fn selected_policy(
    options: Option<&BTreeMap<String, VmValue>>,
    default_policy: Option<&str>,
) -> Result<Option<String>, VmError> {
    if let Some(value) = options.and_then(|opts| {
        opts.get("reasoning_policy")
            .or_else(|| opts.get("thinking_policy"))
    }) {
        return normalize_policy_vm_value(value).map(Some);
    }
    if let Some(session_id) = crate::agent_sessions::current_session_id() {
        if let Some(policy) = crate::agent_sessions::pinned_reasoning_policy(&session_id) {
            return Ok(Some(policy));
        }
    }
    default_policy.map(normalize_policy_str_vm).transpose()
}

fn caller_set_reasoning(options: Option<&BTreeMap<String, VmValue>>) -> bool {
    let Some(opts) = options else {
        return false;
    };
    if opts.contains_key("thinking") || opts.contains_key("reasoning_effort") {
        return true;
    }
    opts.get("llm_options")
        .and_then(VmValue::as_dict)
        .is_some_and(|llm_opts| {
            llm_opts.contains_key("thinking") || llm_opts.contains_key("reasoning_effort")
        })
}

fn normalize_policy_vm_value(value: &VmValue) -> Result<String, VmError> {
    match value {
        VmValue::Nil => Ok("auto".to_string()),
        VmValue::Bool(true) => Ok("auto".to_string()),
        VmValue::Bool(false) => Ok("off".to_string()),
        other => normalize_policy_str_vm(&other.display()),
    }
}

fn normalize_policy_str_vm(raw: &str) -> Result<String, VmError> {
    normalize_policy_str(raw)
        .map_err(|message| VmError::Runtime(format!("reasoning_policy: {message}")))
}

fn normalize_policy_str(raw: &str) -> Result<String, String> {
    let policy = raw.trim().to_ascii_lowercase();
    if policy.is_empty() || policy == "default" || policy == "inherit" {
        return Ok("auto".to_string());
    }
    if matches!(
        policy.as_str(),
        "none" | "disabled" | "disable" | "false" | "no" | "nothink" | "no_think"
    ) {
        return Ok("off".to_string());
    }
    if matches!(policy.as_str(), "enabled" | "on" | "true") {
        return Ok("auto".to_string());
    }
    if POLICY_VALUES.iter().any(|candidate| *candidate == policy) {
        return Ok(policy);
    }
    Err(format!(
        "expected auto, off, minimal, low, medium, high, or xhigh; got {raw:?}"
    ))
}

fn reasoning_scale(options: Option<&BTreeMap<String, VmValue>>) -> Result<String, VmError> {
    let raw = options
        .and_then(|opts| {
            opts.get("reasoning_scale")
                .or_else(|| opts.get("problem_scale"))
        })
        .map(VmValue::display)
        .unwrap_or_else(|| "medium".to_string());
    let scale = raw.trim().to_ascii_lowercase();
    if scale.is_empty() || scale == "auto" {
        return Ok("medium".to_string());
    }
    if matches!(scale.as_str(), "small" | "medium" | "large") {
        return Ok(scale);
    }
    Err(VmError::Runtime(format!(
        "reasoning_scale: expected small, medium, large, or auto; got {raw:?}"
    )))
}

fn reasoning_task(options: Option<&BTreeMap<String, VmValue>>) -> Result<String, VmError> {
    let raw = options.and_then(|opts| {
        opts.get("reasoning_task")
            .or_else(|| opts.get("task_kind"))
            .or_else(|| opts.get("task"))
    });
    if let Some(raw) = raw {
        let task = raw.display().trim().to_ascii_lowercase();
        if task.is_empty() {
            return Ok("chat".to_string());
        }
        if matches!(
            task.as_str(),
            "chat" | "agent" | "code" | "verify" | "summarize"
        ) {
            return Ok(task);
        }
        return Err(VmError::Runtime(format!(
            "reasoning_task: expected chat, agent, code, verify, or summarize; got {:?}",
            raw.display()
        )));
    }
    if options
        .and_then(|opts| opts.get("profile"))
        .is_some_and(|profile| profile.display() == "verifier")
    {
        return Ok("verify".to_string());
    }
    if options
        .and_then(|opts| opts.get("profile"))
        .is_some_and(|profile| profile.display() == "completer")
    {
        return Ok("summarize".to_string());
    }
    if options.and_then(|opts| opts.get("tools")).is_some() {
        return Ok("agent".to_string());
    }
    Ok("chat".to_string())
}

fn auto_reasoning_level(task: &str, scale: &str) -> String {
    if task == "summarize" {
        return "off".to_string();
    }
    if task == "verify" {
        return "low".to_string();
    }
    if task == "chat" && scale != "large" {
        return "off".to_string();
    }
    match scale {
        "small" => "low".to_string(),
        "large" => "high".to_string(),
        _ => "medium".to_string(),
    }
}

fn thinking_for_reasoning_level(level: &str, caps: &Capabilities) -> Option<ThinkingConfig> {
    if level == "off" {
        if caps_supports(caps, "effort") || caps.reasoning_effort_supported {
            if caps.reasoning_none_supported {
                return Some(ThinkingConfig::Effort {
                    level: ReasoningEffort::None,
                });
            }
            return Some(ThinkingConfig::Effort {
                level: ReasoningEffort::Minimal,
            });
        }
        return Some(ThinkingConfig::Disabled);
    }
    if caps_supports(caps, "effort") || caps.reasoning_effort_supported {
        return reasoning_effort_from_level(level).map(|level| ThinkingConfig::Effort { level });
    }
    if caps_supports(caps, "enabled") {
        return Some(ThinkingConfig::Enabled {
            budget_tokens: Some(budget_for_reasoning_level(level)),
        });
    }
    if caps_supports(caps, "adaptive") {
        return Some(ThinkingConfig::Adaptive);
    }
    None
}

fn caps_supports(caps: &Capabilities, mode: &str) -> bool {
    caps.thinking_modes
        .iter()
        .any(|supported| supported == mode)
}

fn reasoning_effort_from_level(level: &str) -> Option<ReasoningEffort> {
    Some(match level {
        "minimal" => ReasoningEffort::Minimal,
        "low" => ReasoningEffort::Low,
        "medium" => ReasoningEffort::Medium,
        "high" => ReasoningEffort::High,
        "xhigh" => ReasoningEffort::XHigh,
        _ => return None,
    })
}

fn budget_for_reasoning_level(level: &str) -> u32 {
    match level {
        "minimal" | "low" => 1024,
        "high" | "xhigh" => 12_000,
        _ => 4096,
    }
}

fn local_qwen_route(provider: &str, model: &str) -> bool {
    matches!(
        provider.to_ascii_lowercase().as_str(),
        "ollama" | "llamacpp" | "local" | "mlx"
    ) && model.to_ascii_lowercase().contains("qwen3")
}

fn resolved_route_from_options(opts: &BTreeMap<String, VmValue>) -> Option<(String, String)> {
    let model = opts.get("model")?.display();
    if model.trim().is_empty() {
        return None;
    }
    let user_provider = opts
        .get("provider")
        .map(VmValue::display)
        .filter(|provider| {
            let provider = provider.trim();
            !provider.is_empty() && !provider.eq_ignore_ascii_case("auto")
        });
    let (resolved_model, provider_from_alias) = crate::llm_config::resolve_model(&model);
    let provider = user_provider
        .or(provider_from_alias)
        .unwrap_or_else(|| crate::llm_config::infer_provider(&resolved_model));
    Some((provider, resolved_model))
}

fn thinking_to_vm_value(thinking: &ThinkingConfig) -> VmValue {
    match thinking {
        ThinkingConfig::Disabled => VmValue::Dict(Rc::new(BTreeMap::from([(
            "mode".to_string(),
            VmValue::String(Rc::from("disabled")),
        )]))),
        ThinkingConfig::Enabled { budget_tokens } => {
            let mut dict =
                BTreeMap::from([("mode".to_string(), VmValue::String(Rc::from("enabled")))]);
            if let Some(budget_tokens) = budget_tokens {
                dict.insert(
                    "budget_tokens".to_string(),
                    VmValue::Int(*budget_tokens as i64),
                );
            }
            VmValue::Dict(Rc::new(dict))
        }
        ThinkingConfig::Adaptive => VmValue::Dict(Rc::new(BTreeMap::from([(
            "mode".to_string(),
            VmValue::String(Rc::from("adaptive")),
        )]))),
        ThinkingConfig::Effort { level } => VmValue::Dict(Rc::new(BTreeMap::from([
            ("mode".to_string(), VmValue::String(Rc::from("effort"))),
            (
                "level".to_string(),
                VmValue::String(Rc::from(level.as_str())),
            ),
        ]))),
    }
}

fn application_metadata_to_vm_value(application: &ReasoningPolicyApplication) -> VmValue {
    VmValue::Dict(Rc::new(BTreeMap::from([
        (
            "policy".to_string(),
            VmValue::String(Rc::from(application.policy.clone())),
        ),
        (
            "task".to_string(),
            VmValue::String(Rc::from(application.task.clone())),
        ),
        (
            "scale".to_string(),
            VmValue::String(Rc::from(application.scale.clone())),
        ),
        (
            "level".to_string(),
            VmValue::String(Rc::from(application.level.clone())),
        ),
        (
            "provider".to_string(),
            VmValue::String(Rc::from(application.provider.clone())),
        ),
        (
            "model".to_string(),
            VmValue::String(Rc::from(application.model.clone())),
        ),
    ])))
}

#[cfg(test)]
mod tests {
    use super::*;

    fn apply(opts: BTreeMap<String, VmValue>) -> BTreeMap<String, VmValue> {
        apply_policy_to_vm_options(&opts).expect("policy")
    }

    #[test]
    fn high_policy_maps_to_effort_for_openai_reasoning_models() {
        let opts = BTreeMap::from([
            ("provider".to_string(), VmValue::String(Rc::from("openai"))),
            ("model".to_string(), VmValue::String(Rc::from("gpt-5"))),
            (
                "reasoning_policy".to_string(),
                VmValue::String(Rc::from("high")),
            ),
        ]);
        let out = apply(opts);
        let thinking = out
            .get("thinking")
            .and_then(VmValue::as_dict)
            .expect("thinking");
        assert_eq!(
            thinking.get("mode").map(VmValue::display).as_deref(),
            Some("effort")
        );
        assert_eq!(
            thinking.get("level").map(VmValue::display).as_deref(),
            Some("high")
        );
    }

    #[test]
    fn auto_policy_turns_local_qwen_medium_agent_work_into_disabled_thinking() {
        let opts = BTreeMap::from([
            ("provider".to_string(), VmValue::String(Rc::from("ollama"))),
            (
                "model".to_string(),
                VmValue::String(Rc::from("qwen3.6:35b-a3b-coding-nvfp4")),
            ),
            (
                "reasoning_policy".to_string(),
                VmValue::String(Rc::from("auto")),
            ),
            (
                "reasoning_task".to_string(),
                VmValue::String(Rc::from("agent")),
            ),
        ]);
        let out = apply(opts);
        let thinking = out
            .get("thinking")
            .and_then(VmValue::as_dict)
            .expect("thinking");
        assert_eq!(
            thinking.get("mode").map(VmValue::display).as_deref(),
            Some("disabled")
        );
        let applied = out
            .get("_agent_reasoning_policy_applied")
            .and_then(VmValue::as_dict)
            .expect("applied metadata");
        assert_eq!(
            applied.get("level").map(VmValue::display).as_deref(),
            Some("off")
        );
    }

    #[test]
    fn explicit_thinking_wins_over_policy() {
        let opts = BTreeMap::from([
            ("provider".to_string(), VmValue::String(Rc::from("openai"))),
            ("model".to_string(), VmValue::String(Rc::from("gpt-5"))),
            (
                "reasoning_policy".to_string(),
                VmValue::String(Rc::from("high")),
            ),
            ("thinking".to_string(), VmValue::Bool(true)),
        ]);
        let out = apply_policy_to_vm_options(&opts).expect("policy");
        assert!(matches!(out.get("thinking"), Some(VmValue::Bool(true))));
        assert!(!out.contains_key("_agent_reasoning_policy_applied"));
    }
}