cueloop 0.6.0 - Docs.rs

//! Purpose: Regression coverage for runner execution orchestration.
//!
//! Responsibilities:
//! - Verify safeguard-dump messaging for orchestration failure paths.
//! - Validate timeout handling remains resilient to poisoned capture locks.
//! - Keep signal-recovery and continue-session fallback behavior pinned.
//!
//! Scope:
//! - Unit tests for `orchestration/core.rs` only.
//! - Broader runutil tests remain in `runutil/tests.rs` and `runutil/tests/*.rs`.
//!
//! Usage:
//! - Compiled through `orchestration/mod.rs` under `#[cfg(test)]`.
//!
//! Invariants/Assumptions:
//! - Tests use mock `RunnerBackend` implementations and temp dirs only.
//! - No real runner binaries are required.

use std::path::Path;
use std::sync::{Arc, Mutex, OnceLock};
use std::thread;
use std::time::Duration;

use log::{Level, LevelFilter, Log, Metadata, Record};
use serial_test::serial;

#[cfg(unix)]
use std::os::unix::fs::PermissionsExt;
#[cfg(unix)]
use std::path::PathBuf;

use super::super::super::RunnerRetryPolicy;
use super::super::backend::{
    RunnerBackend, RunnerBackendResumeSession, RunnerBackendRunPrompt, RunnerErrorMessages,
    RunnerExecutionContext, RunnerFailureHandling, RunnerInvocation, RunnerRetryState,
    RunnerSettings,
};
use super::run_prompt_with_handling_backend;
use crate::commands::run::PhaseType;
use crate::contracts::{GitRevertMode, Model, Runner};
use crate::redaction::RedactedString;
use crate::runner;

fn test_bins() -> runner::RunnerBinaries<'static> {
    runner::RunnerBinaries {
        codex: "codex",
        opencode: "opencode",
        gemini: "gemini",
        claude: "claude",
        cursor: "cursor",
        kimi: "kimi",
        pi: "pi",
    }
}

fn test_invocation<'a>(
    repo_root: &'a Path,
    runner_kind: Runner,
    model: Model,
    prompt: &'a str,
    timeout: Option<Duration>,
    revert_on_error: bool,
    session_id: Option<String>,
) -> RunnerInvocation<'a> {
    RunnerInvocation {
        settings: RunnerSettings {
            repo_root,
            runner_kind,
            bins: test_bins(),
            model,
            reasoning_effort: None,
            cursor: None,
            runner_cli: runner::ResolvedRunnerCliOptions::default(),
            timeout,
            permission_mode: None,
            output_handler: None,
            output_stream: runner::OutputStream::HandlerOnly,
        },
        execution: RunnerExecutionContext {
            prompt,
            phase_type: PhaseType::Implementation,
            session_id,
        },
        failure: RunnerFailureHandling {
            revert_on_error,
            git_revert_mode: GitRevertMode::Disabled,
            revert_prompt: None,
        },
        retry: RunnerRetryState {
            policy: RunnerRetryPolicy {
                base_backoff: Duration::ZERO,
                max_backoff: Duration::ZERO,
                jitter_ratio: 0.0,
                ..Default::default()
            },
        },
    }
}

fn non_zero_message(code: i32) -> String {
    format!("non-zero exit: {}", code)
}

fn other_message(err: runner::RunnerError) -> String {
    format!("other error: {}", err)
}

type TestRunnerErrorMessages =
    RunnerErrorMessages<'static, fn(i32) -> String, fn(runner::RunnerError) -> String>;

fn test_messages() -> TestRunnerErrorMessages {
    RunnerErrorMessages {
        log_label: "test",
        interrupted_msg: "interrupted",
        timeout_msg: "timeout",
        terminated_msg: "terminated",
        non_zero_msg: non_zero_message,
        other_msg: other_message,
    }
}

#[derive(Clone, Debug)]
struct CapturedLog {
    level: Level,
    message: String,
}

struct TestLogger;

static LOGGER: TestLogger = TestLogger;
static LOGGER_STATE: OnceLock<LoggerState> = OnceLock::new();
static LOGS: OnceLock<Mutex<Vec<CapturedLog>>> = OnceLock::new();

#[derive(Clone, Copy, Debug, PartialEq, Eq)]
enum LoggerState {
    TestLogger,
    OtherLogger,
}

impl Log for TestLogger {
    fn enabled(&self, _metadata: &Metadata<'_>) -> bool {
        true
    }

    fn log(&self, record: &Record<'_>) {
        let logs = LOGS.get_or_init(|| Mutex::new(Vec::new()));
        let mut guard = logs.lock().expect("log mutex");
        guard.push(CapturedLog {
            level: record.level(),
            message: record.args().to_string(),
        });
    }

    fn flush(&self) {}
}

fn init_logger() -> (LoggerState, &'static Mutex<Vec<CapturedLog>>) {
    let state = *LOGGER_STATE.get_or_init(|| {
        if log::set_logger(&LOGGER).is_ok() {
            log::set_max_level(LevelFilter::Debug);
            LoggerState::TestLogger
        } else {
            LoggerState::OtherLogger
        }
    });
    (state, LOGS.get_or_init(|| Mutex::new(Vec::new())))
}

fn take_logs() -> (LoggerState, Vec<CapturedLog>) {
    let (state, logs) = init_logger();
    let mut guard = logs.lock().expect("log mutex");
    let drained = guard.drain(..).collect::<Vec<_>>();
    (state, drained)
}

#[cfg(unix)]
struct RestoreWritablePermissions {
    path: PathBuf,
}

#[cfg(unix)]
impl Drop for RestoreWritablePermissions {
    fn drop(&mut self) {
        if self.path.exists() {
            let _ = std::fs::set_permissions(&self.path, std::fs::Permissions::from_mode(0o700));
        }
    }
}

#[test]
#[serial]
#[cfg(unix)]
fn successful_retry_emits_no_warning_level_recovery_log() {
    let (state, _) = take_logs();
    let _ = take_logs();

    struct RetryThenSuccessBackend {
        calls: usize,
    }

    impl RunnerBackend for RetryThenSuccessBackend {
        fn run_prompt(
            &mut self,
            _request: RunnerBackendRunPrompt<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            self.calls += 1;
            if self.calls == 1 {
                return Err(runner::RunnerError::Other(anyhow::anyhow!(
                    "rate limit, please retry later"
                )));
            }
            Ok(runner::RunnerOutput {
                status: success_status(),
                stdout: "ok".to_string(),
                stderr: String::new(),
                session_id: None,
            })
        }

        fn resume_session(
            &mut self,
            _request: RunnerBackendResumeSession<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            unreachable!("resume_session should not be called")
        }
    }

    let temp_dir = tempfile::tempdir().expect("tempdir");
    crate::testsupport::git::init_repo(temp_dir.path()).expect("init git repo");
    let cache_dir = temp_dir.path().join(".cueloop/cache");
    std::fs::create_dir_all(&cache_dir).expect("create cache dir");
    let cache_file = cache_dir.join("blocked");
    std::fs::write(&cache_file, "initial").expect("write tracked cache fixture");
    std::fs::write(temp_dir.path().join("README.md"), "initial").expect("write fixture");
    crate::testsupport::git::commit_all(temp_dir.path(), "initial").expect("commit fixture");
    std::fs::write(&cache_file, "dirty").expect("dirty allowed cache fixture");
    std::fs::set_permissions(&cache_dir, std::fs::Permissions::from_mode(0o500))
        .expect("make cache dir read-only");
    let _permissions_guard = RestoreWritablePermissions { path: cache_dir };

    let mut invocation = test_invocation(
        temp_dir.path(),
        Runner::Codex,
        Model::Gpt53Codex,
        "test prompt",
        None,
        true,
        None,
    );
    invocation.failure.git_revert_mode = GitRevertMode::Enabled;

    let mut backend = RetryThenSuccessBackend { calls: 0 };
    let output = run_prompt_with_handling_backend(invocation, test_messages(), &mut backend)
        .expect("retry should succeed");

    assert_eq!(output.stdout, "ok");
    assert_eq!(backend.calls, 2);

    let (_, logs) = take_logs();
    if state == LoggerState::TestLogger {
        let auto_revert_logs = logs
            .iter()
            .filter(|entry| entry.message.contains("auto-revert before retry"))
            .collect::<Vec<_>>();
        assert!(
            !auto_revert_logs.is_empty(),
            "expected failed auto-revert retry diagnostic log: {logs:?}"
        );
        assert!(
            auto_revert_logs
                .iter()
                .all(|entry| !matches!(entry.level, Level::Warn | Level::Error)),
            "logs: {logs:?}"
        );
    }
}

#[test]
#[serial]
fn terminal_revert_failure_preserves_retry_admission_diagnostic() {
    struct AlwaysRetryableBackend;

    impl RunnerBackend for AlwaysRetryableBackend {
        fn run_prompt(
            &mut self,
            _request: RunnerBackendRunPrompt<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            Err(runner::RunnerError::Other(anyhow::anyhow!(
                "rate limit, please retry later"
            )))
        }

        fn resume_session(
            &mut self,
            _request: RunnerBackendResumeSession<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            unreachable!("resume_session should not be called")
        }
    }

    let temp_dir = tempfile::tempdir().expect("tempdir");
    let bad_repo_path = temp_dir.path().join("missing-repo");
    let mut invocation = test_invocation(
        &bad_repo_path,
        Runner::Codex,
        Model::Gpt53Codex,
        "test prompt",
        None,
        true,
        None,
    );
    invocation.failure.git_revert_mode = GitRevertMode::Enabled;

    let mut backend = AlwaysRetryableBackend;
    let err = run_prompt_with_handling_backend(invocation, test_messages(), &mut backend)
        .expect_err("terminal revert failure expected");
    let message = err.to_string();

    assert!(
        message.contains("fallback git checkout"),
        "message: {message}"
    );
    assert!(message.contains("Retry diagnostics"), "message: {message}");
    assert!(
        message.contains("repo cleanliness check failed"),
        "message: {message}"
    );
}

#[test]
#[serial]
fn terminal_failure_includes_retry_admission_diagnostic_without_warning_log() {
    let (state, _) = take_logs();
    let _ = take_logs();

    struct AlwaysRetryableBackend;

    impl RunnerBackend for AlwaysRetryableBackend {
        fn run_prompt(
            &mut self,
            _request: RunnerBackendRunPrompt<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            Err(runner::RunnerError::Other(anyhow::anyhow!(
                "rate limit, please retry later"
            )))
        }

        fn resume_session(
            &mut self,
            _request: RunnerBackendResumeSession<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            unreachable!("resume_session should not be called")
        }
    }

    let temp_dir = tempfile::tempdir().expect("tempdir");
    let bad_repo_path = temp_dir.path().join("missing-repo");
    let invocation = test_invocation(
        &bad_repo_path,
        Runner::Codex,
        Model::Gpt53Codex,
        "test prompt",
        None,
        false,
        None,
    );

    let mut backend = AlwaysRetryableBackend;
    let err = run_prompt_with_handling_backend(invocation, test_messages(), &mut backend)
        .expect_err("terminal failure expected");
    let message = err.to_string();

    assert!(message.contains("other error"), "message: {message}");
    assert!(message.contains("Retry diagnostics"), "message: {message}");
    assert!(
        message.contains("repo cleanliness check failed"),
        "message: {message}"
    );
    assert!(
        message.contains("skipped retry admission"),
        "message: {message}"
    );

    let (_, logs) = take_logs();
    if state == LoggerState::TestLogger {
        let retry_probe_logs = logs
            .iter()
            .filter(|entry| {
                entry
                    .message
                    .contains("Failed to check repo state for retry")
            })
            .collect::<Vec<_>>();
        assert!(
            !retry_probe_logs.is_empty(),
            "expected debug retry-admission diagnostic log: {logs:?}"
        );
        assert!(
            retry_probe_logs
                .iter()
                .all(|entry| !matches!(entry.level, Level::Warn | Level::Error)),
            "logs: {logs:?}"
        );
    }
}

#[test]
fn safeguard_dump_created_for_stderr_on_nonzero_exit() {
    struct MockNonZeroExitBackend;

    impl RunnerBackend for MockNonZeroExitBackend {
        fn run_prompt(
            &mut self,
            _request: RunnerBackendRunPrompt<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            Err(runner::RunnerError::NonZeroExit {
                code: 1,
                stdout: RedactedString::from("stdout content"),
                stderr: RedactedString::from("stderr content with API_KEY=secret123"),
                session_id: None,
            })
        }

        fn resume_session(
            &mut self,
            _request: RunnerBackendResumeSession<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            unreachable!("resume_session should not be called")
        }
    }

    let temp_dir = tempfile::tempdir().expect("tempdir");
    let invocation = test_invocation(
        temp_dir.path(),
        Runner::Codex,
        Model::Gpt53Codex,
        "test prompt",
        None,
        true,
        None,
    );

    let mut backend = MockNonZeroExitBackend;
    let result = run_prompt_with_handling_backend(invocation, test_messages(), &mut backend);

    assert!(result.is_err());
    let err_msg = format!("{}", result.unwrap_err());
    assert!(err_msg.contains("stdout saved"));
    assert!(err_msg.contains("stderr saved"));
}

#[test]
fn safeguard_dump_created_for_stderr_on_terminated_by_signal() {
    struct MockTerminatedBySignalBackend;

    impl RunnerBackend for MockTerminatedBySignalBackend {
        fn run_prompt(
            &mut self,
            _request: RunnerBackendRunPrompt<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            Err(runner::RunnerError::TerminatedBySignal {
                signal: Some(15),
                stdout: RedactedString::from("stdout content"),
                stderr: RedactedString::from("stderr content with API_KEY=secret123"),
                session_id: None,
            })
        }

        fn resume_session(
            &mut self,
            _request: RunnerBackendResumeSession<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            unreachable!("resume_session should not be called")
        }
    }

    let temp_dir = tempfile::tempdir().expect("tempdir");
    let invocation = test_invocation(
        temp_dir.path(),
        Runner::Codex,
        Model::Gpt53Codex,
        "test prompt",
        None,
        true,
        None,
    );

    let mut backend = MockTerminatedBySignalBackend;
    let result = run_prompt_with_handling_backend(invocation, test_messages(), &mut backend);

    assert!(result.is_err());
    let err_msg = format!("{}", result.unwrap_err());
    assert!(err_msg.contains("stdout saved"));
    assert!(err_msg.contains("stderr saved"));
}

#[test]
fn no_safeguard_dump_for_empty_stderr() {
    struct MockEmptyStderrBackend;

    impl RunnerBackend for MockEmptyStderrBackend {
        fn run_prompt(
            &mut self,
            _request: RunnerBackendRunPrompt<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            Err(runner::RunnerError::NonZeroExit {
                code: 1,
                stdout: RedactedString::from("stdout content"),
                stderr: RedactedString::from(""),
                session_id: None,
            })
        }

        fn resume_session(
            &mut self,
            _request: RunnerBackendResumeSession<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            unreachable!("resume_session should not be called")
        }
    }

    let temp_dir = tempfile::tempdir().expect("tempdir");
    let invocation = test_invocation(
        temp_dir.path(),
        Runner::Codex,
        Model::Gpt53Codex,
        "test prompt",
        None,
        true,
        None,
    );

    let mut backend = MockEmptyStderrBackend;
    let result = run_prompt_with_handling_backend(invocation, test_messages(), &mut backend);

    assert!(result.is_err());
    let err_msg = format!("{}", result.unwrap_err());
    assert!(err_msg.contains("stdout saved"));
    assert!(!err_msg.contains("stderr saved"));
}

#[test]
fn timeout_stdout_capture_survives_mutex_poison() {
    struct MockTimeoutBackend;

    impl RunnerBackend for MockTimeoutBackend {
        fn run_prompt(
            &mut self,
            _request: RunnerBackendRunPrompt<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            Err(runner::RunnerError::Timeout)
        }

        fn resume_session(
            &mut self,
            _request: RunnerBackendResumeSession<'_>,
        ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
            unreachable!("resume_session should not be called")
        }
    }

    let temp_dir = tempfile::tempdir().expect("tempdir");

    let capture_for_handler: Arc<Mutex<String>> = Arc::new(Mutex::new(String::new()));
    let capture_for_panic = capture_for_handler.clone();

    let handle = thread::spawn(move || {
        let _lock = capture_for_panic.lock().unwrap();
        panic!("intentional panic to poison mutex");
    });

    let _ = handle.join();

    assert!(capture_for_handler.is_poisoned());

    let recovered_data = match capture_for_handler.lock() {
        Ok(buf) => buf.clone(),
        Err(poisoned) => poisoned.into_inner().clone(),
    };
    assert_eq!(recovered_data, "");

    let invocation = test_invocation(
        temp_dir.path(),
        Runner::Codex,
        Model::Gpt53Codex,
        "test prompt",
        Some(Duration::from_secs(1)),
        true,
        None,
    );

    let messages = RunnerErrorMessages {
        log_label: "test",
        interrupted_msg: "interrupted",
        timeout_msg: "timeout occurred",
        terminated_msg: "terminated",
        non_zero_msg: non_zero_message,
        other_msg: other_message,
    };

    let mut backend = MockTimeoutBackend;
    let result = run_prompt_with_handling_backend(invocation, messages, &mut backend);

    assert!(result.is_err());
    let err_msg = format!("{}", result.unwrap_err());
    assert!(err_msg.contains("timeout occurred"), "got: {}", err_msg);
}

fn success_status() -> std::process::ExitStatus {
    std::process::Command::new("sh")
        .arg("-c")
        .arg("exit 0")
        .status()
        .expect("status")
}

struct MockKnownInvalidResumeFallbackBackend {
    run_calls: usize,
    resume_calls: usize,
    resume_error: Option<runner::RunnerError>,
}

impl MockKnownInvalidResumeFallbackBackend {
    fn new(resume_error: runner::RunnerError) -> Self {
        Self {
            run_calls: 0,
            resume_calls: 0,
            resume_error: Some(resume_error),
        }
    }
}

impl RunnerBackend for MockKnownInvalidResumeFallbackBackend {
    fn run_prompt(
        &mut self,
        _request: RunnerBackendRunPrompt<'_>,
    ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
        self.run_calls += 1;
        if self.run_calls == 1 {
            Err(runner::RunnerError::TerminatedBySignal {
                signal: Some(15),
                stdout: RedactedString::from(""),
                stderr: RedactedString::from(""),
                session_id: Some("resume-session".to_string()),
            })
        } else {
            Ok(runner::RunnerOutput {
                status: success_status(),
                stdout: "fresh rerun output".to_string(),
                stderr: String::new(),
                session_id: Some("fresh-session".to_string()),
            })
        }
    }

    fn resume_session(
        &mut self,
        _request: RunnerBackendResumeSession<'_>,
    ) -> anyhow::Result<runner::RunnerOutput, runner::RunnerError> {
        self.resume_calls += 1;
        Err(self
            .resume_error
            .take()
            .expect("resume error should be present"))
    }
}

fn assert_known_invalid_resume_falls_back(
    runner_kind: Runner,
    model: Model,
    resume_error: runner::RunnerError,
) {
    let temp_dir = tempfile::tempdir().expect("tempdir");
    let invocation_session_id = match runner_kind {
        Runner::Opencode => "ses-resume-session",
        _ => "resume-session",
    };
    let invocation = test_invocation(
        temp_dir.path(),
        runner_kind,
        model,
        "resume task",
        None,
        false,
        Some(invocation_session_id.to_string()),
    );

    let messages = RunnerErrorMessages {
        log_label: "known-invalid-resume-fallback",
        interrupted_msg: "interrupted",
        timeout_msg: "timeout",
        terminated_msg: "terminated",
        non_zero_msg: non_zero_message,
        other_msg: other_message,
    };

    let mut backend = MockKnownInvalidResumeFallbackBackend::new(resume_error);
    let output = run_prompt_with_handling_backend(invocation, messages, &mut backend)
        .expect("fallback should rerun fresh");

    assert_eq!(backend.resume_calls, 1, "resume should be attempted once");
    assert_eq!(
        backend.run_calls, 2,
        "fresh rerun should execute after fallback"
    );
    assert_eq!(output.stdout, "fresh rerun output");
    assert_eq!(output.session_id.as_deref(), Some("fresh-session"));
}

#[test]
fn pi_continue_falls_back_to_fresh_run_when_resume_session_lookup_fails() {
    assert_known_invalid_resume_falls_back(
        Runner::Pi,
        Model::Gpt53,
        runner::RunnerError::Other(anyhow::anyhow!("pi session file not found")),
    );
}

#[test]
fn gemini_continue_falls_back_to_fresh_run_on_invalid_resume_session() {
    assert_known_invalid_resume_falls_back(
        Runner::Gemini,
        Model::Gpt53,
        runner::RunnerError::NonZeroExit {
            code: 42,
            stdout: RedactedString::from(""),
            stderr: RedactedString::from(
                "Error resuming session: Invalid session identifier \"does-not-exist\".\nUse --list-sessions to see available sessions.",
            ),
            session_id: Some("does-not-exist".to_string()),
        },
    );
}

#[test]
fn claude_continue_falls_back_to_fresh_run_on_invalid_resume_session() {
    assert_known_invalid_resume_falls_back(
        Runner::Claude,
        Model::Gpt53,
        runner::RunnerError::NonZeroExit {
            code: 1,
            stdout: RedactedString::from(
                r#"{"type":"result","is_error":true,"errors":["--resume requires a valid session ID"]}"#,
            ),
            stderr: RedactedString::from(""),
            session_id: Some("not-a-uuid".to_string()),
        },
    );
}

#[test]
fn opencode_continue_falls_back_to_fresh_run_on_known_session_validation_failure() {
    assert_known_invalid_resume_falls_back(
        Runner::Opencode,
        Model::Gpt53,
        runner::RunnerError::Other(anyhow::anyhow!(
            "semantic failure with zero exit status for opencode resume: ZodError invalid_format sessionID Invalid string: must start with \"ses\""
        )),
    );
}