agents 0.3.0 - Docs.rs

use std::any::TypeId;
use std::collections::HashSet;
use std::collections::VecDeque;
use std::marker::PhantomData;
use std::sync::Arc;

use crate::llm::LlmRunner;
use crate::llm::completion::{
    CompletionRequest, CompletionResponse, InputItem, ModelSelector, OutputContent, OutputItem,
    ResponseMode, TokenLimit, TopK, TopP, UsageMetrics,
};
use crate::llm::response::TypedResponse;
use crate::llm::tools::{ToolCall, TypedTool, TypedToolSet};
use crate::llm::{completion::Temperature, completion::ToolChoice};
use schemars::JsonSchema;
use serde::Deserialize;
use serde::Serialize;
use serde::de::DeserializeOwned;
use tokio::sync::mpsc;

use crate::agent::context::{
    ContextChunk, ContextManager, ContextRole, ContextStrategy, ContextWindow,
};
use crate::agent::error::{AgentError, AgentResult};
use crate::agent::storage::{
    NoopStorageAdapter, StorageAdapter, StorageEvent, StorageInput, StorageRecord,
};
use crate::agent::tools::{
    NoToolRunner, ToolCallEnvelope, ToolExecutionResult, ToolResultEnvelope, ToolRunner,
};

use super::Agent as AgentTrait;

/// Input accepted by an agent session.
#[derive(Debug, Clone)]
pub enum AgentInput<M> {
    /// Standard user input.
    Message(M),
    /// Steering input for an already-running turn.
    Steer(M),
    /// Cancellation request for the active turn.
    Cancel,
}

/// Model execution knobs applied to agent turns.
#[derive(Debug, Clone)]
pub struct ExecutionProfile {
    pub model_selector: ModelSelector,
    pub temperature: Temperature,
    pub top_p: TopP,
    pub top_k: TopK,
    pub token_limit: TokenLimit,
    pub tool_choice: ToolChoice,
}

impl Default for ExecutionProfile {
    fn default() -> Self {
        Self {
            model_selector: ModelSelector::Any,
            temperature: Temperature::ProviderDefault,
            top_p: TopP::ProviderDefault,
            top_k: TopK::ProviderDefault,
            token_limit: TokenLimit::ProviderDefault,
            tool_choice: ToolChoice::ProviderDefault,
        }
    }
}

impl ExecutionProfile {
    /// Returns a profile tuned for reproducible, low-variance outputs.
    pub fn deterministic() -> Self {
        Self {
            temperature: Temperature::Value(0.0),
            ..Self::default()
        }
    }

    /// Returns a profile tuned for more exploratory outputs.
    pub fn volatile() -> Self {
        Self {
            temperature: Temperature::Value(1.0),
            ..Self::default()
        }
    }
}

/// Events emitted while an agent turn is executing.
#[derive(Debug, Clone, Serialize, Deserialize)]
pub enum AgentEvent<C, T, R> {
    /// The full context window materialized for an imminent model request.
    ContextWindowMaterialized { window: ContextWindow },
    /// The provider-neutral request prepared for the next model call.
    RequestPrepared { request: PreparedRequest },
    /// A model output item streamed from the underlying provider.
    ModelOutputItem {
        item: OutputItem<C, R>,
        usage_metrics: UsageMetrics,
    },
    /// A typed tool call requested by the model.
    ToolCallRequested {
        call: ToolCallEnvelope<C>,
        usage_metrics: UsageMetrics,
    },
    /// Completion of a tool execution.
    ToolExecutionCompleted { result: ToolResultEnvelope<T> },
    /// Terminal completion of the turn with the final structured reply.
    Completed {
        reply: R,
        usage_metrics: UsageMetrics,
    },
    /// Terminal cancellation of the turn.
    Cancelled,
}

/// Provider-neutral summary of one prepared completion request.
#[derive(Debug, Clone, Serialize, Deserialize, PartialEq)]
pub struct PreparedRequest {
    pub model: ModelSelector,
    pub input_items: usize,
    pub temperature: Temperature,
    pub top_p: TopP,
    pub top_k: TopK,
    pub token_limit: TokenLimit,
    pub response_mode: ResponseMode,
    pub tool_choice: ToolChoice,
    pub has_tools: bool,
    pub expects_typed_response: bool,
}

/// Sender half for a spawned agent.
pub type AgentRunInput<M> = mpsc::Sender<AgentInput<M>>;
/// Receiver half for a spawned agent.
pub type AgentRunOutput<C, T, R> = mpsc::Receiver<AgentResult<AgentEvent<C, T, R>>>;

const DEFAULT_RUN_CHANNEL_CAPACITY: usize = 64;

/// Builder for [`SessionAgent`].
///
/// The default builder shape is `SessionAgent<String, (), (), String>`.
/// Use `with_message_type`, `with_response_type`, and `with_tool_runner`
/// to move into more strongly typed configurations.
pub struct AgentBuilder<M, C, T, R> {
    llm: Option<Arc<LlmRunner>>,
    context_manager: ContextManager,
    execution_profile: ExecutionProfile,
    run_channel_capacity: usize,
    storage_adapter: Arc<dyn StorageAdapter>,
    tool_runner: Option<Arc<dyn ToolRunner<C, T>>>,
    _message: PhantomData<M>,
    _response: PhantomData<R>,
}

impl AgentBuilder<String, (), (), String> {
    /// Creates a builder for a string-in, string-out session agent.
    pub fn new() -> Self {
        Self {
            llm: None,
            context_manager: ContextManager::new(),
            execution_profile: ExecutionProfile::default(),
            run_channel_capacity: DEFAULT_RUN_CHANNEL_CAPACITY,
            storage_adapter: Arc::new(NoopStorageAdapter),
            tool_runner: Some(Arc::new(NoToolRunner)),
            _message: PhantomData,
            _response: PhantomData,
        }
    }
}

impl Default for AgentBuilder<String, (), (), String> {
    fn default() -> Self {
        Self::new()
    }
}

impl<M, C, T, R> AgentBuilder<M, C, T, R>
where
    M: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    C: TypedTool + Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    T: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    R: Clone + Serialize + DeserializeOwned + JsonSchema + Send + Sync + 'static,
{
    pub fn with_llm_runner(mut self, llm: Arc<LlmRunner>) -> Self {
        self.llm = Some(llm);
        self
    }

    pub fn with_execution_profile(mut self, execution_profile: ExecutionProfile) -> Self {
        self.execution_profile = execution_profile;
        self
    }

    pub fn with_context_manager(mut self, context_manager: ContextManager) -> Self {
        self.context_manager = context_manager;
        self
    }

    pub fn with_run_channel_capacity(mut self, capacity: usize) -> Self {
        self.run_channel_capacity = capacity.max(1);
        self
    }

    pub fn with_storage_adapter<Adapter>(mut self, storage_adapter: Adapter) -> Self
    where
        Adapter: StorageAdapter + 'static,
    {
        self.storage_adapter = Arc::new(storage_adapter);
        self
    }

    pub fn with_storage_adapter_arc(mut self, storage_adapter: Arc<dyn StorageAdapter>) -> Self {
        self.storage_adapter = storage_adapter;
        self
    }

    pub fn with_message_type<M2>(self) -> AgentBuilder<M2, C, T, R> {
        AgentBuilder {
            llm: self.llm,
            context_manager: self.context_manager,
            execution_profile: self.execution_profile,
            run_channel_capacity: self.run_channel_capacity,
            storage_adapter: self.storage_adapter,
            tool_runner: self.tool_runner,
            _message: PhantomData,
            _response: PhantomData,
        }
    }

    pub fn with_response_type<R2>(self) -> AgentBuilder<M, C, T, R2> {
        AgentBuilder {
            llm: self.llm,
            context_manager: self.context_manager,
            execution_profile: self.execution_profile,
            run_channel_capacity: self.run_channel_capacity,
            storage_adapter: self.storage_adapter,
            tool_runner: self.tool_runner,
            _message: PhantomData,
            _response: PhantomData,
        }
    }

    pub fn with_tool_runner<C2, T2, Runner>(self, tool_runner: Runner) -> AgentBuilder<M, C2, T2, R>
    where
        C2: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
        T2: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
        Runner: ToolRunner<C2, T2> + 'static,
    {
        AgentBuilder {
            llm: self.llm,
            context_manager: self.context_manager,
            execution_profile: self.execution_profile,
            run_channel_capacity: self.run_channel_capacity,
            storage_adapter: self.storage_adapter,
            tool_runner: Some(Arc::new(tool_runner)),
            _message: PhantomData,
            _response: PhantomData,
        }
    }

    pub fn build(self) -> AgentResult<SessionAgent<M, C, T, R>>
    where
        M: Into<InputItem>,
    {
        let llm = self.llm.ok_or(AgentError::Internal {
            message: "AgentBuilder requires an llm runner".to_string(),
        })?;
        let tool_runner = self.tool_runner.ok_or(AgentError::Internal {
            message: "AgentBuilder requires a tool runner".to_string(),
        })?;
        let context_manager = self.context_manager;
        context_manager.attach_llm_runner(llm.clone());

        Ok(SessionAgent {
            llm,
            context_manager: Arc::new(context_manager),
            execution_profile: self.execution_profile,
            run_channel_capacity: self.run_channel_capacity,
            storage_adapter: self.storage_adapter,
            tool_runner,
            next_turn: 1,
            next_response: 1,
            active_turn: None,
            queued_turns: VecDeque::new(),
            _message: PhantomData,
            _response: PhantomData,
        })
    }
}

/// Default model-backed implementation of [`super::Agent`].
///
/// `SessionAgent` owns the runner, context manager, execution profile, optional
/// typed tool execution, and the mutable turn/session state required to drive a
/// conversation.
pub struct SessionAgent<M, C, T, R>
where
    M: Clone + Serialize + DeserializeOwned + Into<InputItem> + Send + Sync + 'static,
    C: TypedTool + Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    T: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    R: Clone + Serialize + DeserializeOwned + JsonSchema + Send + Sync + 'static,
{
    llm: Arc<LlmRunner>,
    context_manager: Arc<ContextManager>,
    execution_profile: ExecutionProfile,
    run_channel_capacity: usize,
    storage_adapter: Arc<dyn StorageAdapter>,
    tool_runner: Arc<dyn ToolRunner<C, T>>,
    next_turn: u64,
    next_response: u64,
    active_turn: Option<ActiveTurn<C, T, R>>,
    queued_turns: VecDeque<QueuedTurn>,
    _message: PhantomData<M>,
    _response: PhantomData<R>,
}

struct ActiveTurn<C, T, R> {
    turn: u64,
    profile: ExecutionProfile,
    state: TurnState<C, T, R>,
}

struct QueuedTurn {
    turn: u64,
    profile: ExecutionProfile,
    item: InputItem,
}

enum TurnState<C, T, R> {
    CancelPending,
    NeedLlm,
    DispatchRequest {
        request: CompletionRequest<C, R>,
    },
    ExecuteTool {
        current: ToolCallEnvelope<C>,
        remaining: VecDeque<ToolCallEnvelope<C>>,
        usage_metrics: UsageMetrics,
    },
    EmitQueue {
        queue: VecDeque<AgentEvent<C, T, R>>,
        next: Box<TurnState<C, T, R>>,
    },
    Done,
}

impl<C, T, R> TurnState<C, T, R> {
    fn abandoned_tool_results(&self, reason: &str) -> Vec<ToolResultEnvelope<T>> {
        let mut call_ids = Vec::new();
        let mut seen = HashSet::new();
        self.collect_pending_tool_call_ids(&mut call_ids, &mut seen);
        call_ids
            .into_iter()
            .map(|call_id| ToolResultEnvelope {
                call_id,
                result: ToolExecutionResult::Error {
                    message: reason.to_string(),
                },
            })
            .collect()
    }

    fn collect_pending_tool_call_ids(
        &self,
        call_ids: &mut Vec<String>,
        seen: &mut HashSet<String>,
    ) {
        match self {
            TurnState::ExecuteTool {
                current, remaining, ..
            } => {
                if seen.insert(current.call_id.clone()) {
                    call_ids.push(current.call_id.clone());
                }
                for call in remaining {
                    if seen.insert(call.call_id.clone()) {
                        call_ids.push(call.call_id.clone());
                    }
                }
            }
            TurnState::EmitQueue { queue, next } => {
                for event in queue {
                    if let AgentEvent::ToolCallRequested { call, .. } = event
                        && seen.insert(call.call_id.clone())
                    {
                        call_ids.push(call.call_id.clone());
                    }
                }
                next.collect_pending_tool_call_ids(call_ids, seen);
            }
            TurnState::CancelPending
            | TurnState::NeedLlm
            | TurnState::DispatchRequest { .. }
            | TurnState::Done => {}
        }
    }
}

impl<M, C, T, R> SessionAgent<M, C, T, R>
where
    M: Clone + Serialize + DeserializeOwned + Into<InputItem> + Send + Sync + 'static,
    C: TypedTool + Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    T: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    R: Clone + Serialize + DeserializeOwned + JsonSchema + Send + Sync + 'static,
{
    pub async fn send(&mut self, input: AgentInput<M>) -> AgentResult<()> {
        let profile = self.execution_profile.clone();
        self.send_with_profile(input, profile).await
    }

    pub async fn send_with_profile(
        &mut self,
        input: AgentInput<M>,
        profile: ExecutionProfile,
    ) -> AgentResult<()> {
        match input {
            AgentInput::Cancel => {
                let turn = self
                    .active_turn
                    .as_ref()
                    .map(|active_turn| active_turn.turn);
                self.storage_adapter
                    .record(StorageRecord::InputReceived {
                        turn,
                        input: StorageInput::Cancel,
                    })
                    .await?;
                if let Some(active_turn) = self.active_turn.as_mut() {
                    for result in active_turn.state.abandoned_tool_results("cancelled") {
                        self.context_manager
                            .push(result.to_context_chunk(ContextStrategy::Compactable)?)
                            .await?;
                    }
                    active_turn.state = TurnState::CancelPending;
                }
                Ok(())
            }
            AgentInput::Message(message) => {
                let item = message.into();
                if self.active_turn.is_some() {
                    let turn = self.reserve_turn();
                    self.storage_adapter
                        .record(StorageRecord::InputReceived {
                            turn: Some(turn),
                            input: StorageInput::Message(input_item_to_chunk(
                                item.clone(),
                                ContextStrategy::Compactable,
                            )?),
                        })
                        .await?;
                    self.queue_turn(turn, item, profile).await?;
                } else {
                    let turn = self.reserve_turn();
                    self.storage_adapter
                        .record(StorageRecord::InputReceived {
                            turn: Some(turn),
                            input: StorageInput::Message(input_item_to_chunk(
                                item.clone(),
                                ContextStrategy::Compactable,
                            )?),
                        })
                        .await?;
                    self.start_turn(turn, item, profile).await?;
                }
                Ok(())
            }
            AgentInput::Steer(message) => {
                let item = message.into();
                if self.active_turn.is_some() {
                    if let Some(active_turn) = self.active_turn.as_mut() {
                        self.storage_adapter
                            .record(StorageRecord::InputReceived {
                                turn: Some(active_turn.turn),
                                input: StorageInput::Steer(input_item_to_chunk(
                                    item.clone(),
                                    ContextStrategy::Compactable,
                                )?),
                            })
                            .await?;
                        for result in active_turn
                            .state
                            .abandoned_tool_results("interrupted by steering")
                        {
                            self.context_manager
                                .push(result.to_context_chunk(ContextStrategy::Compactable)?)
                                .await?;
                        }
                        active_turn.state = TurnState::NeedLlm;
                    }
                    self.context_manager
                        .push(input_item_to_chunk(item, ContextStrategy::Compactable)?)
                        .await?;
                } else {
                    let turn = self.reserve_turn();
                    self.storage_adapter
                        .record(StorageRecord::InputReceived {
                            turn: Some(turn),
                            input: StorageInput::Steer(input_item_to_chunk(
                                item.clone(),
                                ContextStrategy::Compactable,
                            )?),
                        })
                        .await?;
                    self.start_turn(turn, item, profile).await?;
                }
                Ok(())
            }
        }
    }

    pub async fn next(&mut self) -> AgentResult<Option<AgentEvent<C, T, R>>> {
        loop {
            if self.active_turn.is_none() {
                if let Some(queued_turn) = self.queued_turns.pop_front() {
                    self.start_turn(queued_turn.turn, queued_turn.item, queued_turn.profile)
                        .await?;
                } else {
                    return Ok(None);
                }
            }

            let Some(mut active_turn) = self.active_turn.take() else {
                return Ok(None);
            };

            let state = std::mem::replace(&mut active_turn.state, TurnState::Done);

            match state {
                TurnState::Done => {
                    continue;
                }
                TurnState::CancelPending => {
                    let event = AgentEvent::Cancelled;
                    self.record_event(active_turn.turn, &event).await?;
                    return Ok(Some(event));
                }
                TurnState::NeedLlm => {
                    let (window, request) = self.build_request(active_turn.profile.clone()).await?;
                    let mut queue = VecDeque::new();
                    if should_emit_context_window(&window) {
                        queue.push_back(AgentEvent::ContextWindowMaterialized { window });
                    }
                    queue.push_back(AgentEvent::RequestPrepared {
                        request: prepared_request_from_completion_request(&request),
                    });
                    active_turn.state = TurnState::EmitQueue {
                        queue,
                        next: Box::new(TurnState::DispatchRequest { request }),
                    };
                    self.active_turn = Some(active_turn);
                }
                TurnState::DispatchRequest { request } => {
                    let response = self.llm.chat::<C, R>(request).await?;
                    active_turn.state = self.turn_state_from_response(response).await?;
                    self.active_turn = Some(active_turn);
                }
                TurnState::ExecuteTool {
                    current,
                    mut remaining,
                    usage_metrics,
                } => {
                    let result = self.tool_runner.run(current).await?;
                    self.context_manager
                        .push(result.to_context_chunk(ContextStrategy::Compactable)?)
                        .await?;

                    active_turn.state = if let Some(next_call) = remaining.pop_front() {
                        TurnState::EmitQueue {
                            queue: VecDeque::from([AgentEvent::ToolCallRequested {
                                call: next_call.clone(),
                                usage_metrics: usage_metrics.clone(),
                            }]),
                            next: Box::new(TurnState::ExecuteTool {
                                current: next_call,
                                remaining,
                                usage_metrics,
                            }),
                        }
                    } else {
                        TurnState::NeedLlm
                    };

                    self.active_turn = Some(active_turn);
                    let event = AgentEvent::ToolExecutionCompleted { result };
                    let turn = self.active_turn.as_ref().expect("active turn").turn;
                    self.record_event(turn, &event).await?;
                    return Ok(Some(event));
                }
                TurnState::EmitQueue { mut queue, next } => {
                    if let Some(event) = queue.pop_front() {
                        active_turn.state = if queue.is_empty() {
                            *next
                        } else {
                            TurnState::EmitQueue { queue, next }
                        };
                        self.active_turn = Some(active_turn);
                        let turn = self.active_turn.as_ref().expect("active turn").turn;
                        self.record_event(turn, &event).await?;
                        return Ok(Some(event));
                    }

                    active_turn.state = *next;
                    self.active_turn = Some(active_turn);
                }
            }
        }
    }

    #[cfg(not(target_arch = "wasm32"))]
    pub async fn spawn(mut self) -> AgentResult<(AgentRunInput<M>, AgentRunOutput<C, T, R>)> {
        let (input_tx, mut input_rx) = mpsc::channel(self.run_channel_capacity);
        let (event_tx, event_rx) = mpsc::channel(self.run_channel_capacity);

        tokio::spawn(async move {
            let mut input_closed = false;

            loop {
                while let Ok(input) = input_rx.try_recv() {
                    if let Err(error) = self.send(input).await
                        && event_tx.send(Err(error)).await.is_err()
                    {
                        return;
                    }
                }

                match self.next().await {
                    Ok(Some(event)) => {
                        if event_tx.send(Ok(event)).await.is_err() {
                            return;
                        }

                        if !input_closed {
                            tokio::select! {
                                biased;
                                maybe_input = input_rx.recv() => {
                                    match maybe_input {
                                        Some(input) => {
                                            if let Err(error) = self.send(input).await
                                                && event_tx.send(Err(error)).await.is_err()
                                            {
                                                return;
                                            }
                                        }
                                        None => {
                                            input_closed = true;
                                        }
                                    }
                                }
                                _ = tokio::task::yield_now() => {}
                            }
                        }
                    }
                    Ok(None) => {
                        if input_closed {
                            return;
                        }

                        match input_rx.recv().await {
                            Some(input) => {
                                if let Err(error) = self.send(input).await
                                    && event_tx.send(Err(error)).await.is_err()
                                {
                                    return;
                                }
                            }
                            None => {
                                input_closed = true;
                            }
                        }
                    }
                    Err(error) => {
                        if event_tx.send(Err(error)).await.is_err() {
                            return;
                        }
                    }
                }
            }
        });

        Ok((input_tx, event_rx))
    }

    #[cfg(target_arch = "wasm32")]
    pub async fn spawn(self) -> AgentResult<(AgentRunInput<M>, AgentRunOutput<C, T, R>)> {
        Err(AgentError::Internal {
            message: "SessionAgent::spawn is not supported on wasm32".to_string(),
        })
    }

    pub async fn transcript(&self) -> AgentResult<Vec<InputItem>> {
        ContextWindow::new(self.context_manager.history().await?).to_input_items()
    }

    pub fn active_turn(&self) -> Option<u64> {
        self.active_turn.as_ref().map(|turn| turn.turn)
    }

    pub fn queued_turn_count(&self) -> usize {
        self.queued_turns.len()
    }

    async fn turn_state_from_response(
        &mut self,
        response: CompletionResponse<C, R>,
    ) -> AgentResult<TurnState<C, T, R>> {
        let usage_metrics = UsageMetrics {
            response_id: self.reserve_response(),
            provider: response.provider,
            model: response.model.clone(),
            finish_reason: response.finish_reason.clone(),
            usage: response.usage.clone(),
        };
        let non_tool_items = response
            .output
            .iter()
            .filter(|item| !matches!(item, OutputItem::ToolCall { .. }))
            .cloned()
            .map(|item| AgentEvent::ModelOutputItem {
                item,
                usage_metrics: usage_metrics.clone(),
            })
            .collect::<Vec<_>>();

        let tool_calls = extract_tool_calls(&response)
            .into_iter()
            .map(|call| ToolCallEnvelope {
                call_id: call.id,
                name: call.name,
                arguments: call.arguments,
                call: call.tool,
            })
            .collect::<VecDeque<_>>();

        for call in &tool_calls {
            self.context_manager
                .push(call.to_context_chunk(ContextStrategy::Compactable))
                .await?;
        }

        if let Some(current) = tool_calls.front().cloned() {
            let mut queue = VecDeque::from(non_tool_items);
            queue.push_back(AgentEvent::ToolCallRequested {
                call: current.clone(),
                usage_metrics: usage_metrics.clone(),
            });

            let mut remaining = tool_calls;
            let _ = remaining.pop_front();

            return Ok(TurnState::EmitQueue {
                queue,
                next: Box::new(TurnState::ExecuteTool {
                    current,
                    remaining,
                    usage_metrics: usage_metrics.clone(),
                }),
            });
        }

        let reply = self.extract_reply(&response)?;
        self.context_manager
            .push(reply_to_chunk(&reply, ContextStrategy::Compactable)?)
            .await?;

        let mut queue = VecDeque::from(non_tool_items);
        queue.push_back(AgentEvent::Completed {
            reply,
            usage_metrics,
        });

        Ok(TurnState::EmitQueue {
            queue,
            next: Box::new(TurnState::Done),
        })
    }

    async fn start_turn(
        &mut self,
        turn: u64,
        item: InputItem,
        profile: ExecutionProfile,
    ) -> AgentResult<()> {
        self.context_manager
            .push(input_item_to_chunk(item, ContextStrategy::Compactable)?)
            .await?;
        self.storage_adapter
            .record(StorageRecord::TurnStarted { turn })
            .await?;
        self.active_turn = Some(ActiveTurn {
            turn,
            profile,
            state: TurnState::NeedLlm,
        });
        Ok(())
    }

    async fn queue_turn(
        &mut self,
        turn: u64,
        item: InputItem,
        profile: ExecutionProfile,
    ) -> AgentResult<()> {
        self.storage_adapter
            .record(StorageRecord::TurnQueued { turn })
            .await?;
        self.queued_turns.push_back(QueuedTurn {
            turn,
            profile,
            item,
        });
        Ok(())
    }

    fn reserve_turn(&mut self) -> u64 {
        let turn = self.next_turn;
        self.next_turn += 1;
        turn
    }

    fn reserve_response(&mut self) -> u64 {
        let response = self.next_response;
        self.next_response += 1;
        response
    }

    async fn build_request(
        &self,
        profile: ExecutionProfile,
    ) -> AgentResult<(ContextWindow, CompletionRequest<C, R>)> {
        let window = self.context_manager.window().await?;
        let mut request = CompletionRequest::new(window.to_input_items()?, profile.model_selector)
            .with_token_limit(profile.token_limit)
            .with_tool_choice(profile.tool_choice)
            .with_response_mode(ResponseMode::Buffered);

        if let Temperature::Value(value) = profile.temperature {
            request = request.with_temperature(value);
        }

        if let TopP::Value(value) = profile.top_p {
            request = request.with_top_p(value);
        }

        if let TopK::Value(value) = profile.top_k {
            request = request.with_top_k(value);
        }

        if TypeId::of::<C>() != TypeId::of::<()>() {
            request = request.with_tools(TypedToolSet::new());
        }

        if TypeId::of::<R>() != TypeId::of::<String>() {
            request = request.with_typed_response(TypedResponse::new("agent_response"));
        }

        Ok((window, request))
    }

    fn extract_reply(&self, response: &CompletionResponse<C, R>) -> AgentResult<R> {
        for item in &response.output {
            match item {
                OutputItem::Message { content, .. } => {
                    for content in content {
                        match content {
                            OutputContent::Structured { value } => return Ok(value.clone()),
                            OutputContent::Text { text }
                                if TypeId::of::<R>() == TypeId::of::<String>() =>
                            {
                                let boxed: Box<dyn std::any::Any> = Box::new(text.clone());
                                return boxed.downcast::<R>().map(|value| *value).map_err(|_| {
                                    AgentError::Internal {
                                        message: "failed to downcast string response".to_string(),
                                    }
                                });
                            }
                            OutputContent::Text { .. } => {}
                        }
                    }
                }
                OutputItem::ToolCall { .. } | OutputItem::Reasoning { .. } => {}
            }
        }

        Err(AgentError::InvalidResponse {
            reason: "model returned no assistant reply matching expected response type".to_string(),
        })
    }

    async fn record_event(&self, turn: u64, event: &AgentEvent<C, T, R>) -> AgentResult<()> {
        self.storage_adapter
            .record(StorageRecord::EventEmitted {
                turn,
                event: storage_event_from_agent_event(event)?,
            })
            .await
    }
}

impl SessionAgent<String, (), (), String> {
    pub fn builder() -> AgentBuilder<String, (), (), String> {
        AgentBuilder::new()
    }
}

impl SessionAgent<InputItem, (), (), String> {
    pub fn raw_builder() -> AgentBuilder<InputItem, (), (), String> {
        AgentBuilder::with_message_type(AgentBuilder::<String, (), (), String>::new())
    }
}

impl<M, C, T, R> AgentTrait for SessionAgent<M, C, T, R>
where
    M: Clone + Serialize + DeserializeOwned + Into<InputItem> + Send + Sync + 'static,
    C: TypedTool + Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    T: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
    R: Clone + Serialize + DeserializeOwned + JsonSchema + Send + Sync + 'static,
{
    type Input = M;
    type ToolCall = C;
    type ToolResult = T;
    type Output = R;

    async fn send(&mut self, input: AgentInput<Self::Input>) -> AgentResult<()> {
        SessionAgent::send(self, input).await
    }

    async fn next(
        &mut self,
    ) -> AgentResult<Option<AgentEvent<Self::ToolCall, Self::ToolResult, Self::Output>>> {
        SessionAgent::next(self).await
    }

    async fn spawn(
        self,
    ) -> AgentResult<(
        AgentRunInput<Self::Input>,
        AgentRunOutput<Self::ToolCall, Self::ToolResult, Self::Output>,
    )> {
        SessionAgent::spawn(self).await
    }
}

fn extract_tool_calls<C, R>(response: &CompletionResponse<C, R>) -> Vec<ToolCall<C>>
where
    C: Clone,
{
    response
        .output
        .iter()
        .filter_map(|item| match item {
            OutputItem::ToolCall { call } => Some(call.clone()),
            OutputItem::Message { .. } | OutputItem::Reasoning { .. } => None,
        })
        .collect()
}

fn assistant_item_for_reply<R>(reply: &R) -> AgentResult<InputItem>
where
    R: Serialize + 'static,
{
    if TypeId::of::<R>() == TypeId::of::<String>() {
        let value = serde_json::to_value(reply).map_err(|error| AgentError::Internal {
            message: error.to_string(),
        })?;
        let text = value.as_str().ok_or(AgentError::Internal {
            message: "string reply did not serialize as string".to_string(),
        })?;
        return Ok(InputItem::assistant_text(text));
    }

    let text = serde_json::to_string(reply).map_err(|error| AgentError::Internal {
        message: error.to_string(),
    })?;
    Ok(InputItem::assistant_text(text))
}

fn input_item_to_chunk(item: InputItem, strategy: ContextStrategy) -> AgentResult<ContextChunk> {
    ContextChunk::from_input_item(strategy, item).unwrap_or_else(|| {
        Err(AgentError::InvalidInput {
            reason: "unable to convert input item into context chunk".to_string(),
        })
    })
}

fn storage_event_from_agent_event<C, T, R>(event: &AgentEvent<C, T, R>) -> AgentResult<StorageEvent>
where
    C: Serialize,
    T: Serialize,
    R: Serialize,
{
    match event {
        AgentEvent::ContextWindowMaterialized { window } => {
            Ok(StorageEvent::ContextWindowMaterialized {
                chunks: window.chunks.clone(),
            })
        }
        AgentEvent::RequestPrepared { request } => Ok(StorageEvent::RequestPrepared {
            request: serde_json::to_value(request).map_err(|error| AgentError::Internal {
                message: error.to_string(),
            })?,
        }),
        AgentEvent::ModelOutputItem { item, .. } => Ok(StorageEvent::ModelOutputItem {
            item: serde_json::to_value(item).map_err(|error| AgentError::Internal {
                message: error.to_string(),
            })?,
        }),
        AgentEvent::ToolCallRequested { call, .. } => Ok(StorageEvent::ToolCallRequested {
            call_id: call.call_id.clone(),
            name: call.name.clone(),
            args: serde_json::to_value(&call.call).map_err(|error| AgentError::Internal {
                message: error.to_string(),
            })?,
        }),
        AgentEvent::ToolExecutionCompleted { result } => Ok(StorageEvent::ToolExecutionCompleted {
            call_id: result.call_id.clone(),
            result: serde_json::to_value(result).map_err(|error| AgentError::Internal {
                message: error.to_string(),
            })?,
        }),
        AgentEvent::Completed { reply, .. } => Ok(StorageEvent::Completed {
            reply: serde_json::to_value(reply).map_err(|error| AgentError::Internal {
                message: error.to_string(),
            })?,
        }),
        AgentEvent::Cancelled => Ok(StorageEvent::Cancelled),
    }
}

fn prepared_request_from_completion_request<C, R>(
    request: &CompletionRequest<C, R>,
) -> PreparedRequest {
    PreparedRequest {
        model: request.model.clone(),
        input_items: request.input.len(),
        temperature: request.temperature,
        top_p: request.top_p,
        top_k: request.top_k,
        token_limit: request.token_limit,
        response_mode: request.response_mode,
        tool_choice: request.tool_choice.clone(),
        has_tools: request.tools.is_some(),
        expects_typed_response: request.response_format.is_some(),
    }
}

fn reply_to_chunk<R>(reply: &R, strategy: ContextStrategy) -> AgentResult<ContextChunk>
where
    R: Serialize + 'static,
{
    input_item_to_chunk(assistant_item_for_reply(reply)?, strategy)
}

fn should_emit_context_window(window: &ContextWindow) -> bool {
    window.chunks.iter().any(|chunk| {
        matches!(
            chunk,
            ContextChunk::Message {
                role: ContextRole::System,
                ..
            }
        )
    })
}

#[cfg(test)]
mod tests {
    use super::*;
    use crate::llm::capability::Capability;
    use crate::llm::completion::{
        FinishReason, ProviderType, RawCompletionRequest, RawCompletionResponse, RawInputItem,
        RawOutputContent, RawOutputItem, Role,
    };
    use crate::llm::error::{Error as LlmError, LlmResult};
    use crate::llm::model::Model;
    use crate::llm::provider::LlmProvider;
    use crate::llm::tools::{RawToolCall, RawToolDefinition};
    use crate::llm::transcription::{AudioTranscriptionRequest, AudioTranscriptionResponse};
    use async_trait::async_trait;
    use serde::{Deserialize, Serialize};
    use std::collections::VecDeque;

    use crate::agent::context::{ContextManager, ContextStrategy, StaticContextProvider};
    use crate::agent::storage::{
        InMemoryStorageAdapter, StorageEvent, StorageInput, StorageRecord,
    };
    use crate::agent::tools::{CallbackToolRunner, ToolExecutionResult};

    type Agent<M, C, T, R> = SessionAgent<M, C, T, R>;

    #[derive(Debug, Clone, Serialize, Deserialize, JsonSchema, PartialEq, Eq)]
    struct EchoResponse {
        value: String,
    }

    #[derive(Debug, Clone, Serialize, Deserialize, JsonSchema, PartialEq, Eq)]
    enum TestTools {
        Ping { value: String },
    }

    #[derive(Debug, Clone, Serialize, Deserialize, JsonSchema, PartialEq, Eq)]
    enum UnitTools {
        ListEvents,
    }

    impl TypedTool for TestTools {
        fn tool_definitions() -> Vec<RawToolDefinition> {
            vec![RawToolDefinition::function(
                "ping",
                Some("Ping tool"),
                serde_json::json!({
                    "type": "object",
                    "properties": {
                        "value": { "type": "string" }
                    },
                    "required": ["value"]
                }),
            )]
        }

        fn decode_tool_call(name: &str, arguments: serde_json::Value) -> LlmResult<Self> {
            match name {
                "ping" => {
                    #[derive(Deserialize)]
                    struct PingArgs {
                        value: String,
                    }

                    let args: PingArgs = serde_json::from_value(arguments)
                        .map_err(|error| LlmError::parse("tool arguments", error))?;
                    Ok(TestTools::Ping { value: args.value })
                }
                other => Err(LlmError::InvalidResponse {
                    reason: format!("unknown tool {other}"),
                }),
            }
        }
    }

    impl TypedTool for UnitTools {
        fn tool_definitions() -> Vec<RawToolDefinition> {
            vec![RawToolDefinition::function(
                "list_events",
                Some("List events"),
                serde_json::json!({
                    "type": "object",
                    "properties": {},
                    "additionalProperties": false
                }),
            )]
        }

        fn decode_tool_call(name: &str, arguments: serde_json::Value) -> LlmResult<Self> {
            match name {
                "list_events" => {
                    let _args: std::collections::HashMap<String, serde_json::Value> =
                        serde_json::from_value(arguments)
                            .map_err(|error| LlmError::parse("tool arguments", error))?;
                    Ok(UnitTools::ListEvents)
                }
                other => Err(LlmError::InvalidResponse {
                    reason: format!("unknown tool {other}"),
                }),
            }
        }
    }

    #[derive(Debug, Clone, Serialize, Deserialize, PartialEq, Eq)]
    struct Pong {
        value: String,
    }

    struct FakeProvider {
        responses: std::sync::Mutex<VecDeque<LlmResult<RawCompletionResponse>>>,
        requests: std::sync::Mutex<Vec<RawCompletionRequest>>,
    }

    impl FakeProvider {
        fn with_responses(responses: Vec<LlmResult<RawCompletionResponse>>) -> Self {
            Self {
                responses: std::sync::Mutex::new(VecDeque::from(responses)),
                requests: std::sync::Mutex::new(Vec::new()),
            }
        }

        fn take_requests(&self) -> Vec<RawCompletionRequest> {
            self.requests.lock().expect("requests").clone()
        }
    }

    #[cfg_attr(target_arch = "wasm32", async_trait(?Send))]
    #[cfg_attr(not(target_arch = "wasm32"), async_trait)]
    impl LlmProvider for FakeProvider {
        fn provider_type(&self) -> ProviderType {
            ProviderType::OpenAI
        }

        fn provider_name(&self) -> &'static str {
            "fake"
        }

        fn capabilities(&self) -> &[Capability] {
            &[]
        }

        async fn available_models(&self) -> LlmResult<Vec<Model>> {
            Ok(Vec::new())
        }

        async fn chat_raw(&self, req: RawCompletionRequest) -> LlmResult<RawCompletionResponse> {
            self.requests.lock().expect("requests").push(req);
            self.responses
                .lock()
                .expect("responses")
                .pop_front()
                .unwrap_or_else(|| {
                    Err(LlmError::Internal {
                        message: "no fake response queued".to_string(),
                    })
                })
        }

        async fn transcribe(
            &self,
            _req: AudioTranscriptionRequest,
        ) -> LlmResult<AudioTranscriptionResponse> {
            Err(LlmError::InvalidRequest {
                reason: "unsupported".to_string(),
            })
        }
    }

    fn assistant_text_response(text: &str) -> RawCompletionResponse {
        RawCompletionResponse {
            provider: ProviderType::OpenAI,
            model: "test-model".to_string(),
            output: vec![RawOutputItem::Message {
                role: Role::Assistant,
                content: vec![RawOutputContent::Text {
                    text: text.to_string(),
                }],
            }],
            usage: crate::llm::completion::Usage {
                prompt_tokens: 1,
                completion_tokens: 1,
                total_tokens: 2,
            },
            finish_reason: FinishReason::Stop,
        }
    }

    fn assistant_json_response(value: serde_json::Value) -> RawCompletionResponse {
        RawCompletionResponse {
            provider: ProviderType::OpenAI,
            model: "test-model".to_string(),
            output: vec![RawOutputItem::Message {
                role: Role::Assistant,
                content: vec![RawOutputContent::Json { value }],
            }],
            usage: crate::llm::completion::Usage {
                prompt_tokens: 1,
                completion_tokens: 1,
                total_tokens: 2,
            },
            finish_reason: FinishReason::Stop,
        }
    }

    fn tool_call_response() -> RawCompletionResponse {
        RawCompletionResponse {
            provider: ProviderType::OpenAI,
            model: "test-model".to_string(),
            output: vec![RawOutputItem::ToolCall {
                call: RawToolCall {
                    id: "call_ping_1".to_string(),
                    name: "ping".to_string(),
                    arguments: serde_json::json!({ "value": "hello-tool" }),
                },
            }],
            usage: crate::llm::completion::Usage {
                prompt_tokens: 1,
                completion_tokens: 1,
                total_tokens: 2,
            },
            finish_reason: FinishReason::ToolCalls,
        }
    }

    fn unit_tool_call_response() -> RawCompletionResponse {
        RawCompletionResponse {
            provider: ProviderType::OpenAI,
            model: "test-model".to_string(),
            output: vec![RawOutputItem::ToolCall {
                call: RawToolCall {
                    id: "call_list_events_1".to_string(),
                    name: "list_events".to_string(),
                    arguments: serde_json::json!({}),
                },
            }],
            usage: crate::llm::completion::Usage {
                prompt_tokens: 1,
                completion_tokens: 1,
                total_tokens: 2,
            },
            finish_reason: FinishReason::ToolCalls,
        }
    }

    fn provider_error() -> LlmError {
        LlmError::Provider {
            provider: "openrouter".to_string(),
            status: 503,
            message: "temporarily unavailable".to_string(),
        }
    }

    fn ping_tool_runner() -> CallbackToolRunner<TestTools, Pong> {
        CallbackToolRunner::new(|call| async move {
            match call.call {
                TestTools::Ping { value } => Ok(ToolResultEnvelope {
                    call_id: call.call_id,
                    result: ToolExecutionResult::Ok {
                        data: Pong {
                            value: format!("pong:{value}"),
                        },
                    },
                }),
            }
        })
    }

    fn unit_tool_runner() -> CallbackToolRunner<UnitTools, serde_json::Value> {
        CallbackToolRunner::new(|call| async move {
            match call.call {
                UnitTools::ListEvents => Ok(ToolResultEnvelope {
                    call_id: call.call_id,
                    result: ToolExecutionResult::Ok {
                        data: serde_json::json!({ "events": [] }),
                    },
                }),
            }
        })
    }

    async fn next_non_request<M, C, T, R>(
        agent: &mut SessionAgent<M, C, T, R>,
    ) -> AgentResult<Option<AgentEvent<C, T, R>>>
    where
        M: Clone + Serialize + DeserializeOwned + Into<InputItem> + Send + Sync + 'static,
        C: TypedTool + Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
        T: Clone + Serialize + DeserializeOwned + Send + Sync + 'static,
        R: Clone + Serialize + DeserializeOwned + JsonSchema + Send + Sync + 'static,
    {
        loop {
            match agent.next().await? {
                Some(AgentEvent::RequestPrepared { .. }) => continue,
                other => return Ok(other),
            }
        }
    }

    async fn recv_non_request<C, T, R>(
        rx: &mut AgentRunOutput<C, T, R>,
    ) -> Option<AgentResult<AgentEvent<C, T, R>>> {
        while let Some(event) = rx.recv().await {
            match event {
                Ok(AgentEvent::RequestPrepared { .. }) => continue,
                other => return Some(other),
            }
        }
        None
    }

    #[tokio::test]
    async fn builder_errors_without_llm_runner() {
        let result = Agent::raw_builder().build();
        assert!(matches!(result, Err(AgentError::Internal { .. })));
    }

    #[tokio::test]
    async fn send_records_string_input_and_reply_in_transcript() {
        let mut agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(
                        assistant_text_response("hello back"),
                    )]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        assert!(matches!(
            agent.next().await.expect("request"),
            Some(AgentEvent::RequestPrepared { request })
                if request.input_items == 1
                    && !request.has_tools
                    && !request.expects_typed_response
        ));
        assert!(matches!(
            agent.next().await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            agent.next().await.expect("next"),
            Some(AgentEvent::Completed { reply, .. }) if reply == "hello back"
        ));
        assert!(agent.next().await.expect("done").is_none());
        assert_eq!(agent.transcript().await.expect("transcript").len(), 2);
    }

    #[tokio::test]
    async fn static_context_provider_is_included_in_llm_request() {
        let provider = Arc::new(FakeProvider::with_responses(vec![Ok(
            assistant_text_response("hello back"),
        )]));

        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();

        let mut agent = Agent::raw_builder()
            .with_context_manager(
                ContextManager::builder()
                    .add_provider(StaticContextProvider::system_text("You are a test agent."))
                    .build(),
            )
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        assert!(matches!(
            agent.next().await.expect("context window"),
            Some(AgentEvent::ContextWindowMaterialized { window })
                if matches!(
                    window.chunks.first(),
                    Some(ContextChunk::Message { role: ContextRole::System, content, .. })
                        if content == "You are a test agent."
                )
        ));
        assert!(matches!(
            agent.next().await.expect("request"),
            Some(AgentEvent::RequestPrepared { request })
                if request.input_items == 2
                    && !request.has_tools
                    && !request.expects_typed_response
        ));
        let _ = agent.next().await.expect("model output");
        let _ = agent.next().await.expect("completed");

        let requests = provider.take_requests();
        assert_eq!(requests.len(), 1);
        assert!(matches!(
            requests[0].input.first(),
            Some(RawInputItem::Message { role: Role::System, content })
                if matches!(content.first(), Some(crate::llm::completion::RawInputContent::Text { text }) if text == "You are a test agent.")
        ));
    }

    #[tokio::test]
    async fn storage_adapter_records_materialized_context_windows() {
        let storage = InMemoryStorageAdapter::shared();
        let mut agent = Agent::raw_builder()
            .with_storage_adapter_arc(storage.clone())
            .with_context_manager(
                ContextManager::builder()
                    .add_provider(StaticContextProvider::system_text("system prompt"))
                    .build(),
            )
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(
                        assistant_text_response("stored hello"),
                    )]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        let _ = agent.next().await.expect("context");
        let _ = agent.next().await.expect("request");
        let _ = agent.next().await.expect("model output");
        let _ = agent.next().await.expect("completed");

        let records = storage.records();
        assert!(records.iter().any(|record| matches!(
            record,
            StorageRecord::EventEmitted {
                turn: 1,
                event: StorageEvent::RequestPrepared { request }
            } if request
                .get("input_items")
                .and_then(serde_json::Value::as_u64)
                == Some(2)
        )));
        assert!(records.iter().any(|record| matches!(
            record,
            StorageRecord::EventEmitted {
                turn: 1,
                event: StorageEvent::ContextWindowMaterialized { chunks }
            } if matches!(
                chunks.first(),
                Some(ContextChunk::Message { role: ContextRole::System, content, .. })
                    if content == "system prompt"
            )
        )));
    }

    #[tokio::test]
    async fn send_decodes_typed_response() {
        let mut agent = Agent::raw_builder()
            .with_response_type::<EchoResponse>()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(
                        assistant_json_response(serde_json::json!({ "value": "typed-ok" })),
                    )]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Completed {
                reply: EchoResponse { value },
                ..
            }) if value == "typed-ok"
        ));
        assert!(next_non_request(&mut agent).await.expect("done").is_none());
    }

    #[tokio::test]
    async fn send_executes_tool_calls_and_continues_to_final_reply() {
        let provider = Arc::new(FakeProvider::with_responses(vec![
            Ok(tool_call_response()),
            Ok(assistant_text_response("all done")),
        ]));

        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let mut agent = Agent::raw_builder()
            .with_tool_runner(ping_tool_runner())
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("ping please")))
            .await
            .expect("turn");

        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ToolCallRequested { call, .. }) if call.call_id == "call_ping_1"
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ToolExecutionCompleted { result }) if result.call_id == "call_ping_1"
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Completed { reply, .. }) if reply == "all done"
        ));
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let requests = provider.take_requests();
        assert_eq!(requests.len(), 2);
        assert!(matches!(
            requests[1].input.last(),
            Some(RawInputItem::ToolResult { tool_use_id, content })
                if tool_use_id == "call_ping_1" && content.contains("pong:hello-tool")
        ));
    }

    #[tokio::test]
    async fn send_records_tool_errors_as_tool_results() {
        let provider = Arc::new(FakeProvider::with_responses(vec![
            Ok(tool_call_response()),
            Ok(assistant_text_response("tool error observed")),
        ]));

        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let failing_runner =
            CallbackToolRunner::new(|call: ToolCallEnvelope<TestTools>| async move {
                Ok(ToolResultEnvelope::<Pong> {
                    call_id: call.call_id,
                    result: ToolExecutionResult::Error {
                        message: "ping failed".to_string(),
                    },
                })
            });

        let mut agent = Agent::raw_builder()
            .with_tool_runner(failing_runner)
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("ping please")))
            .await
            .expect("turn");
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ToolCallRequested { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ToolExecutionCompleted { result })
                if matches!(result.result, ToolExecutionResult::Error { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Completed { reply, .. }) if reply == "tool error observed"
        ));
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let requests = provider.take_requests();
        assert!(matches!(
            requests[1].input.last(),
            Some(RawInputItem::ToolResult { content, .. }) if content.contains("ping failed")
        ));
    }

    #[tokio::test]
    async fn send_replays_original_tool_arguments_for_unit_variants() {
        let provider = Arc::new(FakeProvider::with_responses(vec![
            Ok(unit_tool_call_response()),
            Ok(assistant_text_response("listed")),
        ]));

        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let mut agent = Agent::raw_builder()
            .with_tool_runner(unit_tool_runner())
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("list events")))
            .await
            .expect("turn");

        let _ = next_non_request(&mut agent).await.expect("tool call");
        let _ = next_non_request(&mut agent).await.expect("tool result");
        let _ = next_non_request(&mut agent).await.expect("model output");
        let _ = next_non_request(&mut agent).await.expect("completed");

        let requests = provider.take_requests();
        assert_eq!(requests.len(), 2);
        let replayed_tool_call = requests[1]
            .input
            .iter()
            .find_map(|item| match item {
                RawInputItem::ToolCall { call } => Some(call),
                RawInputItem::Message { .. } | RawInputItem::ToolResult { .. } => None,
            })
            .expect("replayed tool call");
        assert_eq!(replayed_tool_call.name, "list_events");
        assert_eq!(replayed_tool_call.arguments, serde_json::json!({}));
    }

    #[tokio::test]
    async fn run_streams_text_turn_events() {
        let agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(
                        assistant_text_response("hello from run"),
                    )]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        let (tx, mut rx) = agent.spawn().await.expect("spawn");
        tx.send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("send input");
        drop(tx);

        assert!(matches!(
            recv_non_request(&mut rx).await.expect("model item"),
            Ok(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            recv_non_request(&mut rx).await.expect("completed"),
            Ok(AgentEvent::Completed { reply, .. }) if reply == "hello from run"
        ));
        assert!(recv_non_request(&mut rx).await.is_none());
    }

    #[tokio::test]
    async fn run_streams_tool_sequence() {
        let agent = Agent::raw_builder()
            .with_tool_runner(ping_tool_runner())
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![
                        Ok(tool_call_response()),
                        Ok(assistant_text_response("done after tool")),
                    ]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        let (tx, mut rx) = agent.spawn().await.expect("spawn");
        tx.send(AgentInput::Message(InputItem::user_text("ping please")))
            .await
            .expect("send input");
        drop(tx);

        assert!(matches!(
            recv_non_request(&mut rx).await.expect("tool call"),
            Ok(AgentEvent::ToolCallRequested { call, .. }) if call.call_id == "call_ping_1"
        ));
        assert!(matches!(
            recv_non_request(&mut rx).await.expect("tool result"),
            Ok(AgentEvent::ToolExecutionCompleted { result }) if result.call_id == "call_ping_1"
        ));
        assert!(matches!(
            recv_non_request(&mut rx).await.expect("model item"),
            Ok(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            recv_non_request(&mut rx).await.expect("completed"),
            Ok(AgentEvent::Completed { reply, .. }) if reply == "done after tool"
        ));
        assert!(recv_non_request(&mut rx).await.is_none());
    }

    #[tokio::test]
    async fn run_processes_multiple_inputs_in_order() {
        let agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![
                        Ok(assistant_text_response("first")),
                        Ok(assistant_text_response("second")),
                    ]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        let (tx, mut rx) = agent.spawn().await.expect("spawn");
        tx.send(AgentInput::Message(InputItem::user_text("one")))
            .await
            .expect("first input");
        tx.send(AgentInput::Message(InputItem::user_text("two")))
            .await
            .expect("second input");
        drop(tx);

        assert!(matches!(
            recv_non_request(&mut rx).await.expect("first model item"),
            Ok(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            recv_non_request(&mut rx).await.expect("first completed"),
            Ok(AgentEvent::Completed { reply, .. }) if reply == "first"
        ));
        assert!(matches!(
            recv_non_request(&mut rx).await.expect("second model item"),
            Ok(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            recv_non_request(&mut rx).await.expect("second completed"),
            Ok(AgentEvent::Completed { reply, .. }) if reply == "second"
        ));
        assert!(recv_non_request(&mut rx).await.is_none());
    }

    #[tokio::test]
    async fn storage_adapter_records_started_turn_inputs_and_events() {
        let storage = InMemoryStorageAdapter::shared();
        let mut agent = Agent::raw_builder()
            .with_storage_adapter_arc(storage.clone())
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(
                        assistant_text_response("stored hello"),
                    )]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        let _ = next_non_request(&mut agent).await.expect("model item");
        let _ = next_non_request(&mut agent).await.expect("completed");

        let records = storage.records();
        assert!(matches!(
            &records[0],
            StorageRecord::InputReceived {
                turn: Some(1),
                input: StorageInput::Message(ContextChunk::Message {
                    strategy: ContextStrategy::Compactable,
                    role: crate::agent::context::ContextRole::User,
                    content,
                }),
            } if content == "hello"
        ));
        assert!(matches!(
            &records[1],
            StorageRecord::TurnStarted { turn: 1 }
        ));
        assert!(matches!(
            &records[2],
            StorageRecord::EventEmitted {
                turn: 1,
                event: StorageEvent::RequestPrepared { .. }
            }
        ));
        assert!(matches!(
            &records[3],
            StorageRecord::EventEmitted {
                turn: 1,
                event: StorageEvent::ModelOutputItem { .. }
            }
        ));
        assert!(matches!(
            &records[4],
            StorageRecord::EventEmitted {
                turn: 1,
                event: StorageEvent::Completed { reply }
            } if reply == "stored hello"
        ));
    }

    #[tokio::test]
    async fn storage_adapter_records_queued_turns_and_activation() {
        let storage = InMemoryStorageAdapter::shared();
        let agent = Agent::raw_builder()
            .with_storage_adapter_arc(storage.clone())
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![
                        Ok(assistant_text_response("first")),
                        Ok(assistant_text_response("second")),
                    ]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        let (tx, mut rx) = agent.spawn().await.expect("spawn");
        tx.send(AgentInput::Message(InputItem::user_text("one")))
            .await
            .expect("first input");
        tx.send(AgentInput::Message(InputItem::user_text("two")))
            .await
            .expect("second input");
        drop(tx);

        while recv_non_request(&mut rx).await.is_some() {}

        let records = storage.records();
        assert!(
            records
                .iter()
                .any(|record| matches!(record, StorageRecord::TurnQueued { turn: 2 }))
        );
        assert_eq!(
            records
                .iter()
                .filter(|record| matches!(record, StorageRecord::TurnStarted { turn: 1 | 2 }))
                .count(),
            2
        );
        assert!(records.iter().any(|record| matches!(
            record,
            StorageRecord::EventEmitted {
                turn: 2,
                event: StorageEvent::Completed { reply }
            } if reply == "second"
        )));
    }

    #[tokio::test]
    async fn storage_adapter_records_cancel_for_active_turn() {
        let storage = InMemoryStorageAdapter::shared();
        let mut agent = Agent::raw_builder()
            .with_storage_adapter_arc(storage.clone())
            .with_tool_runner(ping_tool_runner())
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(tool_call_response())]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("ping please")))
            .await
            .expect("turn");
        let _ = next_non_request(&mut agent).await.expect("tool call");
        agent.send(AgentInput::Cancel).await.expect("cancel");
        let _ = next_non_request(&mut agent).await.expect("cancelled");

        let records = storage.records();
        assert!(records.iter().any(|record| matches!(
            record,
            StorageRecord::InputReceived {
                turn: Some(1),
                input: StorageInput::Cancel
            }
        )));
        assert!(records.iter().any(|record| matches!(
            record,
            StorageRecord::EventEmitted {
                turn: 1,
                event: StorageEvent::Cancelled
            }
        )));
    }

    #[tokio::test]
    async fn run_surfaces_agent_errors() {
        let agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Err(provider_error())]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        let (tx, mut rx) = agent.spawn().await.expect("spawn");
        tx.send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("input");
        drop(tx);

        assert!(matches!(
            recv_non_request(&mut rx).await.expect("error event"),
            Err(AgentError::Llm(source))
                if matches!(source, LlmError::Provider { status: 503, .. })
        ));
        assert!(recv_non_request(&mut rx).await.is_none());
    }

    #[tokio::test]
    async fn cancel_while_idle_is_a_no_op() {
        let mut agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent.send(AgentInput::Cancel).await.expect("turn");
        assert!(agent.next().await.expect("idle").is_none());
    }

    #[tokio::test]
    async fn send_reuses_prior_transcript_in_next_request() {
        let provider = Arc::new(FakeProvider::with_responses(vec![
            Ok(assistant_text_response("first reply")),
            Ok(assistant_text_response("second reply")),
        ]));
        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let mut agent = Agent::raw_builder()
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("first")))
            .await
            .expect("first turn");
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        agent
            .send(AgentInput::Message(InputItem::user_text("second")))
            .await
            .expect("second turn");
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let requests = provider.take_requests();
        assert_eq!(requests.len(), 2);
        assert_eq!(requests[0].input.len(), 1);
        assert_eq!(requests[1].input.len(), 3);
    }

    #[tokio::test]
    async fn send_queues_messages_while_turn_is_in_progress() {
        let mut agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![
                        Ok(assistant_text_response("first")),
                        Ok(assistant_text_response("second")),
                    ]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("first")))
            .await
            .expect("first send");
        assert_eq!(agent.queued_turn_count(), 0);

        agent
            .send(AgentInput::Message(InputItem::user_text("second")))
            .await
            .expect("second send");
        assert_eq!(agent.queued_turn_count(), 1);

        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Completed { reply, .. }) if reply == "first"
        ));
        match next_non_request(&mut agent).await.expect("next") {
            Some(AgentEvent::ModelOutputItem { .. }) => {
                assert!(matches!(
                    next_non_request(&mut agent).await.expect("next"),
                    Some(AgentEvent::Completed { reply, .. }) if reply == "second"
                ));
            }
            Some(AgentEvent::Completed { reply, .. }) => {
                assert_eq!(reply, "second");
            }
            other => panic!("expected queued turn event, got {other:?}"),
        }
        assert!(next_non_request(&mut agent).await.expect("done").is_none());
    }

    #[tokio::test]
    async fn steer_while_idle_behaves_like_message() {
        let mut agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(
                        assistant_text_response("steered"),
                    )]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Steer(InputItem::user_text("hello")))
            .await
            .expect("steer");

        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Completed { reply, .. }) if reply == "steered"
        ));
        assert!(next_non_request(&mut agent).await.expect("done").is_none());
    }

    #[tokio::test]
    async fn steer_during_pending_tool_plan_clears_remaining_tool_calls() {
        let provider = Arc::new(FakeProvider::with_responses(vec![
            Ok(tool_call_response()),
            Ok(assistant_text_response("steered reply")),
        ]));
        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let mut agent = Agent::raw_builder()
            .with_tool_runner(ping_tool_runner())
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("ping please")))
            .await
            .expect("first");

        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ToolCallRequested { .. })
        ));

        agent
            .send(AgentInput::Steer(InputItem::user_text(
                "Do not call any tool. Reply with 'steered reply'.",
            )))
            .await
            .expect("steer");

        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Completed { reply, .. }) if reply == "steered reply"
        ));
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let requests = provider.take_requests();
        assert_eq!(requests.len(), 2);
        assert!(requests[1].input.iter().any(|item| {
            matches!(
                item,
                RawInputItem::ToolResult {
                    tool_use_id,
                    content,
                } if tool_use_id == "call_ping_1" && content.contains("interrupted by steering")
            )
        }));
        assert!(matches!(
            requests[1].input.last(),
            Some(RawInputItem::Message {
                role: Role::User,
                ..
            })
        ));
    }

    #[tokio::test]
    async fn cancel_during_active_turn_finishes_immediately() {
        let mut agent = Agent::raw_builder()
            .with_tool_runner(ping_tool_runner())
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(tool_call_response())]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("ping please")))
            .await
            .expect("turn");
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ToolCallRequested { .. })
        ));

        agent.send(AgentInput::Cancel).await.expect("cancel");
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Cancelled)
        ));
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let transcript = agent.transcript().await.expect("transcript");
        assert!(transcript.iter().any(|item| {
            matches!(
                item,
                InputItem::ToolResult {
                    tool_use_id,
                    content,
                } if tool_use_id == "call_ping_1" && content.contains("cancelled")
            )
        }));
    }

    #[tokio::test]
    async fn next_errors_when_model_returns_no_matching_reply_type() {
        let response = RawCompletionResponse {
            provider: ProviderType::OpenAI,
            model: "test-model".to_string(),
            output: vec![RawOutputItem::Reasoning {
                text: "thinking".to_string(),
            }],
            usage: crate::llm::completion::Usage {
                prompt_tokens: 1,
                completion_tokens: 1,
                total_tokens: 2,
            },
            finish_reason: FinishReason::Stop,
        };

        let mut agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(response)]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        let error = next_non_request(&mut agent).await.expect_err("should fail");

        assert!(matches!(error, AgentError::InvalidResponse { .. }));
    }

    #[tokio::test]
    async fn send_applies_profile_override_to_request() {
        let provider = Arc::new(FakeProvider::with_responses(vec![Ok(
            assistant_text_response("hello back"),
        )]));
        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let mut agent = Agent::raw_builder()
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        let profile = ExecutionProfile {
            model_selector: ModelSelector::from_model("override-model"),
            token_limit: TokenLimit::Max(42),
            temperature: Temperature::Value(0.0),
            top_p: TopP::ProviderDefault,
            top_k: TopK::ProviderDefault,
            tool_choice: ToolChoice::ProviderDefault,
        };

        agent
            .send_with_profile(AgentInput::Message(InputItem::user_text("hello")), profile)
            .await
            .expect("turn");
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let requests = provider.take_requests();
        assert_eq!(requests.len(), 1);
        assert_eq!(requests[0].token_limit, TokenLimit::Max(42));
    }

    #[tokio::test]
    async fn typed_send_sets_typed_response_format() {
        let provider = Arc::new(FakeProvider::with_responses(vec![Ok(
            assistant_json_response(serde_json::json!({ "value": "typed-ok" })),
        )]));
        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let mut agent = Agent::raw_builder()
            .with_response_type::<EchoResponse>()
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let requests = provider.take_requests();
        assert!(requests[0].response_format.is_some());
    }

    #[tokio::test]
    async fn string_send_does_not_set_typed_response_format() {
        let provider = Arc::new(FakeProvider::with_responses(vec![Ok(
            assistant_text_response("hello back"),
        )]));
        let runner = LlmRunner::builder()
            .add_provider(ArcBackedFakeProvider(provider.clone()))
            .build();
        let mut agent = Agent::raw_builder()
            .with_llm_runner(runner.into())
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("next").is_some());
        assert!(next_non_request(&mut agent).await.expect("done").is_none());

        let requests = provider.take_requests();
        assert!(requests[0].response_format.is_none());
    }

    #[tokio::test]
    async fn next_emits_model_output_before_completion() {
        let mut agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Ok(
                        assistant_text_response("hello back"),
                    )]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");

        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::ModelOutputItem { .. })
        ));
        assert!(matches!(
            next_non_request(&mut agent).await.expect("next"),
            Some(AgentEvent::Completed { .. })
        ));
        assert!(next_non_request(&mut agent).await.expect("done").is_none());
    }

    #[tokio::test]
    async fn next_propagates_llm_errors() {
        let mut agent = Agent::raw_builder()
            .with_llm_runner(
                LlmRunner::builder()
                    .add_provider(FakeProvider::with_responses(vec![Err(provider_error())]))
                    .build()
                    .into(),
            )
            .build()
            .expect("agent");

        agent
            .send(AgentInput::Message(InputItem::user_text("hello")))
            .await
            .expect("turn");

        let error = next_non_request(&mut agent).await.expect_err("should fail");

        match error {
            AgentError::Llm(inner) => {
                assert_eq!(inner.provider_name(), Some("openrouter"));
                assert_eq!(inner.provider_status(), Some(503));
            }
            other => panic!("unexpected error: {other:?}"),
        }
    }

    struct ArcBackedFakeProvider(Arc<FakeProvider>);

    #[cfg_attr(target_arch = "wasm32", async_trait(?Send))]
    #[cfg_attr(not(target_arch = "wasm32"), async_trait)]
    impl LlmProvider for ArcBackedFakeProvider {
        fn provider_type(&self) -> ProviderType {
            self.0.provider_type()
        }

        fn provider_name(&self) -> &'static str {
            self.0.provider_name()
        }

        fn capabilities(&self) -> &[Capability] {
            self.0.capabilities()
        }

        async fn available_models(&self) -> LlmResult<Vec<Model>> {
            self.0.available_models().await
        }

        async fn chat_raw(&self, req: RawCompletionRequest) -> LlmResult<RawCompletionResponse> {
            self.0.chat_raw(req).await
        }

        async fn transcribe(
            &self,
            req: AudioTranscriptionRequest,
        ) -> LlmResult<AudioTranscriptionResponse> {
            self.0.transcribe(req).await
        }
    }
}