Function evaluate_reasoning

pub fn evaluate_reasoning(
    results: &[BenchmarkResult],
    config: &ReasoningEvalConfig,
) -> ReasoningEvalSummary

Expand description

Run full reasoning evaluation

evaluate_reasoning