agent_sdk_eval/
lib.rs

1//! Optional evaluation framework primitives for Agent SDK runs.
2//!
3//! This crate owns post-hoc evaluation contracts over core traces and evidence.
4//! It does not run agents, append journals, publish events, choose evaluator
5//! models, or define product-specific success rubrics.
6
7pub mod comparison;
8pub mod cost;
9pub mod evaluator;
10pub mod evidence;
11pub mod identity;
12pub mod metrics;
13pub mod report;
14pub mod request;
15pub mod run_report;
16pub mod scope;
17pub mod testing;
18pub mod usage;
19
20pub use comparison::ComparisonDesign;
21pub use cost::{CostPolicy, CostReport, StaticRateTable};
22pub use evaluator::Evaluator;
23pub use evidence::{EvidenceBundle, EvidenceItem, EvidenceRole, SupportRefValidation};
24pub use identity::EvaluationId;
25pub use metrics::{ToolTraceMetric, TraceMetrics, TraceMetricsComparison};
26pub use report::{
27    EvaluationConfidence, EvaluationMetricDelta, EvaluationReport, EvaluationVerdict,
28    EvaluatorJudgment,
29};
30pub use request::{EvaluationBudget, EvaluationRequest, EvaluationUsage};
31pub use run_report::{RunReport, RunReportLimitations};
32pub use scope::{
33    EvaluationCriterion, EvaluationScope, EvaluationSubject, EvaluationSubjectRole, ExpectedOutcome,
34};
35pub use usage::UsageReport;
agent_sdk_eval/lib.rs

agent_sdk_eval/
lib.rs