entrenar 0.7.13

//! High-level training loop
//!
//! This module provides a complete training framework with:
//! - Loss functions (MSE, Cross-Entropy, Huber/SmoothL1, L1)
//! - Evaluation metrics (Accuracy, Precision, Recall, F1, R², MAE, RMSE)
//! - Curriculum learning (Linear, Tiered, Adaptive)
//! - Trainer abstraction
//! - Training configuration
//! - Metrics tracking
//! - Checkpoint support
//!
//! # Example
//!
//! ```no_run
//! use entrenar::train::{Trainer, TrainConfig, Batch};
//! use entrenar::optim::Adam;
//! use entrenar::Tensor;
//!
//! let params = vec![Tensor::zeros(10, true)];
//! let optimizer = Adam::new(0.001, 0.9, 0.999, 1e-8);
//! let config = TrainConfig::default();
//!
//! let mut trainer = Trainer::new(params, Box::new(optimizer), config);
//!
//! // Training loop
//! // for epoch in 0..10 {
//! //     let loss = trainer.train_epoch(&dataloader);
//! //     println!("Epoch {}: loss={:.4}", epoch, loss);
//! // }
//! ```

mod batch;
pub mod callback;
mod config;
mod curriculum;
mod loss;
mod metrics;
mod trainer;
pub mod transformer_trainer;
pub mod tui;

#[cfg(test)]
mod tests;

pub use batch::Batch;
pub use callback::{
    CallbackAction, CallbackContext, CallbackManager, CheckpointCallback, EarlyStopping,
    ExplainMethod, ExplainabilityCallback, FeatureImportanceResult, LRSchedulerCallback,
    MonitorCallback, ProgressCallback, TrainerCallback,
};
pub use config::{MetricsTracker, TrainConfig};
pub use curriculum::{
    efficiency_score, select_optimal_tier, AdaptiveCurriculum, CurriculumScheduler,
    LinearCurriculum, TieredCurriculum,
};
pub use loss::{
    BCEWithLogitsLoss, CausalLMLoss, CrossEntropyLoss, HuberLoss, L1Loss, LossFn, MSELoss,
    SampleWeightedLoss, SmoothL1Loss, WeightedLoss,
};
pub use metrics::{Accuracy, F1Score, Metric, Precision, R2Score, Recall, MAE, RMSE};
pub use trainer::{TrainResult, Trainer};
pub use transformer_trainer::distributed_checkpoint::{
    checkpoint_path, hash_weights, should_save_checkpoint, verify_weight_consistency,
    CheckpointPhase,
};
pub use transformer_trainer::grad_accumulator::BLOCK_GRAD_COMPONENTS;
pub use transformer_trainer::{
    perplexity,
    // DDP (#133)
    shard_batches,
    tokens_per_second,
    BlockGradientSet,
    // Parallelism strategies
    CausalMaskType,
    ColumnParallelShard,
    CudaTransformerTrainer,
    DistributedBackend,
    DistributedCheckpointCoordinator,
    DistributedRole,
    DistributedTrainConfig,
    ElasticCoordinator,
    LMBatch,
    OptimizerShard,
    PerBlockGradientAccumulator,
    PipelineAction,
    PipelineActivationBuffer,
    PipelineStage,
    RingAttentionSchedule,
    RowParallelShard,
    SequenceParallelConfig,
    SpCommCost,
    TensorParallelConfig,
    TpCommCost,
    TransformerTrainConfig,
    TransformerTrainer,
    ZeroShardMap,
};
#[cfg(feature = "cuda")]
pub use transformer_trainer::{DistributedComm, DistributedCudaTrainer};
pub use tui::{
    format_duration, sparkline, sparkline_range, Alert, AlertLevel, AndonSystem, DashboardLayout,
    FeatureImportanceChart, GradientFlowHeatmap, KalmanEta, LossCurveDisplay, MetricsBuffer,
    MonitorConfig, ProgressBar, ReferenceCurve, RefreshPolicy, SeriesSummaryTuple,
    TerminalCapabilities, TerminalMode, TerminalMonitorCallback, SPARK_CHARS,
};