selen 0.15.5 - Docs.rs

# LP Solver Statistics Design

## Overview

Following Selen's comprehensive statistics framework, the LP solver now provides detailed performance metrics and solving insights through the `LpStats` structure embedded in each `LpSolution`.

## Comparison with Selen's SolveStats

### Selen CSP Solver Statistics
```rust
pub struct SolveStats {
    pub propagation_count: usize,      // Constraint propagations
    pub node_count: usize,             // Search nodes (branching points)
    pub solve_time: Duration,          // Total solve time
    pub variable_count: usize,         // Problem size
    pub constraint_count: usize,       // Problem size
    pub peak_memory_mb: usize,         // Memory usage
}
```

### LP Solver Statistics
```rust
pub struct LpStats {
    // Timing metrics (more granular than CSP)
    pub solve_time_ms: f64,           // Total time
    pub phase1_time_ms: f64,          // Feasibility phase
    pub phase2_time_ms: f64,          // Optimization phase
    
    // Iteration metrics (analog to CSP's propagation/node counts)
    pub phase1_iterations: usize,     // Simplex iterations in Phase I
    pub phase2_iterations: usize,     // Simplex iterations in Phase II
    
    // Resource usage
    pub peak_memory_mb: f64,          // Memory tracking (automatic via matrix tracking)
    
    // Problem characteristics
    pub n_variables: usize,           // Original variable count
    pub n_constraints: usize,         // Original constraint count
    
    // LP-specific metrics
    pub factorizations: usize,        // Basis refactorizations (expensive operations)
    pub phase1_needed: bool,          // Whether initial basis was infeasible
}
```

## Statistics Categories

### 1. **Timing Metrics**
- **`solve_time_ms`**: Total wall-clock time (like CSP's `solve_time`)
- **`phase1_time_ms`**: Time to find initial feasible solution
  * Analogous to CSP's initial propagation phase
  * Zero if initial basis is feasible
- **`phase2_time_ms`**: Time to optimize from feasible to optimal
  * Analogous to CSP's search/branching time
  * Usually the bulk of solve time

**Why separate phases?**
- Phase I time indicates problem difficulty (infeasibility detection)
- Phase II time indicates optimization complexity
- Ratio helps diagnose performance bottlenecks

### 2. **Iteration Metrics**
- **`phase1_iterations`**: Simplex iterations to reach feasibility
  * Analog to CSP's propagation count before first solution
  * Zero if initial basis was feasible
- **`phase2_iterations`**: Simplex iterations to reach optimality
  * Analog to CSP's search node count
  * Reflects optimization complexity

**Why track iterations?**
- Iterations are the fundamental unit of work in Simplex
- Each iteration involves:
  * Pricing (compute reduced costs) - O(n×m)
  * Ratio test - O(m)
  * Basis update - O(m²)
- Iteration count helps predict performance scaling

### 3. **Resource Usage**
- **`peak_memory_mb`**: Maximum memory usage during solving
  * Automatically tracked via atomic counters in Matrix
  * Similar to CSP's `peak_memory_mb`
  * Includes all matrices: constraint matrix, basis, working vectors

**Memory tracking advantages:**
- No manual instrumentation needed
- Thread-safe tracking
- Accurate accounting of matrix allocations
- Helps enforce memory limits

### 4. **Problem Characteristics**
- **`n_variables`**: Original variable count (before adding slacks)
  * Like CSP's `variable_count`
  * Key indicator of problem scale
- **`n_constraints`**: Original constraint count
  * Like CSP's `constraint_count`
  * Affects iteration complexity (O(m²) per iteration)

### 5. **LP-Specific Metrics**
- **`factorizations`**: Number of times basis was refactorized
  * Most expensive operation in Simplex
  * Each factorization is O(m³)
  * Frequent refactorization indicates numerical issues
- **`phase1_needed`**: Whether Phase I was required
  * `false` = initial basis was feasible (fast path)
  * `true` = needed artificial variables (slower)
  * Indicates problem structure

## Usage Examples

### Basic Usage
```rust
use selen::lpsolver::{LpProblem, solve};

let problem = LpProblem::new(/* ... */);
let solution = solve(&problem)?;

println!("Solved in {:.3}ms", solution.stats.solve_time_ms);
println!("Peak memory: {:.2}MB", solution.stats.peak_memory_mb);
println!("Iterations: {}", solution.stats.total_iterations());
```

### Detailed Analysis
```rust
let stats = &solution.stats;

// Display comprehensive summary
stats.display_summary();

// Or access specific metrics
println!("Problem: {}×{} (variables×constraints)", 
         stats.n_variables, stats.n_constraints);

if stats.phase1_needed {
    println!("Phase I: {:.3}ms, {} iterations", 
             stats.phase1_time_ms, stats.phase1_iterations);
} else {
    println!("Initial basis was feasible!");
}

println!("Phase II: {:.3}ms, {} iterations",
         stats.phase2_time_ms, stats.phase2_iterations);

println!("Performance: {:.2}μs/iteration", stats.time_per_iteration_us());
println!("Factorizations: {} ({:.3}ms avg)", 
         stats.factorizations, stats.time_per_factorization_ms());
```

### Performance Diagnostics
```rust
let stats = &solution.stats;

// Diagnose performance issues
if stats.factorizations > stats.total_iterations() / 10 {
    println!("⚠️  High refactorization rate - possible numerical instability");
}

if stats.phase1_time_ms > stats.phase2_time_ms {
    println!("⚠️  Phase I dominated - problem may have tight feasibility");
}

let iter_per_var = stats.total_iterations() as f64 / stats.n_variables as f64;
if iter_per_var > 3.0 {
    println!("⚠️  High iteration/variable ratio - problem may be degenerate");
}

// Memory efficiency
let mb_per_constraint = stats.peak_memory_mb / stats.n_constraints as f64;
println!("Memory efficiency: {:.3}MB per constraint", mb_per_constraint);
```

### Warm-Start Performance Comparison
```rust
// Solve initial problem
let solution1 = solve(&problem1)?;
println!("Initial solve: {:.3}ms, {} iterations",
         solution1.stats.solve_time_ms, solution1.stats.total_iterations());

// Warm-start with modified problem
let solution2 = solve_warmstart(&problem2, &solution1, &config)?;
println!("Warm-started solve: {:.3}ms, {} iterations",
         solution2.stats.solve_time_ms, solution2.stats.total_iterations());

let speedup = solution1.stats.solve_time_ms / solution2.stats.solve_time_ms;
println!("Speedup: {:.1}x", speedup);
```

## Statistics Collection Overhead

All statistics are collected with minimal overhead:

1. **Timing**: Single `Instant::now()` at start, `elapsed()` at end of each phase
2. **Iterations**: Simple counter increment (negligible)
3. **Memory**: Atomic operations in Matrix Drop/Clone (< 0.1% overhead)
4. **Factorizations**: Counter increment in LU decomposition
5. **Problem size**: Read from `LpProblem` structure (no computation)

**Total overhead**: < 0.5% for typical problems

## Future Enhancements

Potential additional statistics (not yet implemented):

1. **Degeneracy metrics**
   - Number of degenerate pivots
   - Average basis change per iteration

2. **Numerical health**
   - Condition number estimates
   - Number of refactorizations due to instability

3. **Bound activity**
   - Number of variables at lower bounds
   - Number of variables at upper bounds
   - Number of active constraints at optimum

4. **Pivot statistics**
   - Average ratio test candidates
   - Number of dual vs primal simplex pivots

5. **Memory details**
   - Memory by component (constraint matrix, basis, etc.)
   - Peak memory by phase

## Compatibility with Selen's Statistics

The LP solver statistics follow the same philosophy as Selen's CSP statistics:

| Concept | CSP | LP Solver |
|---------|-----|-----------|
| Work units | Propagations + Nodes | Phase I + Phase II iterations |
| Timing | Total solve time | Total + per-phase timing |
| Memory | Peak usage (MB) | Peak usage (MB) with automatic tracking |
| Problem size | Variables + Constraints | Variables + Constraints (original) |
| Efficiency | Propagations/node | Time/iteration, iterations/variable |
| Phases | Implicit (propagate then search) | Explicit (Phase I + Phase II) |

Both provide:
- ✅ Zero-overhead collection (< 1%)
- ✅ Comprehensive metrics for diagnostics
- ✅ Easy-to-use summary display methods
- ✅ Embedded in solution objects
- ✅ No callbacks or manual tracking needed

## Summary

The LP solver's statistics framework provides:

1. **Comprehensive coverage**: All key metrics for performance analysis
2. **LP-specific insights**: Phase timing, factorizations, etc.
3. **Consistent API**: Similar to Selen's CSP statistics
4. **Low overhead**: < 0.5% performance impact
5. **Automatic collection**: No user intervention needed
6. **Diagnostic tools**: Built-in analysis methods

This enables users to:
- Monitor performance and resource usage
- Diagnose bottlenecks and numerical issues
- Compare different problem formulations
- Validate warm-start effectiveness
- Optimize LP solver configuration