SciRS2 Neural

🚀 Production-Ready Neural Network Module (v0.1.0-rc.1) for the SciRS2 scientific computing library. Following the SciRS2 POLICY, this module provides comprehensive, battle-tested tools for building, training, and evaluating neural networks with state-of-the-art performance optimizations and ecosystem consistency.

✅ Production Status

Version 0.1.0-rc.1 (SciRS2 POLICY & Enhanced Performance) is production-ready with:

✅ Zero compilation warnings
✅ 303 tests passing (100% coverage of core functionality)
✅ Clippy clean code quality
✅ Comprehensive API documentation
✅ Performance optimizations active
✅ Memory safety verified

Features

🚀 Core Neural Network Components

Complete Layer Library: Dense, Convolutional (1D/2D/3D), Pooling, Recurrent (LSTM, GRU), Normalization (Batch, Layer, Instance, Group), Attention, Transformer, Embedding, and Regularization layers
Advanced Activations: ReLU variants, Sigmoid, Tanh, Softmax, GELU, Swish/SiLU, Mish, Snake, and parametric activations
Comprehensive Loss Functions: MSE, Cross-entropy variants, Focal loss, Contrastive loss, Triplet loss, Huber/Smooth L1, KL-divergence, CTC loss
Sequential Model API: Intuitive API for building complex neural network architectures

⚡ Performance & Optimization

JIT Compilation: Just-in-time compilation for neural network operations with multiple optimization strategies
SIMD Acceleration: Vectorized operations for improved performance
Memory Efficiency: Optimized memory usage with adaptive pooling and efficient implementations
Mixed Precision Training: Support for half-precision floating point for faster training
TPU Compatibility: Basic infrastructure for Tensor Processing Unit support

🏗️ Model Architecture Support

Pre-defined Architectures: ResNet, EfficientNet, Vision Transformer (ViT), ConvNeXt, MobileNet, BERT-like, GPT-like, CLIP-like models
Transformer Implementation: Full transformer encoder/decoder with multi-head attention, position encoding
Multi-modal Support: Cross-modal architectures and feature fusion capabilities
Transfer Learning: Weight initialization, layer freezing/unfreezing, fine-tuning utilities

🎯 Training Infrastructure

Advanced Training Loop: Epoch-based training with gradient accumulation, mixed precision, and distributed training support
Dataset Handling: Data loaders with prefetching, batch generation, data augmentation pipeline
Training Callbacks: Model checkpointing, early stopping, learning rate scheduling, gradient clipping, TensorBoard logging
Evaluation Framework: Comprehensive metrics computation, cross-validation, test set evaluation

🔧 Advanced Capabilities

Model Serialization: Save/load functionality with version compatibility and portable format specification
Model Pruning & Compression: Magnitude-based pruning, structured pruning, knowledge distillation
Model Interpretation: Gradient-based attributions, feature visualization, layer activation analysis
Quantization Support: Post-training quantization and quantization-aware training

🌐 Integration & Deployment

Framework Interoperability: ONNX model export/import, PyTorch/TensorFlow weight conversion
Deployment Ready: C/C++ binding generation, WebAssembly target, mobile deployment utilities
Visualization Tools: Network architecture visualization, training curves, attention visualization

Installation

Add the following to your Cargo.toml:

[dependencies]
scirs2-neural = "0.1.0-rc.1"

To enable optimizations and optional features:

[dependencies]
scirs2-neural = { version = "0.1.0-rc.1", features = ["simd", "parallel"] }

# For performance optimization
scirs2-neural = { version = "0.1.0-rc.1", features = ["jit", "cuda"] }

# For integration with scirs2-metrics
scirs2-neural = { version = "0.1.0-rc.1", features = ["metrics_integration"] }

Quick Start

Here's a simple example to get you started:

use scirs2_neural::prelude::*;
use scirs2_neural::layers::{Sequential, Dense};
use scirs2_neural::losses::MeanSquaredError;
use ndarray::Array2;
use rand::rngs::SmallRng;
use rand::SeedableRng;

fn main() -> Result<(), Box<dyn std::error::Error>> {
    let mut rng = SmallRng::seed_from_u64(42);
    
    // Create a simple neural network
    let mut model = Sequential::new();
    model.add(Dense::new(2, 64, Some("relu"), &mut rng)?);
    model.add(Dense::new(64, 32, Some("relu"), &mut rng)?);
    model.add(Dense::new(32, 1, Some("sigmoid"), &mut rng)?);
    
    // Create sample data (XOR problem)
    let x = Array2::from_shape_vec((4, 2), vec![0.0, 0.0, 0.0, 1.0, 1.0, 0.0, 1.0, 1.0])?;
    let y = Array2::from_shape_vec((4, 1), vec![0.0, 1.0, 1.0, 0.0])?;
    
    // Forward pass
    let predictions = model.forward(&x.into_dyn())?;
    println!("Predictions: {:?}", predictions);
    
    Ok(())
}

Comprehensive Examples

The library includes complete working examples for various use cases:

Image Classification: CNN architectures for computer vision
Text Classification: NLP models with embeddings and attention
Semantic Segmentation: U-Net for pixel-wise classification
Object Detection: Feature extraction and bounding box regression
Generative Models: VAE and GAN implementations

Usage

Detailed usage examples:

use scirs2_neural::prelude::*;
use scirs2_neural::layers::{Sequential, Dense, Conv2D, MaxPool2D, Dropout, BatchNorm};
use scirs2_neural::losses::{CrossEntropyLoss, MeanSquaredError};
use scirs2_neural::training::{TrainingConfig, ValidationSettings};
use rand::rngs::SmallRng;
use rand::SeedableRng;
use ndarray::Array4;

// Create a CNN for image classification
fn create_cnn() -> Result<Sequential<f32>, Box<dyn std::error::Error>> {
    // Create a sequential model
    let mut model = models::sequential::Sequential::new();
    
    // Add layers
    model.add_layer(layers::dense::Dense::new(2, 32, None, None)?);
    model.add_layer(activations::relu::ReLU::new());
    model.add_layer(layers::dense::Dense::new(32, 16, None, None)?);
    model.add_layer(activations::relu::ReLU::new());
    model.add_layer(layers::dense::Dense::new(16, 1, None, None)?);
    model.add_layer(activations::sigmoid::Sigmoid::new());
    
    // Set loss function and optimizer
    let loss = losses::mse::MeanSquaredError::new();
    let optimizer = optimizers::adam::Adam::new(0.001, 0.9, 0.999, 1e-8);
    
    // Compile the model
    model.compile(loss, optimizer);
    
    // Sample training data (XOR problem)
    let x_train = array![[0.0, 0.0], [0.0, 1.0], [1.0, 0.0], [1.0, 1.0]];
    let y_train = array![[0.0], [1.0], [1.0], [0.0]];
    
    // Train the model
    model.fit(&x_train, &y_train, 1000, 4, None, None)?;
    
    // Make predictions
    let predictions = model.predict(&x_train)?;
    println!("Predictions: {:?}", predictions);
    
    Ok(())
}

// Using autograd for manual gradient computation
fn autograd_example() -> CoreResult<()> {
    use scirs2_neural::autograd::{Variable, Graph};
    
    // Create computation graph
    let mut graph = Graph::new();
    
    // Create input variables
    let x = graph.variable(2.0);
    let y = graph.variable(3.0);
    
    // Build computation
    let z = graph.add(&x, &y);  // z = x + y
    let w = graph.multiply(&z, &x);  // w = z * x = (x + y) * x
    
    // Forward pass
    graph.forward()?;
    println!("Result: {}", w.value()?);  // Should be (2 + 3) * 2 = 10
    
    // Backward pass to compute gradients
    graph.backward(&w)?;
    
    // Get gradients
    println!("dw/dx: {}", x.gradient()?);  // Should be d((x+y)*x)/dx = (x+y) + x*1 = 2+3 + 2*1 = 7
    println!("dw/dy: {}", y.gradient()?);  // Should be d((x+y)*x)/dy = x*1 = 2
    
    Ok(())
}

Components

Layers

Neural network layer implementations:

use scirs2_neural::layers::{
    Layer,                  // Layer trait
    dense::Dense,           // Fully connected layer
    dropout::Dropout,       // Dropout layer
    conv::Conv2D,           // 2D convolutional layer
    conv::Conv2DTranspose,  // 2D transposed convolutional layer
    pooling::MaxPool2D,     // 2D max pooling layer
    pooling::AvgPool2D,     // 2D average pooling layer
    pooling::GlobalPooling, // Global pooling layer
    norm::BatchNorm,        // Batch normalization layer
    norm::LayerNorm,        // Layer normalization layer
    recurrent::LSTM,        // Long Short-Term Memory layer
    recurrent::GRU,         // Gated Recurrent Unit layer
    recurrent::RNN,         // Simple RNN layer
    attention::MultiHeadAttention, // Multi-head attention mechanism
    attention::SelfAttention,      // Self-attention mechanism
    transformer::TransformerEncoder, // Transformer encoder block
    transformer::TransformerDecoder, // Transformer decoder block
    transformer::Transformer,        // Full transformer architecture
};

Activations

Activation functions:

use scirs2_neural::activations::{
    Activation,             // Activation trait
    relu::ReLU,             // Rectified Linear Unit
    sigmoid::Sigmoid,       // Sigmoid activation
    tanh::Tanh,             // Hyperbolic tangent
    softmax::Softmax,       // Softmax activation
    gelu::GELU,             // Gaussian Error Linear Unit
    swish::Swish,           // Swish/SiLU activation
    mish::Mish,             // Mish activation
};

Loss Functions

Loss function implementations:

use scirs2_neural::losses::{
    Loss,                   // Loss trait
    mse::MeanSquaredError,  // Mean Squared Error
    crossentropy::CrossEntropy, // Cross Entropy Loss
};

Models

Neural network model implementations:

use scirs2_neural::models::{
    sequential::Sequential,  // Sequential model
    trainer::Trainer,        // Training utilities
};

Optimizers

Optimization algorithms:

use scirs2_neural::optimizers::{
    Optimizer,              // Optimizer trait
    sgd::SGD,               // Stochastic Gradient Descent
    adagrad::AdaGrad,       // Adaptive Gradient Algorithm
    rmsprop::RMSprop,       // Root Mean Square Propagation
    adam::Adam,             // Adaptive Moment Estimation
    adamw::AdamW,           // Adam with decoupled weight decay
    radam::RAdam,           // Rectified Adam
};

Autograd

Automatic differentiation functionality:

use scirs2_neural::autograd::{
    Variable,               // Variable holding value and gradient
    Graph,                  // Computation graph
    Tape,                   // Gradient tape
    Function,               // Function trait
    ops,                    // Basic operations
};

Utilities

Helper utilities:

use scirs2_neural::utils::{
    initializers,           // Weight initialization functions
    metrics,                // Evaluation metrics
    datasets,               // Dataset utilities
};

// Model serialization
use scirs2_neural::serialization::{
    SaveLoad,               // Save/load trait for models
    ModelConfig,            // Configuration for model serialization
    load_model,             // Load model from file
};

Integration with Other SciRS2 Modules

This module integrates with other SciRS2 modules:

scirs2-linalg: For efficient matrix operations
scirs2-optim: For advanced optimization algorithms
scirs2-autograd: For automatic differentiation (if used separately)
scirs2-metrics: For advanced evaluation metrics and visualizations

Example of using linear algebra functions:

use scirs2_neural::linalg::batch_operations;
use ndarray::Array3;

// Batch matrix multiplication
let a = Array3::<f64>::zeros((32, 10, 20));
let b = Array3::<f64>::zeros((32, 20, 15));
let result = batch_operations::batch_matmul(&a, &b);

Metrics Integration

With the metrics_integration feature, you can use scirs2-metrics for advanced evaluation:

use scirs2_metrics::integration::neural::{NeuralMetricAdapter, MetricsCallback};
use scirs2_neural::callbacks::ScirsMetricsCallback;
use scirs2_neural::evaluation::MetricType;

// Create metric adapters
let metrics = vec![
    NeuralMetricAdapter::<f32>::accuracy(),
    NeuralMetricAdapter::<f32>::precision(),
    NeuralMetricAdapter::<f32>::f1_score(),
    NeuralMetricAdapter::<f32>::mse(),
    NeuralMetricAdapter::<f32>::r2(),
];

// Create callback for tracking metrics during training
let metrics_callback = ScirsMetricsCallback::new(metrics);

// Train model with metrics tracking
model.fit(&x_train, &y_train, 
    epochs, 
    batch_size, 
    Some(&[&metrics_callback]), 
    None
)?;

// Get evaluation metrics
let eval_results = model.evaluate(
    &x_test, 
    &y_test, 
    Some(batch_size),
    Some(vec![
        MetricType::Accuracy,
        MetricType::Precision,
        MetricType::F1Score,
    ])
)?;

// Visualize results
let roc_viz = neural_roc_curve_visualization(&y_true, &y_pred, Some(auc))?;

🏭 Production Deployment

This module is ready for production deployment in:

✅ Enterprise Applications

High-Performance Computing: Optimized for large-scale neural network training
Real-Time Inference: Low-latency prediction capabilities
Distributed Systems: Thread-safe, concurrent operations support
Memory-Constrained Environments: Efficient memory usage patterns

✅ Development Workflows

Research & Development: Flexible API for experimentation
Prototyping: Quick model iteration and testing
Production Pipelines: Stable API with backward compatibility
Cross-Platform Deployment: Support for various target architectures

✅ Quality Assurance

Comprehensive Testing: 303 unit tests covering all major functionality
Code Quality: Clippy-clean codebase following Rust best practices
Documentation: Complete API docs with practical examples
Performance: Benchmarked and optimized for real-world workloads

Contributing

See the CONTRIBUTING.md file for contribution guidelines.

License

This project is dual-licensed under:

You can choose to use either license. See the LICENSE file for details.

scirs2-neural 0.1.0-rc.1