dendritic_regression/
elastic_net.rs

use dendritic_ndarray::ndarray::NDArray;
use dendritic_ndarray::ops::*;
use dendritic_metrics::loss::*;
use dendritic_autodiff::node::{Node, Value};
use dendritic_autodiff::regularizers::*; 
use dendritic_autodiff::ops::*; 
use std::fs;


pub struct ElasticNet {
    pub features: Value<NDArray<f64>>,
    pub outputs: Value<NDArray<f64>>,
    pub weights: Value<NDArray<f64>>, 
    pub bias: Value<NDArray<f64>>,
    lambda: Value<NDArray<f64>>,
    learning_rate: f64,
    loss_function: fn(
        y_true: &NDArray<f64>, 
        y_pred: &NDArray<f64>) -> Result<f64, String>
}


impl ElasticNet {

    /// Create new instance of elastic net regression
    pub fn new(
        features: &NDArray<f64>, 
        y: &NDArray<f64>,
        lambda: f64, 
        learning_rate: f64) -> Result<ElasticNet, String> {

        if learning_rate < 0.0 || learning_rate > 1.0 {
            return Err("Learning rate must be between 1 and 0".to_string());
        }

        let weights = NDArray::new(vec![features.shape().dim(1), 1]).unwrap();
        let bias = NDArray::new(vec![1, 1]).unwrap();
        let inputs = Value::new(features); 
        let outputs = Value::new(y);

        let lambda_value: NDArray<f64> = NDArray::array(
            vec![1, 1], vec![lambda]
        ).unwrap();

        Ok(Self {
            features: inputs.clone(),
            outputs: outputs.clone(),
            weights: Value::new(&weights),
            bias: Value::new(&bias),
            lambda: Value::new(&lambda_value),
            learning_rate: learning_rate,
            loss_function: mse,
        })
    }


    /// Predict features for elastic net regression
    pub fn predict(&mut self, inputs: NDArray<f64>) -> NDArray<f64> {

        self.features = Value::new(&inputs); 

        let mut linear = ScaleAdd::new(
            Dot::new(self.features.clone(), self.weights.clone()),
            self.bias.clone()
        );

        linear.forward(); 
        linear.value() 
    }

    /// Save parameters for elastic net regression
    pub fn save(&self, filepath: &str) -> std::io::Result<()> {

        let weights_file = format!("{}/weights", filepath);
        let bias_path = format!("{}/bias", filepath); 
        fs::create_dir_all(filepath)?;

        self.weights.val().save(&weights_file).unwrap();
        self.bias.val().save(&bias_path).unwrap();

        Ok(())
    }


    /// Load parameters for elastic net regression
    pub fn load(
        filepath: &str, 
        features: &NDArray<f64>, 
        y: &NDArray<f64>, 
        learning_rate: f64,
        lambda: f64) -> std::io::Result<ElasticNet> {

        let weights_file = format!("{}/weights", filepath);
        let bias_path = format!("{}/bias", filepath); 

        let inputs = Value::new(features); 
        let outputs = Value::new(y);
        let load_weights = NDArray::load(&weights_file).unwrap();
        let load_bias = NDArray::load(&bias_path).unwrap();

        let lambda_value: NDArray<f64> = NDArray::array(
            vec![1, 1], vec![lambda]
        ).unwrap();

        Ok(ElasticNet {
            features: inputs.clone(),
            outputs: outputs.clone(),
            weights: Value::new(&load_weights),
            bias: Value::new(&load_bias),
            lambda: Value::new(&lambda_value),
            learning_rate: learning_rate,
            loss_function: mse
        })

    }


    /// Train elastic net regression model
    pub fn train(&mut self, epochs: usize, log_output: bool) {

        let mut linear = ScaleAdd::new(
            Dot::new(self.features.clone(), self.weights.clone()),
            self.bias.clone()
        );

        let mut l1_reg = L1Regularization::new(
            self.weights.clone(),
            self.lambda.clone(),
            self.learning_rate
        );

        let mut l2_reg = L2Regularization::new(
            self.weights.clone(),
            self.lambda.clone(),
            self.learning_rate
        );

        for epoch in 0..epochs {

            linear.forward();
            l1_reg.forward();
            l2_reg.forward();

            let y_pred = linear.value();
            let loss = (self.loss_function)(&self.outputs.val(), &y_pred).unwrap();
            let error = y_pred.subtract(self.outputs.val()).unwrap();
            let l1_error = error.scale_add(l1_reg.value()).unwrap();
            let l2_error = error.scale_add(l2_reg.value()).unwrap();

            linear.backward(error.clone()); 
            l1_reg.backward(l1_error.clone());
            l2_reg.backward(l2_error);

            let w_grad = self.features.grad().scalar_mult(
                self.learning_rate/y_pred.size() as f64
            ).unwrap();

            let w_update = self.weights.val().subtract(w_grad).unwrap();
            let l1_reg_w = l1_reg.grad(); 
            let l2_reg_w = l2_reg.grad(); 
            let reg_w = l1_reg_w.add(l2_reg_w).unwrap(); 
            let dw = w_update.subtract(reg_w).unwrap();
            self.weights.set_val(&dw);

            /* update biases */
            let b_collapse = self.bias.grad().sum_axis(1).unwrap();
            let db = b_collapse.scalar_mult(
                self.learning_rate/y_pred.size() as f64
            ).unwrap();
            self.bias.set_val(&db);

            if log_output {
                println!("Epoch [{:?}/{:?}]: {:?}", epoch, epochs, loss);
            }

        }

    }


    /// Train elastic net regression model with batch gradient descent
    pub fn sgd(&mut self, epochs: usize, log_output: bool, batch_size: usize) {

        let mut loss: f64 = 0.0;
        let x_train_binding = self.features.val();
        let y_train_binding = self.outputs.val();
        let x_train = x_train_binding.batch(batch_size).unwrap();
        let y_train = y_train_binding.batch(batch_size).unwrap();

        let mut linear = ScaleAdd::new(
            Dot::new(self.features.clone(), self.weights.clone()),
            self.bias.clone()
        );

        let mut l1_reg = L1Regularization::new(
            self.weights.clone(),
            self.lambda.clone(),
            self.learning_rate
        );

        let mut l2_reg = L2Regularization::new(
            self.weights.clone(),
            self.lambda.clone(),
            self.learning_rate
        );

        for epoch in 0..epochs {

            let mut batch_index = 0;
            for batch in &x_train {

                self.features.set_val(&batch);
                self.outputs.set_val(&y_train[batch_index]);

                linear.forward();
                l1_reg.forward();
                l2_reg.forward();

                let y_pred = linear.value();
                loss = (self.loss_function)(&self.outputs.val(), &y_pred).unwrap();
                let error = y_pred.subtract(self.outputs.val()).unwrap();
                let l1_error = error.scale_add(l1_reg.value()).unwrap();
                let l2_error = error.scale_add(l2_reg.value()).unwrap();

                linear.backward(error.clone()); 
                l1_reg.backward(l1_error);
                l2_reg.backward(l2_error);

                let w_grad = self.features.grad().scalar_mult(
                    self.learning_rate/y_pred.size() as f64
                ).unwrap();

                let w_update = self.weights.val().subtract(w_grad).unwrap();
                let l1_reg_w = l1_reg.grad(); 
                let l2_reg_w = l2_reg.grad(); 
                let reg_w = l1_reg_w.add(l2_reg_w).unwrap(); 
                let dw = w_update.subtract(reg_w).unwrap();
                self.weights.set_val(&dw);

                /* update biases */
                let b_collapse = self.bias.grad().sum_axis(1).unwrap();
                let db = b_collapse.scalar_mult(
                    self.learning_rate/y_pred.size() as f64
                ).unwrap();
                self.bias.set_val(&db);

                batch_index += 1; 

            }

            if log_output {
                println!("Epoch [{:?}/{:?}]: {:?}", epoch, epochs, loss);
            }

        }

    }

}
dendritic_regression/elastic_net.rs

dendritic_regression/
elastic_net.rs