flowmium 0.0.9 - Docs.rs

use super::model::EnvVar;
use super::model::Flow;
use super::model::KeyValuePair;
use super::model::SecretRef;
use super::model::Task;
use super::planner::construct_plan;
use super::planner::PlannerError;
use super::scheduler::Scheduler;
use super::scheduler::SchedulerError;
use super::secrets::SecretsCrud;
use super::secrets::SecretsCrudError;

use k8s_openapi::api::core::v1::Pod;
use k8s_openapi::{api::batch::v1::Job, serde_json};
use kube::api::ListParams;
use kube::core::ObjectList;
use kube::{api::PostParams, Api, Client};
use serde::Deserialize;

use thiserror::Error;

/// Errors while trying to run a task.
#[derive(Error, Debug)]
pub enum ExecutorError {
    /// Unable to deploy a job on Kubernetes.
    #[error("unable to spawn task: {0}")]
    UnableToSpawnTask(#[source] kube::error::Error),
    /// Unable to connect to Kubernetes API.
    #[error("unable connect to kubernetes: {0}")]
    UnableToConnectToKubernetes(#[source] kube::error::Error),
    /// A pod unexpectedly disappeared or duplicate pods found for a single tasks
    /// or cannot fetch details for a pod corresponding to a task.
    #[error("unexpected runner state for flow {0} task {1}")]
    UnexpectedRunnerState(i32, i32),
    /// Unable to construct a plan because of errors in the flow definition.
    #[error("unable to construct plan: {0}")]
    UnableToConstructPlan(
        #[from]
        #[source]
        PlannerError,
    ),
    /// Unable to talk to the scheduler, probably an issue with talking to the database.
    #[error("unable to create flow oe mark task error: {0}")]
    UnableToCreateFlowOrMarkTask(
        #[from]
        #[source]
        SchedulerError,
    ),
    /// Unable to fetch secrets from the database.
    #[error("unable to fetch secret: {0}")]
    UnableToFetchSecret(
        #[from]
        #[source]
        SecretsCrudError,
    ),
    /// Name of the flow exceeds 32 characters.
    #[error("flow name longer than 32 characters: {0}")]
    FlowNameTooLong(String),
    /// Kubernetes returned an unknown status for a pod corresponding to a task.
    #[error("Unknown task status for flow {0} task {1}: {2}")]
    UnknownTaskStatus(i32, i32, String),
}

#[derive(Debug, PartialEq)]
enum TaskStatus {
    Pending,
    Running,
    Finished,
    Failed,
}

fn default_flow_label() -> String {
    "flowmium.io/flow-id".to_owned()
}

fn default_task_label() -> String {
    "flowmium.io/task-id".to_owned()
}

/// Configuration for the executor.
#[derive(Debug, PartialEq, Deserialize, Clone)]
pub struct ExecutorConfig {
    /// URL for s3 compatible storage for flow artifacts, as accessible from the server.
    pub store_url: String,
    /// URL for s3 compatible storage for flow artifacts, as accessible from the task running withing Kubernetes.
    /// Will be the same as `store_url` most times if the server and tasks are running inside kubernetes.
    pub task_store_url: String,
    /// Name of the bucket to store flow artifacts.
    pub bucket_name: String,
    /// Access key for s3 compatible storage for flow artifacts.
    pub access_key: String,
    /// Secret key for s3 compatible storage for flow artifacts.
    pub secret_key: String,
    /// Image to use for init container. Always set this to same image as the server.
    pub init_container_image: String,
    /// Kubernetes namespace for the server to run workflows in.
    pub namespace: String,
    /// Flow ID Kubernetes label for task spawned by flowmium. Default is `flowmium.io/flow-id`.
    #[serde(default = "default_flow_label")]
    pub flow_id_label: String,
    /// Task ID Kubernetes label for task spawned by flowmium. Default is `flowmium.io/task-id`.
    #[serde(default = "default_task_label")]
    pub task_id_label: String,
}

async fn get_kubernetes_client() -> Result<Client, ExecutorError> {
    match Client::try_default().await {
        Ok(client) => Ok(client),
        Err(error) => {
            tracing::error!(%error, "Unable to connect to kubernetes");
            Err(ExecutorError::UnableToConnectToKubernetes(error))
        }
    }
}

fn get_task_cmd(task: &Task) -> Vec<&str> {
    let mut task_cmd = vec!["/var/run/flowmium", "task"];
    task_cmd.extend(task.cmd.iter().map(|elem| &elem[..]));

    task_cmd
}

async fn get_env_json(
    env: &EnvVar,
    secrets: &SecretsCrud,
) -> Result<serde_json::Value, ExecutorError> {
    match env {
        EnvVar::KeyValuePair(KeyValuePair { name, value }) => {
            Ok(serde_json::json! ({"name": name, "value": value}))
        }
        EnvVar::SecretRef(SecretRef { name, from_secret }) => {
            Ok(serde_json::json! ({"name": name, "value": secrets.get_secret(from_secret).await?}))
        }
    }
}

async fn get_task_envs<'a>(
    task: &'a Task,
    input_json: String,
    output_json: String,
    flow_id: i32,
    config: &'a ExecutorConfig,
    secrets: &SecretsCrud,
) -> Result<Vec<serde_json::Value>, ExecutorError> {
    let mut task_envs: Vec<serde_json::Value> = vec![
        serde_json::json! ({
            "name": "FLOWMIUM_INPUT_JSON",
            "value": input_json,
        }),
        serde_json::json!( {
            "name": "FLOWMIUM_OUTPUT_JSON",
            "value": output_json,
        }),
        serde_json::json!( {
            "name": "FLOWMIUM_FLOW_ID",
            "value": flow_id.to_string(),
        }),
        serde_json::json!( {
            "name": "FLOWMIUM_ACCESS_KEY",
            "value": config.access_key,
        }),
        serde_json::json!( {
            "name": "FLOWMIUM_SECRET_KEY",
            "value": config.secret_key,
        }),
        serde_json::json!( {
            "name": "FLOWMIUM_BUCKET_NAME",
            "value": config.bucket_name,
        }),
        serde_json::json!( {
            "name": "FLOWMIUM_TASK_STORE_URL",
            "value": config.task_store_url,
        }),
    ];

    for env in task.env.iter() {
        let json_env = get_env_json(env, secrets).await?;
        task_envs.push(json_env);
    }

    Ok(task_envs)
}

#[tracing::instrument(skip(task, config, secrets))]
async fn spawn_task(
    flow_id: i32,
    task_id: i32,
    task: &Task,
    config: &ExecutorConfig,
    secrets: &SecretsCrud,
) -> Result<Job, ExecutorError> {
    tracing::info!("Spawning task");

    let client = get_kubernetes_client().await?;

    let jobs: Api<Job> = Api::namespaced(client, &config.namespace);

    // SAFETY: Flow model types don't implement custom serializer methods or have non string keys
    let input_json = serde_json::to_string(&task.inputs).unwrap();
    let output_json = serde_json::to_string(&task.outputs).unwrap();

    let data = serde_json::from_value(serde_json::json!({
        "apiVersion": "batch/v1",
        "kind": "Job",
        "metadata": {
            "name": format!("flow-{}-task-{}", flow_id, task.name),
        },
        "spec": {
            "template": {
                "metadata": {
                    "name": task.name,
                    "labels": {
                        &config.flow_id_label: flow_id.to_string(),
                        &config.task_id_label: task_id.to_string()
                    }
                },
                "spec": {
                    "initContainers": [
                        {
                            "name": "init",
                            "image": &config.init_container_image,
                            "command": ["/flowmium", "init", "/flowmium", "/var/run/flowmium"],
                            "volumeMounts": [
                                {
                                    "name": "executable",
                                    "mountPath": "/var/run",
                                }
                            ]
                        }
                    ],
                    "containers": [{
                        "name": task.name,
                        "image": task.image,
                        "command": get_task_cmd(task),
                        "env": get_task_envs(task, input_json, output_json, flow_id, config, secrets).await?,
                        "volumeMounts": [
                            {
                                "name": "executable",
                                "mountPath": "/var/run",
                            }
                        ]
                    }],
                    "restartPolicy": "Never",
                    "volumes": [
                        {
                            "name": "executable",
                            "emptyDir": {
                                "medium": "Memory",
                            }
                        }
                    ],
                }
            },
            "backoffLimit": 0,
        }
    }))
    .unwrap();

    match jobs.create(&PostParams::default(), &data).await {
        Ok(job) => Ok(job),
        Err(error) => {
            tracing::error!(%error, "Unable to spawn job");
            Err(ExecutorError::UnableToSpawnTask(error))
        }
    }
}

#[tracing::instrument(skip(config))]
async fn list_pods(
    flow_id: i32,
    task_id: i32,
    config: &ExecutorConfig,
) -> Result<ObjectList<Pod>, ExecutorError> {
    let client = get_kubernetes_client().await?;

    let pods_api: Api<Pod> = Api::namespaced(client, &config.namespace);

    let label_selector = format!(
        "{}={},{}={}",
        config.flow_id_label, flow_id, config.task_id_label, task_id
    );

    let mut list_params = ListParams::default();
    list_params = list_params.labels(&label_selector);

    let pod_list = match pods_api.list(&list_params).await {
        Ok(list) => list,
        Err(error) => {
            tracing::error!(%error, "Unable to list pods");
            return Err(ExecutorError::UnableToConnectToKubernetes(error));
        }
    };

    Ok(pod_list)
}

fn get_pod_phase(pod: Pod) -> Option<String> {
    let pod_status = pod.status?;
    let phase = pod_status.phase?;

    Some(phase)
}

fn phase_to_task_status(phase: &str) -> Option<TaskStatus> {
    match phase {
        "Pending" => Some(TaskStatus::Pending),
        "Running" => Some(TaskStatus::Running),
        "Succeeded" => Some(TaskStatus::Finished),
        "Failed" => Some(TaskStatus::Failed),
        "StartError" => Some(TaskStatus::Failed),
        _ => None,
    }
}

// TODO: Batch these requests
#[tracing::instrument(skip(config))]
async fn get_task_status(
    flow_id: i32,
    task_id: i32,
    config: &ExecutorConfig,
) -> Result<TaskStatus, ExecutorError> {
    let pod_list = list_pods(flow_id, task_id, config).await?;
    let mut pod_iter = pod_list.iter();

    let Some(pod) = pod_iter.next() else {
        tracing::error!("Cannot find corresponding pod for task");
        return Err(ExecutorError::UnexpectedRunnerState(flow_id, task_id));
    };

    if pod_iter.peekable().peek().is_some() {
        tracing::error!("Found duplicate pod for task");
        return Err(ExecutorError::UnexpectedRunnerState(flow_id, task_id));
    }

    let Some(phase) = get_pod_phase(pod.to_owned()) else {
        tracing::error!("Unable to fetch status for pod");
        return Err(ExecutorError::UnexpectedRunnerState(flow_id, task_id));
    };

    let status = phase_to_task_status(&phase);

    let Some(status) = status else {
        tracing::error!("Unknown status for pod");
        return Err(ExecutorError::UnknownTaskStatus(flow_id, task_id, phase));
    };

    Ok(status)
}

/// Create a workflow in pending state that will start running eventually by calling [`crate::executor::schedule_and_run_tasks`].
#[tracing::instrument(skip(sched, flow))]
pub async fn instantiate_flow(flow: Flow, sched: &Scheduler) -> Result<i32, ExecutorError> {
    if flow.name.len() > 32 {
        return Err(ExecutorError::FlowNameTooLong(flow.name.clone()));
    }

    let plan = construct_plan(&flow.tasks)?;

    tracing::info!(flow_name = flow.name, plan = ?plan, "Creating flow");
    let flow_id = sched.create_flow(flow.name, plan, flow.tasks).await?;

    Ok(flow_id)
}

#[tracing::instrument(skip(sched, config, secrets))]
async fn sched_tasks(
    sched: &Scheduler,
    flow_id: i32,
    config: &ExecutorConfig,
    secrets: &SecretsCrud,
) -> Result<bool, ExecutorError> {
    let option_tasks = sched.schedule_tasks(flow_id).await?;

    if let Some(tasks) = option_tasks {
        for (task_id, task) in tasks {
            match spawn_task(flow_id, task_id, &task, config, secrets).await {
                Ok(_) => sched.mark_task_running(flow_id, task_id).await?,
                Err(_) => {
                    // TODO: Add test for below, without below, jobs could get stale on restart
                    sched.mark_task_failed(flow_id, task_id).await?;
                    break;
                }
            }
        }

        return Ok(true);
    }

    Ok(false)
}

#[tracing::instrument(skip(sched, config))]
async fn mark_tasks(
    sched: &Scheduler,
    flow_id: i32,
    task_id: i32,
    config: &ExecutorConfig,
) -> Result<(), SchedulerError> {
    let status = match get_task_status(flow_id, task_id, config).await {
        Ok(status) => status,
        Err(_) => return sched.mark_task_failed(flow_id, task_id).await,
    };

    match status {
        TaskStatus::Pending | TaskStatus::Running => Ok(()),
        TaskStatus::Finished => sched.mark_task_finished(flow_id, task_id).await,
        TaskStatus::Failed => sched.mark_task_failed(flow_id, task_id).await,
    }
}

/// Spawn jobs to make progress pending tasks. Should be called periodically.
#[tracing::instrument(skip(sched, config, secrets))]
pub async fn schedule_and_run_tasks(
    sched: &Scheduler,
    config: &ExecutorConfig,
    secrets: &SecretsCrud,
) {
    if let Ok(flows) = sched.get_running_or_pending_flow_ids().await {
        for (flow_id, running_tasks) in flows {
            match sched_tasks(sched, flow_id, config, secrets).await {
                Ok(true) => continue,
                Ok(false) => (),
                Err(_) => break,
            }

            for task_id in running_tasks {
                if (mark_tasks(sched, flow_id, task_id, config).await).is_err() {
                    break;
                };
            }
        }
    }
}
#[cfg(test)]
mod tests {

    use std::time::Duration;

    use kube::api::DeleteParams;
    use s3::Bucket;
    use serial_test::serial;

    use crate::{
        server::{
            model::{Input, Output},
            pool::get_test_pool,
        },
        task::bucket::get_bucket,
    };

    use super::*;

    fn test_executor_config() -> ExecutorConfig {
        ExecutorConfig {
            store_url: "http://localhost:9000".to_owned(),
            task_store_url: "http://172.16.238.4:9000".to_owned(),
            bucket_name: "flowmium-test".to_owned(),
            access_key: "minio".to_owned(),
            secret_key: "password".to_owned(),
            init_container_image: "registry:5000/flowmium-debug".to_owned(),
            namespace: "default".to_owned(),
            flow_id_label: default_flow_label(),
            task_id_label: default_task_label(),
        }
    }

    async fn delete_all_pods() {
        let client = get_kubernetes_client().await.unwrap();

        let pods_api: Api<Pod> = Api::namespaced(client, "default");

        pods_api
            .delete_collection(&DeleteParams::default(), &ListParams::default())
            .await
            .unwrap();
    }

    async fn delete_all_objects(config: &ExecutorConfig) -> Box<Bucket> {
        let bucket = get_bucket(
            &config.access_key,
            &config.secret_key,
            &config.bucket_name,
            config.store_url.clone(),
        )
        .await
        .unwrap();

        let object_list = bucket
            .list("".to_string(), None)
            .await
            .unwrap()
            .get(0)
            .unwrap()
            .contents
            .clone();

        for obj in object_list {
            bucket.delete_object(obj.key).await.unwrap();
        }

        bucket
    }

    async fn delete_all_jobs() {
        let client = get_kubernetes_client().await.unwrap();

        let jobs_api: Api<Job> = Api::namespaced(client, "default");

        jobs_api
            .delete_collection(&DeleteParams::default(), &ListParams::default())
            .await
            .unwrap();
    }

    async fn get_contents(bucket: &Bucket, path: String) -> String {
        let response_data = bucket.get_object(path).await.unwrap();

        std::str::from_utf8(response_data.bytes())
            .unwrap()
            .to_owned()
    }

    fn test_flow() -> Flow {
        Flow {
            name: "hello-world".to_owned(),
            tasks: vec![
                Task {
                    name: "task-e".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec![],
                    cmd: vec![
                        "sh".to_string(),
                        "-c".to_string(),
                        "echo $GREETINGS >> /greetings-foobar".to_string(),
                    ],
                    env: vec![
                        EnvVar::SecretRef(SecretRef{name: "GREETINGS".to_string(), from_secret: "test-greetings-secret".to_string()})
                    ],
                    inputs: None,
                    outputs: Some(vec![Output {
                        name: "OutputFromTaskE".to_string(),
                        path: "/greetings-foobar".to_string(),
                    }]),
                },
                Task {
                    name: "task-b".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec!["task-d".to_string()],
                    cmd: vec![
                        "sh".to_string(),
                        "-c".to_string(),
                        "cat /task-d-output | sed 's/\\bfoobar\\b/world/g' > /hello-world"
                            .to_string(),
                    ],
                    env: vec![],
                    inputs: Some(vec![Input {
                        from: "OutputFromTaskD".to_string(),
                        path: "/task-d-output".to_string(),
                    }]),
                    outputs: Some(vec![Output {
                        name: "OutputFromTaskB".to_string(),
                        path: "/hello-world".to_string(),
                    }]),
                },
                Task {
                    name: "task-a".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec![
                        "task-b".to_string(),
                        "task-c".to_string(),
                        "task-d".to_string(),
                        "task-e".to_string(),
                    ],
                    cmd: vec![
                        "sh".to_string(),
                        "-c".to_string(),
                        "echo `cat /task-b-output` `cat /task-c-output` `cat /task-d-output` `cat /task-e-output` > /concat-all"
                            .to_string(),
                    ],
                    env: vec![],
                    inputs: Some(vec![
                        Input {
                            from: "OutputFromTaskB".to_string(),
                            path: "/task-b-output".to_string(),
                        },
                        Input {
                            from: "OutputFromTaskC".to_string(),
                            path: "/task-c-output".to_string(),
                        },
                        Input {
                            from: "OutputFromTaskD".to_string(),
                            path: "/task-d-output".to_string(),
                        },
                        Input {
                            from: "OutputFromTaskE".to_string(),
                            path: "/task-e-output".to_string(),
                        },
                    ]),
                    outputs: Some(vec![Output {
                        name: "OutputFromTaskA".to_string(),
                        path: "/concat-all".to_string(),
                    }]),
                },
                Task {
                    name: "task-d".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec!["task-e".to_string()],
                    cmd: vec![
                        "sh".to_string(),
                        "-c".to_string(),
                        "cat /inputs/testing/task-e-output | sed 's/\\bGreetings\\b/Hello/g' > /hello-foobar"
                            .to_string(),
                    ],
                    env: vec![],
                    inputs: Some(vec![Input {
                        from: "OutputFromTaskE".to_string(),
                        path: "/inputs/testing/task-e-output".to_string(),
                    }]),
                    outputs: Some(vec![Output {
                        name: "OutputFromTaskD".to_string(),
                        path: "/hello-foobar".to_string(),
                    }]),
                },
                Task {
                    name: "task-c".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec!["task-d".to_string()],
                    cmd: vec![
                        "sh".to_string(),
                        "-c".to_string(),
                        "cat /task-d-output | sed 's/\\bfoobar\\b/mars/g' > /hello-mars"
                            .to_string(),
                    ],
                    env: vec![],
                    inputs: Some(vec![Input {
                        from: "OutputFromTaskD".to_string(),
                        path: "/task-d-output".to_string(),
                    }]),
                    outputs: Some(vec![Output {
                        name: "OutputFromTaskC".to_string(),
                        path: "/hello-mars".to_string(),
                    }]),
                },
            ],
        }
    }

    #[tokio::test]
    #[serial]
    async fn test_schedule_and_run_tasks() {
        let pool = get_test_pool(&["flows", "secrets"]).await;
        let config = test_executor_config();

        let sched = Scheduler::new(pool.clone());
        let secrets = SecretsCrud::new(pool.clone());

        secrets
            .create_secret("test-greetings-secret", "Greetings foobar")
            .await
            .unwrap();

        // delete_all_pods().await;
        // delete_all_jobs().await;
        let bucket = delete_all_objects(&config).await;

        let flow_id = instantiate_flow(test_flow(), &sched).await.unwrap();

        for _ in 0..50 {
            tokio::time::sleep(Duration::from_millis(1000)).await;
            schedule_and_run_tasks(&sched, &config, &secrets).await;
        }

        for task_id in 0..5 {
            assert_eq!(
                get_task_status(flow_id, task_id, &config).await.unwrap(),
                TaskStatus::Finished
            )
        }

        assert_eq!(
            get_contents(&bucket, format!("{}/OutputFromTaskA", flow_id)).await,
            "Hello world Hello mars Hello foobar Greetings foobar\n"
        );
        assert_eq!(
            get_contents(&bucket, format!("{}/OutputFromTaskB", flow_id)).await,
            "Hello world\n"
        );
        assert_eq!(
            get_contents(&bucket, format!("{}/OutputFromTaskC", flow_id)).await,
            "Hello mars\n"
        );
        assert_eq!(
            get_contents(&bucket, format!("{}/OutputFromTaskD", flow_id)).await,
            "Hello foobar\n"
        );
        assert_eq!(
            get_contents(&bucket, format!("{}/OutputFromTaskE", flow_id)).await,
            "Greetings foobar\n"
        );
    }

    fn test_flow_fail() -> Flow {
        Flow {
            name: "hello-world".to_owned(),
            tasks: vec![
                Task {
                    name: "task-one".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec!["task-two".to_string()],
                    cmd: vec!["exit".to_string(), "1".to_string()],
                    env: vec![],
                    inputs: None,
                    outputs: None,
                },
                Task {
                    name: "task-zero".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec!["task-one".to_string()],
                    cmd: vec!["sleep".to_string(), "0.01".to_string()],
                    env: vec![],
                    inputs: None,
                    outputs: None,
                },
                Task {
                    name: "task-two".to_string(),
                    image: "ubuntu:latest".to_string(),
                    depends: vec![],
                    cmd: vec!["sleep".to_string(), "0.01".to_string()],
                    env: vec![],
                    inputs: None,
                    outputs: None,
                },
            ],
        }
    }

    #[tokio::test]
    #[serial]
    async fn test_schedule_and_run_tasks_fail() {
        delete_all_pods().await;
        delete_all_jobs().await;

        let pool = get_test_pool(&["flows", "secrets"]).await;
        let config = test_executor_config();

        let sched = Scheduler::new(pool.clone());
        let secrets = SecretsCrud::new(pool.clone());

        let flow_id = instantiate_flow(test_flow_fail(), &sched).await.unwrap();

        for _ in 0..30 {
            tokio::time::sleep(Duration::from_millis(1000)).await;
            schedule_and_run_tasks(&sched, &config, &secrets).await;
        }

        assert_eq!(
            get_task_status(flow_id, 2, &config).await.unwrap(),
            TaskStatus::Finished
        );

        assert_eq!(
            get_task_status(flow_id, 0, &config).await.unwrap(),
            TaskStatus::Failed
        );

        match get_task_status(flow_id, 1, &config).await {
            Err(ExecutorError::UnexpectedRunnerState(..)) => (),
            _ => panic!(),
        }
    }
}