burn-lm-cli 0.0.1

use crate::utils::ensure_cargo_crate_is_installed;

pub(crate) fn create() -> clap::Command {
    let mut root = clap::Command::new("server").about("Run a simple OpenAI API compatible server");
    let run = clap::Command::new("run")
        .about("Run an OpenAI API compatible server")
        .arg(
            clap::Arg::new("port")
                .long("port")
                .value_parser(clap::value_parser!(u16))
                .default_value("3001")
                .required(false)
                .help("The listening port for the server"),
        );
    root = root.subcommand(run);
    root
}

pub(crate) fn handle(
    args: &clap::ArgMatches,
    backend: &str,
    dtype: &str,
) -> super::HandleCommandResult {
    match args.subcommand_name() {
        Some("run") => run(args, backend, dtype),
        _ => {
            create().print_help().unwrap();
            Ok(None)
        }
    }
}

fn install_dependencies() -> super::HandleCommandResult {
    ensure_cargo_crate_is_installed("cargo-watch", None, None, true)
}

fn run(args: &clap::ArgMatches, backend: &str, dtype: &str) -> super::HandleCommandResult {
    install_dependencies()?;
    let run_args = args.subcommand_matches("run").unwrap();
    let port = run_args.get_one::<u16>("port").unwrap();
    let port_string = port.to_string();
    let inference_feature = format!("burn-lm-inference/{backend},burn-lm-inference/{dtype}");
    let common_args = vec![
        "--release",
        "--package",
        "burn-lm-http",
        "--bin",
        "burn-lm-http",
        "--quiet",
        "--features",
        &inference_feature,
    ];
    let mut build_args = vec!["build"];
    build_args.extend(common_args.clone());
    let mut watch_args = vec!["watch", "-q", "-c", "-w", "crates/", "-x"];
    let mut run_args = vec!["run"];
    run_args.extend(common_args.clone());
    run_args.extend(vec!["--", "run", "--port", &port_string]);
    let run_args = run_args.join(" ").to_string();
    watch_args.push(&run_args);
    let mut spin_msg =
        super::SpinningMessage::new(&format!("compiling {backend} server..."), "server ready!");
    // build server
    let build_output = std::process::Command::new("cargo")
        .args(&build_args)
        .output()
        .expect("build command should compile burnlm-http successfully");
    // build step results
    let stderr_text = String::from_utf8_lossy(&build_output.stderr);
    if !stderr_text.is_empty() {
        println!("{stderr_text}");
    }
    if !build_output.status.success() {
        std::process::exit(build_output.status.code().unwrap_or(1));
    }
    // stop the spinner
    spin_msg.end(false);
    // run server
    let watch_status = std::process::Command::new("cargo")
        .args(&watch_args)
        .status()
        .expect("burnlm-http should execute successfully while being watched");
    std::process::exit(watch_status.code().unwrap_or(1));
}