pub unsafe extern "C" fn llama_decode(
    ctx: *mut llama_context,
    batch: llama_batch
) -> i32