fluvio 0.50.1 - Docs.rs

use std::sync::Arc;

use adaptive_backoff::prelude::{
    Backoff, BackoffBuilder, ExponentialBackoff, ExponentialBackoffBuilder,
};
use async_lock::RwLock;
use fluvio_types::defaults::{
    RECONNECT_BACKOFF_FACTOR, RECONNECT_BACKOFF_MAX_DURATION, RECONNECT_BACKOFF_MIN_DURATION,
};
use tracing::{debug, info, instrument, error, trace};

use fluvio_protocol::record::ReplicaKey;
use fluvio_protocol::record::{RawRecords, Batch};
use fluvio_spu_schema::produce::{DefaultPartitionRequest, DefaultTopicRequest, DefaultProduceRequest};
use fluvio_future::timer::sleep;
use fluvio_types::SpuId;
use fluvio_types::event::StickyEvent;

use crate::error::{Result, FluvioError};
use crate::metrics::ClientMetrics;
use crate::producer::accumulator::ProducePartitionResponseFuture;
use crate::producer::config::DeliverySemantic;
use fluvio_socket::VersionedSerialSocket;
use crate::spu::SpuPool;
use crate::TopicProducerConfig;

use super::{
    PartitionProducerParams, ProduceCompletionBatchEvent, SharedProducerCallback, ProducerError,
};
use super::accumulator::{BatchEvents, BatchesDeque};
use super::event::EventHandler;

/// Struct that is responsible for sending produce requests to the SPU in a given partition.
pub(crate) struct PartitionProducer<S>
where
    S: SpuPool + Send + Sync + 'static,
{
    config: Arc<TopicProducerConfig>,
    replica: ReplicaKey,
    spu_pool: Arc<S>,
    batches_lock: Arc<BatchesDeque>,
    batch_events: Arc<BatchEvents>,
    last_error: Arc<RwLock<Option<ProducerError>>>,
    metrics: Arc<ClientMetrics>,
    callback: Option<SharedProducerCallback>,
}

impl<S> PartitionProducer<S>
where
    S: SpuPool + Send + Sync + 'static,
{
    fn new(
        params: PartitionProducerParams<S>,
        replica: ReplicaKey,
        last_error: Arc<RwLock<Option<ProducerError>>>,
    ) -> Self {
        Self {
            config: params.config,
            replica,
            spu_pool: params.spu_pool,
            batches_lock: params.batches_deque,
            batch_events: params.batch_events,
            last_error,
            metrics: params.client_metric,
            callback: params.callback,
        }
    }

    pub fn shared(
        params: PartitionProducerParams<S>,
        replica: ReplicaKey,
        error: Arc<RwLock<Option<ProducerError>>>,
    ) -> Arc<Self> {
        Arc::new(PartitionProducer::new(params, replica, error))
    }

    pub(crate) fn start(
        params: PartitionProducerParams<S>,
        error: Arc<RwLock<Option<ProducerError>>>,
        end_event: Arc<StickyEvent>,
        flush_event: (Arc<EventHandler>, Arc<EventHandler>),
        replica: ReplicaKey,
    ) {
        let producer = PartitionProducer::shared(params, replica, error);
        fluvio_future::task::spawn(async move {
            producer.run(end_event, flush_event).await;
        });
    }

    #[instrument(skip(self, end_event, flush_event))]
    async fn run(
        &self,
        end_event: Arc<StickyEvent>,
        flush_event: (Arc<EventHandler>, Arc<EventHandler>),
    ) {
        use tokio::select;

        let mut linger_sleep = None;

        loop {
            select! {
                _ = end_event.listen() => {
                    info!("partition producer end event received");
                    break;
                },
                _ = flush_event.0.listen() => {

                    debug!("flush event received");
                    if let Err(e) = self.flush(true).await {
                        error!("Failed to flush producer: {}", e);
                        self.set_error(e).await;
                    }
                    flush_event.1.notify().await;
                    linger_sleep = None;

                }
                _ =  self.batch_events.listen_batch_full() => {
                    debug!("batch full event");
                    if let Err(e) = self.flush(false).await {
                        error!("Failed to flush producer: {}", e);
                        self.set_error(e).await;
                    }
                }

                _ = self.batch_events.listen_new_batch() => {
                    debug!("new batch event");
                    linger_sleep = Some(sleep(self.config.linger));
                }

                _ = async { linger_sleep.as_mut().expect("unexpected failure").await }, if linger_sleep.is_some() => {
                    debug!("Flushing because linger time was reached");

                    if let Err(e) = self.flush(false).await {
                        error!("Failed to flush producer: {:?}", e);
                        self.set_error(e).await;
                    }
                    linger_sleep = None;
                }
            }
        }
        info!("partition producer end");
    }

    async fn set_error(&self, error: FluvioError) {
        let mut error_handle = self.last_error.write().await;
        *error_handle = Some(ProducerError::Internal(error.to_string()));
    }

    async fn current_leader(&self) -> Result<SpuId> {
        let partition_spec = self
            .spu_pool
            .partitions()
            .lookup_by_key(&self.replica)
            .await?
            .ok_or_else(|| {
                FluvioError::PartitionNotFound(
                    self.replica.topic.to_string(),
                    self.replica.partition,
                )
            })?
            .spec;
        Ok(partition_spec.leader)
    }

    /// Flush all the batches that are full or have reached the linger time.
    /// If force is set to true, flush all batches regardless of linger time.
    pub(crate) async fn flush(&self, force: bool) -> Result<()> {
        let spu_socket = self.connect_spu_with_reconnect().await?;

        let mut batches_ready = vec![];
        {
            let mut batches = self.batches_lock.batches.write().await;
            while !batches.is_empty() {
                let ready = force
                    || batches.front().is_some_and(|batch| {
                        batch.is_full() || batch.elapsed() as u128 >= self.config.linger.as_millis()
                    });
                if ready {
                    if let Some(batch) = batches.pop_front() {
                        batches_ready.push(batch);
                        self.batches_lock.free_space_event.notify(1);
                    }
                } else {
                    break;
                }
            }
        }

        // Send each batch and notify base offset
        let mut request = DefaultProduceRequest::default();

        let mut topic_request = DefaultTopicRequest {
            name: self.replica.topic.to_string(),
            ..Default::default()
        };

        let mut batch_notifiers = vec![];

        let mut events_to_callback = vec![];

        for p_batch in batches_ready {
            let mut partition_request = DefaultPartitionRequest {
                partition_index: self.replica.partition,
                ..Default::default()
            };
            let notify = p_batch.notify.clone();
            let metadata = p_batch.metadata().clone();
            let batch = p_batch.batch();

            let raw_batch: Batch<RawRecords> = batch.try_into()?;

            let producer_metrics = self.metrics.producer_client();
            let records_len = raw_batch.records_len() as u64;
            let bytes_size = raw_batch.batch_len() as u64;
            producer_metrics.add_records(records_len);
            producer_metrics.add_bytes(bytes_size);

            partition_request.records.batches.push(raw_batch);
            batch_notifiers.push(notify);
            topic_request.partitions.push(partition_request);

            if self.callback.is_some() {
                let created_at = metadata.created_at;
                let elapsed = created_at.elapsed();
                let event = ProduceCompletionBatchEvent {
                    created_at,
                    partition: self.replica.partition,
                    bytes_size,
                    records_len,
                    elapsed,
                };

                events_to_callback.push(event);
            }
        }

        request.isolation = self.config.isolation;
        request.timeout = self.config.timeout;
        request.smartmodules.clone_from(&self.config.smartmodules);
        request.topics.push(topic_request);

        let (response, _) = self.send_to_socket(spu_socket, request).await?;

        for (batch_notifier, partition_response_fut) in
            batch_notifiers.into_iter().zip(response.into_iter())
        {
            if let Err(_e) = batch_notifier.send(partition_response_fut).await {
                trace!("Failed to notify produce result because receiver was dropped");
            }
        }

        if let Some(callback) = self.callback.clone() {
            for event in events_to_callback {
                if let Err(e) = callback.finished(event).await {
                    error!("Failed to send event to callback: {}", e);
                }
            }
        }

        Ok(())
    }

    async fn connect_spu(&self) -> Result<VersionedSerialSocket> {
        let leader = self.current_leader().await?;
        self.spu_pool.create_serial_socket_from_leader(leader).await
    }

    async fn connect_spu_with_reconnect(&self) -> Result<VersionedSerialSocket> {
        let mut backoff = create_backoff().map_err(|e| FluvioError::Other(e.to_string()))?;
        loop {
            match self.connect_spu().await {
                Ok(socket) => {
                    backoff.reset();
                    return Ok(socket);
                }
                Err(err) => {
                    error!("Failed to connect to leader: {}", err);
                    backoff_and_wait(&mut backoff).await;
                }
            }
        }
    }

    async fn send_to_socket(
        &self,
        socket: VersionedSerialSocket,
        request: DefaultProduceRequest,
    ) -> Result<(Vec<ProducePartitionResponseFuture>, Option<i64>)> {
        let partition_count: usize = request.topics.iter().map(|t| t.partitions.len()).sum();
        let mut last_offset = None;
        trace!(%partition_count, ?self.config.delivery_semantic);
        let response: Vec<ProducePartitionResponseFuture> = match self.config.delivery_semantic {
            DeliverySemantic::AtMostOnce => {
                use futures_util::FutureExt;
                let async_response = socket.send_async(request).await?;
                let shared = FutureExt::map(async_response, Arc::new).boxed().shared();
                (0..partition_count)
                    .map(|index| ProducePartitionResponseFuture::from(shared.clone(), index))
                    .collect()
            }
            DeliverySemantic::AtLeastOnce(policy) => {
                use fluvio_future::retry::RetryExt;
                let produce_response = socket
                    .send_receive_with_retry(request, policy.iter())
                    .timeout(policy.timeout)
                    .await
                    .map_err(|timeout_err| FluvioError::Producer(timeout_err.into()))??;

                let mut futures = Vec::with_capacity(partition_count);
                for topic in produce_response.responses.into_iter() {
                    for partition in topic.partitions {
                        futures.push(ProducePartitionResponseFuture::ready(
                            partition.base_offset,
                            partition.error_code,
                        ));
                        last_offset = Some(partition.base_offset);
                    }
                }
                futures
            }
        };
        Ok((response, last_offset))
    }
}

/// Creates an exponential backoff configuration.
fn create_backoff() -> anyhow::Result<ExponentialBackoff> {
    ExponentialBackoffBuilder::default()
        .factor(RECONNECT_BACKOFF_FACTOR)
        .min(RECONNECT_BACKOFF_MIN_DURATION)
        .max(RECONNECT_BACKOFF_MAX_DURATION)
        .build()
}

/// Waits for the duration determined by the exponential backoff.
async fn backoff_and_wait(backoff: &mut ExponentialBackoff) {
    let wait_duration = backoff.wait();
    info!(
        seconds = wait_duration.as_secs(),
        "Starting backoff: sleeping for duration"
    );
    let _ = sleep(wait_duration).await;
    debug!("Resuming after backoff");
}