rend3-routine 0.3.0

use glam::{Mat4, Vec3};
use rend3::{
    managers::{CameraManager, InternalObject, MaterialManager, ObjectManager},
    types::Material,
    util::frustum::ShaderFrustum,
    ProfileData,
};
use wgpu::{
    util::{BufferInitDescriptor, DeviceExt},
    BufferUsages, Device, RenderPass,
};

use crate::{
    common::{PerObjectDataAbi, Sorting},
    culling::CulledObjectSet,
};

/// All the information needed to dispatch a CPU draw call.
#[derive(Debug, Clone)]
pub struct CpuDrawCall {
    pub start_idx: u32,
    pub end_idx: u32,
    pub vertex_offset: i32,
    pub material_index: u32,
}

/// Do all object culling on the CPU and upload the per-object data to the GPU.
pub fn cull_cpu<M: Material>(
    device: &Device,
    camera: &CameraManager,
    objects: &ObjectManager,
    sorting: Option<Sorting>,
    key: u64,
) -> CulledObjectSet {
    profiling::scope!("CPU Culling");
    let frustum = ShaderFrustum::from_matrix(camera.proj());
    let view = camera.view();
    let view_proj = camera.view_proj();

    let objects = objects.get_objects::<M>(key);

    let objects = crate::common::sort_objects(objects, camera, sorting);

    let (mut outputs, calls) = cull_internal(&objects, frustum, view, view_proj);

    assert_eq!(calls.len(), outputs.len());

    if outputs.is_empty() {
        // Dummy data
        outputs.push(PerObjectDataAbi {
            model_view: Mat4::ZERO,
            model_view_proj: Mat4::ZERO,
            pad0: [0; 12],
            material_idx: 0,
            inv_squared_scale: Vec3::ZERO,
        });
    }

    let output_buffer = device.create_buffer_init(&BufferInitDescriptor {
        label: Some("culling output"),
        contents: bytemuck::cast_slice(&outputs),
        usage: BufferUsages::STORAGE,
    });

    CulledObjectSet {
        calls: ProfileData::Cpu(calls),
        output_buffer,
    }
}

fn cull_internal(
    objects: &[InternalObject],
    frustum: ShaderFrustum,
    view: Mat4,
    view_proj: Mat4,
) -> (Vec<PerObjectDataAbi>, Vec<CpuDrawCall>) {
    let mut outputs = Vec::with_capacity(objects.len());
    let mut calls = Vec::with_capacity(objects.len());

    for object in objects {
        let model = object.input.transform;
        let model_view = view * model;

        let transformed = object.input.bounding_sphere.apply_transform(model_view);
        if !frustum.contains_sphere(transformed) {
            continue;
        }

        let model_view_proj = view_proj * model;

        calls.push(CpuDrawCall {
            start_idx: object.input.start_idx,
            end_idx: object.input.start_idx + object.input.count,
            vertex_offset: object.input.vertex_offset,
            material_index: object.input.material_index,
        });

        let squared_scale = Vec3::new(
            model_view.x_axis.truncate().length_squared(),
            model_view.y_axis.truncate().length_squared(),
            model_view.z_axis.truncate().length_squared(),
        );

        let inv_squared_scale = squared_scale.recip();

        outputs.push(PerObjectDataAbi {
            model_view,
            model_view_proj,
            material_idx: 0,
            pad0: [0; 12],
            inv_squared_scale,
        });
    }

    (outputs, calls)
}

/// Draw the given cpu draw calls.
///
/// No-op if there are 0 objects.
pub fn draw_cpu_powered<'rpass, M: Material>(
    rpass: &mut RenderPass<'rpass>,
    draws: &'rpass [CpuDrawCall],
    materials: &'rpass MaterialManager,
    material_binding_index: u32,
) {
    let mut previous_mat_handle = None;
    for (idx, draw) in draws.iter().enumerate() {
        if previous_mat_handle != Some(draw.material_index) {
            previous_mat_handle = Some(draw.material_index);
            // TODO(material): only resolve the archetype lookup once
            let (_, internal) = materials.get_internal_material_full_by_index::<M>(draw.material_index as usize);

            // TODO: GL always gets linear sampling.

            rpass.set_bind_group(material_binding_index, internal.bind_group.as_ref().as_cpu(), &[]);
        }
        let idx = idx as u32;
        rpass.draw_indexed(draw.start_idx..draw.end_idx, draw.vertex_offset, idx..idx + 1);
    }
}