oxicuda-vision 0.2.0

Vision Transformer & CLIP primitives for OxiCUDA: ViT patch embedding, multi-head self-attention, CLIP contrastive learning, FPN, RoI align, DETR decoder — pure Rust, zero CUDA SDK dependency.

Documentation

//! Inference-time optimization passes for vision models.

pub mod bn_folding;

pub use bn_folding::{BnParams, fold_bn_into_conv, fold_bn_into_linear, verify_bn_fold};