mistralrs-core 0.8.1

Fast, flexible LLM inference.

mod experts;

use mistralrs_quant::Shard;

pub use experts::{MoEExperts, MoEExpertsConfig};

pub fn shard(dim: usize, rank: usize, world_size: usize) -> Shard {
    Shard::Simple {
        dim,
        rank,
        world_size,
    }
}