kyro 0.1.1

A high-performance ML inference engine

#![allow(dead_code)]

pub mod awq;
pub mod fp8;

use candle_core::{Result, Tensor};

pub trait QuantizedLayer {
    fn forward(&self, x: &Tensor) -> Result<Tensor>;
    fn unpack_weights(&self) -> Result<Tensor>;
}