sipp-rs 0.1.0 - Docs.rs

mod inference_config;
mod scheduler_policy;

pub use inference_config::{
    CacheRuntimeConfig, ContextRuntimeConfig, FlashAttentionMode, GenerateOptions, GpuLayerConfig,
    KvCacheType, KvReuseMode, LogitBias, ModelPlacementConfig, MultimodalRuntimeConfig,
    NativeRuntimeConfig, ObservabilityRuntimeConfig, ResidencyRuntimeConfig, ResolvedRuntimeLimits,
    RopeScaling, SamplerStage, SamplingRuntimeConfig, SamplingRuntimeOverride,
    SchedulerRuntimeConfig, SplitMode, DEFAULT_CONTEXT_KEY, DEFAULT_MAX_TOKENS,
};
pub use scheduler_policy::{SchedulerPolicyConfig, SchedulerPolicyMode, SchedulerTickBudget};