Struct NonContiguousCategoricalEncoderModel

Source

pub struct NonContiguousCategoricalEncoderModel<Symbol, Probability, const PRECISION: usize>where
    Symbol: Hash,
    Probability: BitArray,
{ /* private fields */ }

Expand description

An entropy model for a categorical probability distribution over arbitrary symbols, for encoding only.

You will usually want to use this type through one of its type aliases, DefaultNonContiguousCategoricalEncoderModel or SmallNonContiguousCategoricalEncoderModel, see discussion of presets.

This type implements the trait EncoderModel but not the trait DecoderModel. Thus, you can use a NonContiguousCategoricalEncoderModel for encoding with any of the stream encoders provided by the constriction crate, but not for decoding. If you want to decode data, use a NonContiguousCategoricalDecoderModel instead.

§Example

use constriction::{
    stream::{stack::DefaultAnsCoder, Decode},
    stream::model::DefaultNonContiguousCategoricalEncoderModel,
    stream::model::DefaultNonContiguousCategoricalDecoderModel,
    UnwrapInfallible,
};

// Create a `ContiguousCategoricalEntropyModel` that approximates floating point probabilities.
let alphabet = ['M', 'i', 's', 'p', '!'];
let probabilities = [0.09, 0.36, 0.36, 0.18, 0.0];
let encoder_model = DefaultNonContiguousCategoricalEncoderModel
    ::from_symbols_and_floating_point_probabilities_fast(
        alphabet.iter().cloned(),
        &probabilities,
        None
    )
    .unwrap();
assert_eq!(encoder_model.support_size(), 5); // `encoder_model` supports 4 symbols.

// Use `encoder_model` for entropy coding.
let message = "Mississippi!";
let mut ans_coder = DefaultAnsCoder::new();
ans_coder.encode_iid_symbols_reverse(message.chars(), &encoder_model).unwrap();
// Note that `message` contains the symbol '!', which has zero probability under our
// floating-point model. However, we can still encode the symbol because the
// `NonContiguousCategoricalEntropyModel` is "leaky", i.e., it assigns a nonzero
// probability to all symbols that we provided to the constructor.

// Create a matching `decoder_model`, decode the encoded message, and verify correctness.
let decoder_model = DefaultNonContiguousCategoricalDecoderModel
    ::from_symbols_and_floating_point_probabilities_fast(
        &alphabet, &probabilities, None
    )
    .unwrap();

// We could pass `decoder_model` by reference (like we did for `encoder_model` above) but
// passing `decoder_model.as_view()` is slightly more efficient.
let decoded = ans_coder
    .decode_iid_symbols(12, decoder_model.as_view())
    .collect::<Result<String, _>>()
    .unwrap_infallible();
assert_eq!(decoded, message);
assert!(ans_coder.is_empty());

// The `encoder_model` assigns zero probability to any symbols that were not provided to its
// constructor, so trying to encode a message that contains such a symbol will fail.
assert!(ans_coder.encode_iid_symbols_reverse("Mix".chars(), &encoder_model).is_err())
// ERROR: symbol 'x' is not in the support of `encoder_model`.

§When Should I Use This Type of Entropy Model?

Use a NonContiguousCategoricalEncoderModel for probabilistic models that can only be represented as an explicit probability table, and not by some more compact analytic expression.

Use a NonContiguousCategoricalDecoderModel for probabilistic models that can only be represented as an explicit probability table, and not by some more compact analytic expression.

If you have a probability model that can be expressed by some analytical expression (e.g., a Binomial distribution), then use LeakyQuantizer instead (unless you want to encode lots of symbols with the same entropy model, in which case the explicitly tabulated representation of a categorical entropy model could improve runtime performance).
If the support of your probabilistic model (i.e., the set of symbols to which the model assigns a non-zero probability) is a contiguous range of integers starting at zero, then it is better to use a ContiguousCategoricalEntropyModel. It has better computational efficiency and it is easier to use since it supports both encoding and decoding with a single type.
If you want to encode only a few symbols with a given probability model, then use a LazyContiguousCategoricalEntropyModel, which will be faster (use HashMap to first map from your noncontiguous support to indices in a contiguous range 0..N, where N is the size of your support). This use case occurs, e.g., in autoregressive models, where each individual model is often used for only exactly one symbol.

§Computational Efficiency

For a probability distribution with a support of N symbols, a NonContiguousCategoricalEncoderModel has the following asymptotic costs:

creation:
- runtime cost: Θ(N log(N)) (when creating with the ..._fast constructor);
- memory footprint: Θ(N);
encoding a symbol (calling EncoderModel::left_cumulative_and_probability):
- expected runtime cost: Θ(1) (worst case can be more expensive, uses a HashMap under the hood).
- memory footprint: no heap allocations, constant stack space.
decoding a symbol: not supported; use a NonContiguousCategoricalDecoderModel.

constructor used for encoding → ↓ constructor used for decoding ↓	legacy (this one)	`..._perfect`	`..._fast`
legacy	✅ compatible	✅ compatible	❌ incompatible
`..._perfect`	✅ compatible	✅ compatible	❌ incompatible
`..._fast`	❌ incompatible	❌ incompatible	✅ compatible

Struct NonContiguousCategoricalEncoderModelCopy item path

§Example

§When Should I Use This Type of Entropy Model?

§Computational Efficiency

Implementations§

impl<Symbol, Probability, const PRECISION: usize> NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Hash + Eq, Probability: BitArray,

§See also

pub fn from_symbols_and_floating_point_probabilities_perfect<F>( symbols: impl IntoIterator<Item = Symbol>, probabilities: &[F], ) -> Result<Self, ()>where F: FloatCore + Sum<F> + Into<f64>, Probability: Into<f64> + AsPrimitive<usize>, f64: AsPrimitive<Probability>, usize: AsPrimitive<Probability>,

pub fn from_symbols_and_floating_point_probabilities<F>( symbols: impl IntoIterator<Item = Symbol>, probabilities: &[F], ) -> Result<Self, ()>where F: FloatCore + Sum<F> + Into<f64>, Probability: Into<f64> + AsPrimitive<usize>, f64: AsPrimitive<Probability>, usize: AsPrimitive<Probability>,

§Upgrade Instructions

§Compatibility Table

pub fn from_symbols_and_nonzero_fixed_point_probabilities<S, P>( symbols: S, probabilities: P, infer_last_probability: bool, ) -> Result<Self, ()>where S: IntoIterator<Item = Symbol>, P: IntoIterator, P::Item: Borrow<Probability>,

pub fn from_iterable_entropy_model<'m, M>(model: &'m M) -> Selfwhere M: IterableEntropyModel<'m, PRECISION, Symbol = Symbol, Probability = Probability> + ?Sized,

pub fn support_size(&self) -> usize

pub fn entropy_base2<F>(&self) -> Fwhere F: Float + Sum, Probability: Into<F>,

Trait Implementations§

impl<Symbol, Probability, const PRECISION: usize> Clone for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Hash + Clone, Probability: BitArray + Clone, Probability::NonZero: Clone,

fn clone( &self, ) -> NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>

fn clone_from(&mut self, source: &Self)

impl<Symbol, Probability, const PRECISION: usize> Debug for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Hash + Debug, Probability: BitArray + Debug, Probability::NonZero: Debug,

fn fmt(&self, f: &mut Formatter<'_>) -> Result

impl<Symbol, Probability, const PRECISION: usize> EncoderModel<PRECISION> for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Hash + Eq, Probability: BitArray,

fn left_cumulative_and_probability( &self, symbol: impl Borrow<Self::Symbol>, ) -> Option<(Self::Probability, Probability::NonZero)>

fn floating_point_probability<F>(&self, symbol: Self::Symbol) -> Fwhere F: FloatCore, Self::Probability: Into<F>,

impl<Symbol, Probability, const PRECISION: usize> EntropyModel<PRECISION> for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Hash, Probability: BitArray,

type Probability = Probability

type Symbol = Symbol

impl<'m, Symbol, Probability, M, const PRECISION: usize> From<&'m M> for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Hash + Eq, Probability: BitArray, M: IterableEntropyModel<'m, PRECISION, Symbol = Symbol, Probability = Probability> + ?Sized,

fn from(model: &'m M) -> Self

Auto Trait Implementations§

impl<Symbol, Probability, const PRECISION: usize> Freeze for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>

impl<Symbol, Probability, const PRECISION: usize> RefUnwindSafe for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: RefUnwindSafe, Probability: RefUnwindSafe, <Probability as BitArray>::NonZero: RefUnwindSafe,

impl<Symbol, Probability, const PRECISION: usize> Send for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Send, Probability: Send, <Probability as BitArray>::NonZero: Send,

impl<Symbol, Probability, const PRECISION: usize> Sync for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Sync, Probability: Sync, <Probability as BitArray>::NonZero: Sync,

impl<Symbol, Probability, const PRECISION: usize> Unpin for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: Unpin, Probability: Unpin, <Probability as BitArray>::NonZero: Unpin,

impl<Symbol, Probability, const PRECISION: usize> UnwindSafe for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>where Symbol: UnwindSafe, Probability: UnwindSafe, <Probability as BitArray>::NonZero: UnwindSafe,

Blanket Implementations§

impl<T> Any for Twhere T: 'static + ?Sized,

fn type_id(&self) -> TypeId

impl<T> Borrow<T> for Twhere T: ?Sized,

fn borrow(&self) -> &T

impl<T> BorrowMut<T> for Twhere T: ?Sized,

fn borrow_mut(&mut self) -> &mut T

impl<T> CloneToUninit for Twhere T: Clone,

unsafe fn clone_to_uninit(&self, dest: *mut u8)

impl<T> From<T> for T

fn from(t: T) -> T

impl<T, U> Into<U> for Twhere U: From<T>,

fn into(self) -> U

impl<T> ToOwned for Twhere T: Clone,

type Owned = T

fn to_owned(&self) -> T

fn clone_into(&self, target: &mut T)

impl<T, U> TryFrom<U> for Twhere U: Into<T>,

type Error = Infallible

fn try_from(value: U) -> Result<T, <T as TryFrom<U>>::Error>

impl<T, U> TryInto<U> for Twhere U: TryFrom<T>,

type Error = <U as TryFrom<T>>::Error

fn try_into(self) -> Result<U, <U as TryFrom<T>>::Error>

Struct NonContiguousCategoricalEncoderModel

impl<Symbol, Probability, const PRECISION: usize> NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Hash + Eq, Probability: BitArray,

pub fn from_symbols_and_floating_point_probabilities<F>( symbols: impl IntoIterator<Item = Symbol>, probabilities: &[F], ) -> Result<Self, ()>
where F: FloatCore + Sum<F> + Into<f64>, Probability: Into<f64> + AsPrimitive<usize>, f64: AsPrimitive<Probability>, usize: AsPrimitive<Probability>,

pub fn from_symbols_and_nonzero_fixed_point_probabilities<S, P>( symbols: S, probabilities: P, infer_last_probability: bool, ) -> Result<Self, ()>
where S: IntoIterator<Item = Symbol>, P: IntoIterator, P::Item: Borrow<Probability>,

pub fn from_iterable_entropy_model<'m, M>(model: &'m M) -> Self
where M: IterableEntropyModel<'m, PRECISION, Symbol = Symbol, Probability = Probability> + ?Sized,

pub fn entropy_base2<F>(&self) -> F
where F: Float + Sum, Probability: Into<F>,

impl<Symbol, Probability, const PRECISION: usize> Clone for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Hash + Clone, Probability: BitArray + Clone, Probability::NonZero: Clone,

impl<Symbol, Probability, const PRECISION: usize> Debug for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Hash + Debug, Probability: BitArray + Debug, Probability::NonZero: Debug,

impl<Symbol, Probability, const PRECISION: usize> EncoderModel<PRECISION> for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Hash + Eq, Probability: BitArray,

fn floating_point_probability<F>(&self, symbol: Self::Symbol) -> F
where F: FloatCore, Self::Probability: Into<F>,

impl<Symbol, Probability, const PRECISION: usize> EntropyModel<PRECISION> for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Hash, Probability: BitArray,

impl<'m, Symbol, Probability, M, const PRECISION: usize> From<&'m M> for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Hash + Eq, Probability: BitArray, M: IterableEntropyModel<'m, PRECISION, Symbol = Symbol, Probability = Probability> + ?Sized,

impl<Symbol, Probability, const PRECISION: usize> RefUnwindSafe for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: RefUnwindSafe, Probability: RefUnwindSafe, <Probability as BitArray>::NonZero: RefUnwindSafe,

impl<Symbol, Probability, const PRECISION: usize> Send for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Send, Probability: Send, <Probability as BitArray>::NonZero: Send,

impl<Symbol, Probability, const PRECISION: usize> Sync for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Sync, Probability: Sync, <Probability as BitArray>::NonZero: Sync,

impl<Symbol, Probability, const PRECISION: usize> Unpin for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: Unpin, Probability: Unpin, <Probability as BitArray>::NonZero: Unpin,

impl<Symbol, Probability, const PRECISION: usize> UnwindSafe for NonContiguousCategoricalEncoderModel<Symbol, Probability, PRECISION>
where Symbol: UnwindSafe, Probability: UnwindSafe, <Probability as BitArray>::NonZero: UnwindSafe,

impl<T> Any for T
where T: 'static + ?Sized,

impl<T> Borrow<T> for T
where T: ?Sized,

impl<T> BorrowMut<T> for T
where T: ?Sized,

impl<T> CloneToUninit for T
where T: Clone,

impl<T, U> Into<U> for T
where U: From<T>,

impl<T> ToOwned for T
where T: Clone,

impl<T, U> TryFrom<U> for T
where U: Into<T>,

impl<T, U> TryInto<U> for T
where U: TryFrom<T>,