moose 0.2.2 - Docs.rs

//! Support for division

use super::*;

impl DivOp {
    pub(crate) fn rep_rep_kernel<S: Session, RepRingT, MirRingT, ShapeT>(
        sess: &S,
        rep: &ReplicatedPlacement,
        x: RepFixedTensor<RepRingT>,
        y: RepFixedTensor<RepRingT>,
    ) -> Result<RepFixedTensor<RepRingT>>
    where
        RepRingT: Ring,
        ReplicatedPlacement: ApproximateReciprocal<S, RepRingT, RepRingT>,
        ReplicatedPlacement: PlacementMul<S, RepRingT, RepRingT, RepRingT>,
        ReplicatedPlacement: PlacementTruncPr<S, RepRingT, RepRingT>,
        ReplicatedPlacement: PlacementAdd<S, MirRingT, RepRingT, RepRingT>,
        ReplicatedPlacement: PlacementSub<S, MirRingT, RepRingT, RepRingT>,
        ReplicatedPlacement: ShapeFill<S, RepRingT, Result = MirRingT>,
        ReplicatedPlacement: PlacementShape<S, RepRingT, ShapeT>,
        ReplicatedPlacement: PlacementBroadcast<S, ShapeT, RepRingT, RepRingT>,
    {
        #![allow(clippy::many_single_char_names)]

        assert_eq!(x.integral_precision, y.integral_precision);
        assert_eq!(x.fractional_precision, y.fractional_precision);

        let int_precision = x.integral_precision;
        let frac_precision = x.fractional_precision;

        let k = int_precision + frac_precision;

        assert!(
            2 * k as usize <= RepRingT::BitLength::VALUE,
            "2 * (fractional_precision + integral_precision) = {}, BitLength = {}",
            2 * k as usize,
            RepRingT::BitLength::VALUE
        );

        let constant_quotient: f64 = 17_f64.log2();
        let theta = ((k as f64) / constant_quotient).log2().ceil() as u32;

        let x_st = x.tensor;
        let y_st = y.tensor;

        let w = rep.approximate_reciprocal(
            sess,
            int_precision as usize,
            frac_precision as usize,
            &y_st,
        );

        // max_bits(w) = k
        let alpha = 1.0_f64.as_fixedpoint(2 * frac_precision as usize);
        let rep_alpha = rep.shape_fill(sess, alpha, &x_st);

        let init_prod = rep.mul(sess, &y_st, &w);
        let init_prod_resized = rep.broadcast(sess, &rep.shape(sess, &x_st), &init_prod);

        let mut a = with_context!(rep, sess, rep_alpha - init_prod_resized);
        // max_bits(a) = max(2f, k)

        // add that all shares have same shape in RepMul, AdtMul,

        let mut b = rep.mul(sess, &x_st, &w);

        // no need to truncate with 2f since w is already truncated
        b = rep.trunc_pr(sess, frac_precision, &b);

        for _i in 0..theta {
            let next_a = rep.mul(sess, &a, &a);
            let next_b = rep.mul(sess, &b, &rep.add(sess, &rep_alpha, &a));

            a = rep.trunc_pr(sess, 2 * frac_precision, &next_a);
            b = rep.trunc_pr(sess, 2 * frac_precision, &next_b);
        }
        b = rep.mul(sess, &b, &rep.add(sess, &rep_alpha, &a));
        b = rep.trunc_pr(sess, 2 * frac_precision, &b);

        Ok(RepFixedTensor {
            tensor: b,
            integral_precision: u32::max(x.integral_precision, y.integral_precision),
            fractional_precision: x.fractional_precision,
        })
    }
}

pub(crate) trait SignFromMsb<S: Session, RingT> {
    fn sign_from_msb(&self, sess: &S, msb_ring: &RingT) -> RingT;
}

impl<S: Session, RepRingT, MirRingT> SignFromMsb<S, RepRingT> for ReplicatedPlacement
where
    ReplicatedPlacement: PlacementShl<S, RepRingT, RepRingT>,
    ReplicatedPlacement: PlacementSub<S, MirRingT, RepRingT, RepRingT>,
    ReplicatedPlacement: ShapeFill<S, RepRingT, Result = MirRingT>,
{
    fn sign_from_msb(&self, sess: &S, msb_ring: &RepRingT) -> RepRingT {
        let rep = self;
        let double = rep.shl(sess, 1, msb_ring);
        let ones = rep.shape_fill(sess, 1_u8, msb_ring);
        rep.sub(sess, &ones, &double)
    }
}

pub(crate) trait DivNorm<S: Session, RingT> {
    fn norm(&self, sess: &S, max_bits: usize, x: &RingT) -> (RingT, RingT);
}

impl<S: Session, RepRingT, N> DivNorm<S, RepRingT> for ReplicatedPlacement
where
    RepRingT: Ring<BitLength = N>,
    RepBitArray<ReplicatedBitTensor, N>: KnownType<S>,
    ReplicatedBitTensor: KnownType<S>,

    ReplicatedPlacement: PlacementMsb<S, RepRingT, RepRingT>,
    ReplicatedPlacement: SignFromMsb<S, RepRingT>,
    ReplicatedPlacement: PlacementMul<S, RepRingT, RepRingT, RepRingT>,
    ReplicatedPlacement: TopMostIndex<S, m!(ReplicatedBitTensor), RepRingT>,
    ReplicatedPlacement:
        PlacementIndex<S, m!(RepBitArray<ReplicatedBitTensor, N>), m!(ReplicatedBitTensor)>,
{
    fn norm(&self, sess: &S, max_bits: usize, x: &RepRingT) -> (RepRingT, RepRingT) {
        let rep = self;

        let msb = rep.msb(sess, x);
        let sign = rep.sign_from_msb(sess, &msb);
        let abs_x = rep.mul(sess, &sign, x);

        // Although we don't need all bits (only max_bits from the bit-decomposition)
        // this is going to be optimized when using the rust compiler since the extra operations
        // will be pruned away.
        let top_most = rep.top_most_index(sess, max_bits, &abs_x);
        let upshifted = rep.mul(sess, x, &top_most);

        let signed_topmost = rep.mul(sess, &sign, &top_most);
        (upshifted, signed_topmost)
    }
}

pub(crate) trait TopMost<S: Session, RepRingT, RepBitT> {
    fn top_most(&self, sess: &S, max_bits: usize, x: &RepRingT) -> Vec<RepBitT>;
}

impl<S: Session, RepRingT, RepBitT, N: Const> TopMost<S, RepRingT, RepBitT> for ReplicatedPlacement
where
    RepBitT: Clone + CanonicalType,
    RepRingT: Clone + Ring<BitLength = N>,
    RepBitArray<c!(RepBitT), N>: KnownType<S>,
    ReplicatedPlacement: PlacementBitDecompose<S, RepRingT, m!(RepBitArray<c!(RepBitT), N>)>,
    ReplicatedPlacement: PlacementIndex<S, m!(RepBitArray<c!(RepBitT), N>), RepBitT>,
    ReplicatedPlacement: PlacementAnd<S, RepBitT, RepBitT, RepBitT>,
    ReplicatedPlacement: PlacementXor<S, RepBitT, RepBitT, RepBitT>,
    ReplicatedPlacement: PlacementSub<S, RepBitT, RepBitT, RepBitT>,
{
    fn top_most(&self, sess: &S, max_bits: usize, x: &RepRingT) -> Vec<RepBitT> {
        let rep = self;

        let x_bits = rep.bit_decompose(sess, x);
        let x_rev: Vec<_> = (0..max_bits)
            .map(|i| rep.index(sess, max_bits - i - 1, &x_bits))
            .collect();

        let mut y = rep.prefix_or(sess, x_rev);
        y.reverse();

        let mut z: Vec<_> = (0..max_bits - 1)
            .map(|i| rep.sub(sess, &y[i], &y[i + 1]))
            .collect();

        z.push(y[max_bits - 1].clone());
        z
    }
}

pub(crate) trait TopMostIndex<S: Session, RepBitT, RepRingT> {
    fn top_most_index(&self, sess: &S, max_bits: usize, x: &RepRingT) -> RepRingT;
}

impl<S: Session, RepBitT, RepRingT> TopMostIndex<S, RepBitT, RepRingT> for ReplicatedPlacement
where
    ReplicatedPlacement: TopMost<S, RepRingT, RepBitT>,
    ReplicatedPlacement: PlacementRingInject<S, RepBitT, RepRingT>,
    ReplicatedPlacement: PlacementShl<S, RepRingT, RepRingT>,
    ReplicatedPlacement: PlacementAdd<S, RepRingT, RepRingT, RepRingT>,
{
    fn top_most_index(&self, sess: &S, max_bits: usize, x: &RepRingT) -> RepRingT {
        let rep = self;

        let z = rep.top_most(sess, max_bits, x);
        let z_ring: Vec<RepRingT> = z.iter().map(|e| rep.ring_inject(sess, 0, e)).collect();

        let s_vec: Vec<_> = z_ring
            .iter()
            .enumerate()
            .map(|(i, zi)| rep.shl(sess, max_bits - i - 1, zi))
            .collect();

        // note this can be replaced with a variadic kernel for replicated sum operation
        let mut res = rep.shl(sess, 0, &s_vec[max_bits - 1]);
        for item in s_vec.iter().take(max_bits).skip(1) {
            res = rep.add(sess, &res, item);
        }
        res
    }
}

pub(crate) trait ApproximateReciprocal<S: Session, T, O> {
    fn approximate_reciprocal(
        &self,
        sess: &S,
        int_precision: usize,
        frac_precision: usize,
        x: &T,
    ) -> O;
}

impl<S: Session, RepRingT, MirRingT> ApproximateReciprocal<S, RepRingT, RepRingT>
    for ReplicatedPlacement
where
    ReplicatedPlacement: DivNorm<S, RepRingT>,
    ReplicatedPlacement: ShapeFill<S, RepRingT, Result = MirRingT>,
    ReplicatedPlacement: PlacementSub<S, MirRingT, RepRingT, RepRingT>,
    ReplicatedPlacement: PlacementShl<S, RepRingT, RepRingT>,
    ReplicatedPlacement: PlacementMul<S, RepRingT, RepRingT, RepRingT>,
    ReplicatedPlacement: PlacementTruncPr<S, RepRingT, RepRingT>,
{
    fn approximate_reciprocal(
        &self,
        sess: &S,
        int_precision: usize,
        frac_precision: usize,
        x: &RepRingT,
    ) -> RepRingT {
        let rep = self;
        let total_precision = int_precision + frac_precision;

        let (upshifted, signed_topmost) = rep.norm(sess, total_precision, x);

        // 2.9142 * 2^{total_precision}
        let alpha = rep.shape_fill(sess, 2.9142_f64.as_fixedpoint(total_precision), x);

        let d = with_context!(rep, sess, alpha - rep.shl(sess, 1, &upshifted));
        let w = rep.mul(sess, &d, &signed_topmost);

        // truncate result
        rep.trunc_pr(sess, 2 * int_precision as u32, &w)
    }
}

#[cfg(feature = "sync_execute")]
#[cfg(test)]
mod tests {
    use super::*;
    use crate::prelude::*;
    use ndarray::prelude::*;

    #[test]
    fn test_norm() {
        let alice = HostPlacement::from("alice");
        let rep = ReplicatedPlacement::from(["alice", "bob", "carole"]);

        let sess = SyncSession::default();

        let x: HostRing64Tensor = alice.from_raw(array![896u64]);
        let x_shared = rep.share(&sess, &x);

        let (upshifted, topmost) = rep.norm(&sess, 12, &x_shared);

        let topmost_target: HostRing64Tensor = alice.from_raw(array![4u64]);
        let upshifted_target: HostRing64Tensor = alice.from_raw(array![3584]);
        assert_eq!(topmost_target, alice.reveal(&sess, &topmost));
        assert_eq!(upshifted_target, alice.reveal(&sess, &upshifted));
    }

    #[test]
    fn test_binary_adder() {
        let alice = HostPlacement::from("alice");
        let rep = ReplicatedPlacement::from(["alice", "bob", "carole"]);

        let sess = SyncSession::default();

        let x: HostRing64Tensor = alice.from_raw(array![3884509700957842751u64]);
        let y: HostRing64Tensor = alice.from_raw(array![13611438098135434720u64]);
        let expected_output = alice.add(&sess, &x, &y);

        let x_bit = alice.bit_decompose(&sess, &x);
        let y_bit = alice.bit_decompose(&sess, &y);
        let expected_output_bit: HostBitTensor = alice.bit_decompose(&sess, &expected_output);

        let x_shared = rep.share(&sess, &x_bit);
        let y_shared = rep.share(&sess, &y_bit);
        let binary_adder = rep.binary_adder(&sess, &x_shared, &y_shared, 64);
        let binary_adder_clear = alice.reveal(&sess, &binary_adder);

        assert_eq!(expected_output_bit, binary_adder_clear);
    }

    #[test]
    fn test_approximate_reciprocal() {
        let alice = HostPlacement::from("alice");
        let rep = ReplicatedPlacement::from(["alice", "bob", "carole"]);

        let sess = SyncSession::default();

        // 3.5 * 2^8
        let x: HostRing64Tensor = alice.from_raw(array![896u64]);

        let expected_output = array![74i64];

        let x_shared = rep.share(&sess, &x);
        let approximation = rep.approximate_reciprocal(&sess, 4, 8, &x_shared);

        let out = alice.reveal(&sess, &approximation).0;
        for (i, item) in out.iter().enumerate() {
            match item {
                std::num::Wrapping(x) => {
                    let d = (*x as i64) - expected_output[i];
                    assert!(d * d <= 1);
                }
            }
        }
    }
}