#include "ulong_extras.h"
#include "fmpz_poly.h"
#include "fmpz_mod_poly.h"
#include "qadic.h"
static void __fmpz_mod_poly_neg(fmpz *res, const fmpz *poly, slong len, const fmpz_t p)
{
slong i;
for (i = 0; i < len; i++)
{
if (!fmpz_is_zero(poly + i))
fmpz_sub(res + i, p, poly + i);
else
fmpz_zero(res + i);
}
}
static void __fmpz_mod_poly_sub(fmpz *res, const fmpz *poly1, slong len1,
const fmpz *poly2, slong len2, const fmpz_t p)
{
slong i, len = FLINT_MAX(len1, len2);
_fmpz_poly_sub(res, poly1, len1, poly2, len2);
for (i = 0; i < len; i++)
{
if (fmpz_sgn(res + i) < 0)
fmpz_add(res + i, res + i, p);
}
}
static void __fmpz_mod_poly_mul(fmpz *res, const fmpz *poly1, slong len1,
const fmpz *poly2, slong len2, const fmpz_t p)
{
_fmpz_poly_mul(res, poly1, len1, poly2, len2);
_fmpz_vec_scalar_mod_fmpz(res, res, len1 + len2 - 1, p);
}
static void __fmpz_mod_poly_evaluate_fmpz(fmpz_t res, const fmpz *poly, slong len,
const fmpz_t a, const fmpz_t p)
{
if (len == 0)
{
fmpz_zero(res);
}
else if (len == 1 || fmpz_is_zero(a))
{
fmpz_set(res, poly);
}
else
{
slong i = len - 1;
fmpz_t t;
fmpz_init(t);
fmpz_set(res, poly + i);
for (i = len - 2; i >= 0; i--)
{
fmpz_mul(t, res, a);
fmpz_mod(t, t, p);
fmpz_add(res, poly + i, t);
}
fmpz_clear(t);
if (fmpz_cmpabs(res, p) >= 0)
fmpz_sub(res, res, p);
}
}
static void
_fmpz_mod_poly_compose_smod_rectangular(fmpz *rop,
const fmpz *op1, slong len1,
const fmpz *op2, slong len2,
const fmpz *a, const slong *j, slong lena,
const fmpz_t p)
{
const slong d = j[lena - 1];
if (len2 == 1)
{
__fmpz_mod_poly_evaluate_fmpz(rop, op1, len1, op2, p);
_fmpz_vec_zero(rop + 1, d - 1);
}
else
{
const slong B = n_sqrt(len1);
slong i, k;
fmpz *pows, *t;
pows = _fmpz_vec_init((B + 2) * d);
t = _fmpz_vec_init(2 * d - 1);
fmpz_one(pows + 0 * d + 0);
_fmpz_vec_set(pows + 1 * d, op2, len2);
for (i = 2; i <= B; i++)
{
_fmpz_poly_mul(pows + i * d, pows + (i - 1) * d, d, op2, len2);
_fmpz_poly_reduce(pows + i * d, d + len2 - 1, a, j, lena);
_fmpz_vec_scalar_mod_fmpz(pows + i * d, pows + i * d, d, p);
}
_fmpz_vec_zero(rop, d);
for (i = (len1 + B - 1) / B - 1; i >= 0; i--)
{
_fmpz_poly_mul(t, rop, d, pows + B * d, d);
_fmpz_poly_reduce(t, 2 * d - 1, a, j, lena);
_fmpz_vec_set(rop, t, d);
fmpz_add(rop + 0, rop + 0, op1 + i*B);
for (k = FLINT_MIN(B, len1 - i*B) - 1; k > 0; k--)
{
_fmpz_vec_scalar_addmul_fmpz(rop, pows + k * d, d, op1 + (i*B + k));
}
_fmpz_vec_scalar_mod_fmpz(rop, rop, d, p);
}
_fmpz_vec_clear(pows, (B + 2) * d);
_fmpz_vec_clear(t, 2 * d - 1);
}
}
static void
_fmpz_mod_poly_compose_smod_horner(fmpz *rop,
const fmpz *op1, slong len1,
const fmpz *op2, slong len2,
const fmpz *a, const slong *j, slong lena,
const fmpz_t p)
{
const slong d = j[lena - 1];
if (len1 == 1)
{
fmpz_set(rop, op1);
_fmpz_vec_zero(rop + 1, d - 1);
}
else if (len2 == 1)
{
__fmpz_mod_poly_evaluate_fmpz(rop, op1, len1, op2, p);
_fmpz_vec_zero(rop + 1, d - 1);
}
else
{
slong i;
fmpz *t;
t = _fmpz_vec_init(2*d - 1);
_fmpz_vec_zero(rop, d);
for (i = len1 - 1; i >= 0; i--)
{
_fmpz_poly_mul(t, rop, d, op2, len2);
_fmpz_poly_reduce(t, d + len2 - 1, a, j, lena);
_fmpz_poly_add(rop, t, d, op1 + i, 1);
_fmpz_vec_scalar_mod_fmpz(rop, rop, d, p);
}
_fmpz_vec_clear(t, 2*d - 1);
}
}
static void
_fmpz_mod_poly_compose_smod(fmpz *rop,
const fmpz *op1, slong len1,
const fmpz *op2, slong len2,
const fmpz *a, const slong *j, slong lena,
const fmpz_t p)
{
if (len1 < 6)
{
_fmpz_mod_poly_compose_smod_horner(rop, op1, len1, op2, len2, a, j, lena, p);
}
else
{
_fmpz_mod_poly_compose_smod_rectangular(rop, op1, len1, op2, len2, a, j, lena, p);
}
}
void _qadic_frobenius_a(fmpz *rop, slong exp,
const fmpz *a, const slong *j, slong lena,
const fmpz_t p, slong N)
{
const slong d = j[lena - 1];
slong *e, i, n;
fmpz *pow, *f1, *f2, *inv, *s, *t;
n = FLINT_CLOG2(N) + 1;
e = flint_malloc(n * sizeof(slong));
for (e[i = 0] = N; e[i] > 1; i++)
e[i + 1] = (e[i] + 1) / 2;
pow = _fmpz_vec_init(n);
f1 = _fmpz_vec_init(d + 1);
f2 = _fmpz_vec_init(d);
inv = _fmpz_vec_init(2*d - 1);
s = _fmpz_vec_init(2*d - 1);
t = _fmpz_vec_init(2*d - 1);
{
fmpz_one(t);
fmpz_set(pow + i, p);
}
for (i--; i >= 1; i--)
{
if (e[i] & WORD(1))
{
fmpz_mul(pow + i, t, pow + (i + 1));
fmpz_mul(t, t, t);
}
else
{
fmpz_mul(t, t, pow + (i + 1));
fmpz_mul(pow + i, pow + (i + 1), pow + (i + 1));
}
}
{
if (e[i] & WORD(1))
fmpz_mul(pow + i, t, pow + (i + 1));
else
fmpz_mul(pow + i, pow + (i + 1), pow + (i + 1));
}
{
slong k;
for (k = 0; k < lena; k++)
fmpz_set(f1 + j[k], a + k);
for (k = 1; k < lena; k++)
fmpz_mul_ui(f2 + (j[k] - 1), a + k, j[k]);
}
i = n - 1;
{
fmpz op[2] = {WORD(0), WORD(1)};
fmpz_pow_ui(t, p, exp);
_qadic_pow(rop, op, 2, t, a, j, lena, pow + i);
_fmpz_mod_poly_compose_smod(t, f2, d, rop, d, a, j, lena, pow + i);
_qadic_inv(inv, t, d, a, j, lena, p, 1);
}
for (i--; i >= 0; i--)
{
_fmpz_mod_poly_compose_smod(s, f1, d + 1, rop, d, a, j, lena, pow + i);
__fmpz_mod_poly_mul(t, s, d, inv, d, pow + i);
_fmpz_mod_poly_reduce(t, 2*d - 1, a, j, lena, pow + i);
__fmpz_mod_poly_sub(rop, rop, d, t, d, pow + i);
if (i > 0)
{
_fmpz_mod_poly_compose_smod(s, f2, d, rop, d, a, j, lena, pow + i);
__fmpz_mod_poly_mul(t, inv, d, s, d, pow + i);
_fmpz_mod_poly_reduce(t, 2*d - 1, a, j, lena, pow + i);
fmpz_sub_ui(t, t, 2);
if (fmpz_sgn(t) < 0)
fmpz_add(t, t, pow + i);
__fmpz_mod_poly_neg(t, t, d, pow + i);
__fmpz_mod_poly_mul(s, inv, d, t, d, pow + i);
_fmpz_mod_poly_reduce(s, 2*d - 1, a, j, lena, pow + i);
{
fmpz *__t;
__t = inv;
inv = s;
s = __t;
}
}
}
_fmpz_vec_clear(pow, n);
_fmpz_vec_clear(f1, d + 1);
_fmpz_vec_clear(f2, d);
_fmpz_vec_clear(inv, 2*d - 1);
_fmpz_vec_clear(s, 2*d - 1);
_fmpz_vec_clear(t, 2*d - 1);
flint_free(e);
}
void _qadic_frobenius(fmpz *rop, const fmpz *op, slong len, slong e,
const fmpz *a, const slong *j, slong lena,
const fmpz_t p, slong N)
{
const slong d = j[lena - 1];
if (len == 1)
{
_fmpz_vec_set(rop, op, len);
_fmpz_vec_zero(rop + len, (2*d - 1) - len);
}
else if (N == 1)
{
fmpz_t t;
fmpz_init(t);
fmpz_pow_ui(t, p, e);
_qadic_pow(rop, op, len, t, a, j, lena, p);
fmpz_clear(t);
}
else
{
fmpz *t;
fmpz_t pow;
t = _fmpz_vec_init(2*d - 1);
fmpz_init(pow);
fmpz_pow_ui(pow, p, N);
_qadic_frobenius_a(t, e, a, j, lena, p, N);
_fmpz_mod_poly_compose_smod(rop, op, len, t, d, a, j, lena, pow);
_fmpz_vec_zero(rop + d, d - 1);
_fmpz_vec_clear(t, 2*d - 1);
fmpz_clear(pow);
}
}
void qadic_frobenius(qadic_t rop, const qadic_t op, slong e, const qadic_ctx_t ctx)
{
const slong N = qadic_prec(rop);
const slong d = qadic_ctx_degree(ctx);
e = e % d;
if (e < 0)
e += d;
if (qadic_is_zero(op) || op->val >= N)
{
qadic_zero(rop);
}
else if (e == 0)
{
padic_poly_set(rop, op, &ctx->pctx);
}
else
{
fmpz *t;
if (rop == op)
{
t = _fmpz_vec_init(2 * d - 1);
}
else
{
padic_poly_fit_length(rop, 2 * d - 1);
t = rop->coeffs;
}
_qadic_frobenius(t, op->coeffs, op->length, e,
ctx->a, ctx->j, ctx->len, (&ctx->pctx)->p, N - op->val);
if (rop == op)
{
_fmpz_vec_clear(rop->coeffs, rop->alloc);
rop->coeffs = t;
rop->alloc = 2 * d - 1;
rop->length = d;
}
else
{
rop->val = op->val;
_padic_poly_set_length(rop, d);
}
_padic_poly_normalise(rop);
}
}