gliner2 0.1.0 - Docs.rs

//! Multi-task extraction and `format_results` aligned with `gliner2.inference.engine`.

use crate::Extractor;
use crate::preprocess::{PreprocessedInput, TaskType, collate_preprocessed};
use crate::processor::SchemaTransformer;
use crate::schema::ExtractionMetadata;
use anyhow::{Context, Result};
use candle_core::{D, DType, Device, Result as CResult, Tensor};
use candle_nn::Module;
use serde_json::{Map, Value, json};
use std::collections::{HashMap, HashSet};

#[derive(Clone, Debug)]
pub struct ExtractOptions {
    pub threshold: f32,
    pub format_results: bool,
    pub include_confidence: bool,
    pub include_spans: bool,
    pub max_len: Option<usize>,
    /// Chunk size for [`Extractor::batch_extract`] and related batch APIs (Python default: 8).
    pub batch_size: usize,
}

// Nested indices mirror row-major layout from flat[idx]; iterator/clippy refactors obscure that mapping.
#[allow(clippy::needless_range_loop)]
fn tensor_to_vec4(t: &Tensor) -> CResult<Vec<Vec<Vec<Vec<f32>>>>> {
    let dims = t.dims();
    if dims.len() != 4 {
        candle_core::bail!("expected 4D tensor");
    }
    let b = dims[0];
    let p = dims[1];
    let l = dims[2];
    let k = dims[3];
    let flat = t.flatten_all()?.to_vec1::<f32>()?;
    let mut out = vec![vec![vec![vec![0f32; k]; l]; p]; b];
    let mut idx = 0usize;
    for bi in 0..b {
        for pi in 0..p {
            for li in 0..l {
                for ki in 0..k {
                    out[bi][pi][li][ki] = flat[idx];
                    idx += 1;
                }
            }
        }
    }
    Ok(out)
}

impl Default for ExtractOptions {
    fn default() -> Self {
        Self {
            threshold: 0.5,
            format_results: true,
            include_confidence: false,
            include_spans: false,
            max_len: None,
            batch_size: 8,
        }
    }
}

/// How schemas and metadata map to each text in [`batch_extract`].
#[derive(Clone, Copy, Debug)]
pub enum BatchSchemaMode<'a> {
    /// One schema and metadata shared by every text in the batch.
    Shared {
        schema: &'a Value,
        meta: &'a ExtractionMetadata,
    },
    /// Per-text schema and metadata (`len` must match `texts.len()`).
    PerSample {
        schemas: &'a [Value],
        metas: &'a [ExtractionMetadata],
    },
}

fn sample_needs_span_rep(pre: &PreprocessedInput) -> bool {
    pre.task_types.iter().any(|t| {
        matches!(
            t,
            TaskType::Entities | TaskType::Relations | TaskType::JsonStructures
        )
    })
}

/// Decode from one sample’s encoder output and optional span tensor (multi-task heads + `format_results`).
pub fn extract_from_preprocessed(
    extractor: &Extractor,
    pre: &PreprocessedInput,
    last_hidden_seq: &Tensor,
    span_rep: Option<&Tensor>,
    meta: &ExtractionMetadata,
    opts: &ExtractOptions,
) -> Result<Value> {
    let span_for_tasks: Option<&Tensor> = if sample_needs_span_rep(pre) {
        Some(span_rep.context("extract_from_preprocessed: span_rep required for span tasks")?)
    } else {
        None
    };

    let l_words = pre.text_word_first_positions.len();
    let text_len = pre.start_mappings.len();
    let len_prefix = pre.len_prefix;

    let mut raw: Map<String, Value> = Map::new();

    for (task_i, task_type) in pre.task_types.iter().enumerate() {
        let positions = pre
            .schema_special_indices
            .get(task_i)
            .cloned()
            .unwrap_or_default();
        let schema_tokens = pre
            .schema_tokens_list
            .get(task_i)
            .cloned()
            .unwrap_or_default();

        if schema_tokens.len() < 4 || positions.is_empty() {
            continue;
        }

        let mut embs = Vec::new();
        for &p in &positions {
            embs.push(last_hidden_seq.get(p)?);
        }
        let embs = Tensor::stack(&embs, 0)?;

        match task_type {
            TaskType::Classifications => {
                extract_classification(
                    &mut raw,
                    &schema_tokens,
                    &pre.schema_original,
                    extractor,
                    &embs,
                    opts.include_confidence,
                )?;
            }
            TaskType::Entities => {
                extract_span_task(
                    extractor,
                    &mut raw,
                    "entities",
                    &schema_tokens,
                    &embs,
                    span_for_tasks.expect("span task without tensor"),
                    task_type,
                    l_words,
                    text_len,
                    len_prefix,
                    &pre.original_text,
                    &pre.text_tokens,
                    &pre.start_mappings,
                    &pre.end_mappings,
                    opts.threshold,
                    meta,
                    &build_cls_fields(&pre.schema_original),
                    opts.include_confidence,
                    opts.include_spans,
                )?;
            }
            TaskType::Relations => {
                let name = schema_prompt_raw(&schema_tokens);
                extract_span_task(
                    extractor,
                    &mut raw,
                    &name,
                    &schema_tokens,
                    &embs,
                    span_for_tasks.expect("span task without tensor"),
                    task_type,
                    l_words,
                    text_len,
                    len_prefix,
                    &pre.original_text,
                    &pre.text_tokens,
                    &pre.start_mappings,
                    &pre.end_mappings,
                    opts.threshold,
                    meta,
                    &build_cls_fields(&pre.schema_original),
                    opts.include_confidence,
                    opts.include_spans,
                )?;
            }
            TaskType::JsonStructures => {
                let name = schema_prompt_raw(&schema_tokens);
                extract_span_task(
                    extractor,
                    &mut raw,
                    &name,
                    &schema_tokens,
                    &embs,
                    span_for_tasks.expect("span task without tensor"),
                    task_type,
                    l_words,
                    text_len,
                    len_prefix,
                    &pre.original_text,
                    &pre.text_tokens,
                    &pre.start_mappings,
                    &pre.end_mappings,
                    opts.threshold,
                    meta,
                    &build_cls_fields(&pre.schema_original),
                    opts.include_confidence,
                    opts.include_spans,
                )?;
            }
        }
    }

    let out = if opts.format_results {
        format_results(
            raw,
            opts.include_confidence,
            &meta.relation_order,
            &meta.classification_tasks,
        )
    } else {
        Value::Object(raw)
    };
    Ok(out)
}

/// End-to-end extract: preprocess → encode → heads → optional `format_results`.
pub fn extract_with_schema(
    extractor: &Extractor,
    transformer: &SchemaTransformer,
    text: &str,
    schema: &Value,
    meta: &ExtractionMetadata,
    opts: &ExtractOptions,
) -> Result<Value> {
    let pre = transformer.transform_extract(text, schema, opts.max_len)?;
    let device = Device::Cpu;
    let input_ids = Tensor::new(pre.input_ids.clone(), &device)?.unsqueeze(0)?;
    let attention_mask = Tensor::ones(input_ids.dims(), DType::I64, &device)?;

    let hidden = extractor.encode_sequence(&input_ids, &attention_mask)?;
    let text_embs =
        extractor.gather_text_word_embeddings(&hidden, &pre.text_word_first_positions)?;
    let span_rep = extractor.compute_span_rep(&text_embs)?;

    let last_hidden = hidden.get(0)?;
    let span_opt = sample_needs_span_rep(&pre).then_some(&span_rep);
    extract_from_preprocessed(extractor, &pre, &last_hidden, span_opt, meta, opts)
}

/// Batch extract with Python `batch_extract` semantics: padded encoder passes, batched span rep, per-sample decode.
pub fn batch_extract(
    extractor: &Extractor,
    transformer: &SchemaTransformer,
    texts: &[String],
    mode: BatchSchemaMode<'_>,
    opts: &ExtractOptions,
) -> Result<Vec<Value>> {
    if texts.is_empty() {
        return Ok(Vec::new());
    }

    match mode {
        BatchSchemaMode::PerSample { schemas, metas } => {
            anyhow::ensure!(
                schemas.len() == texts.len(),
                "batch_extract: schemas.len() ({}) != texts.len() ({})",
                schemas.len(),
                texts.len()
            );
            anyhow::ensure!(
                metas.len() == texts.len(),
                "batch_extract: metas.len() ({}) != texts.len() ({})",
                metas.len(),
                texts.len()
            );
        }
        BatchSchemaMode::Shared { .. } => {}
    }

    let device = Device::Cpu;
    let bs = opts.batch_size.max(1);
    let mut all_out = Vec::with_capacity(texts.len());
    let mut base = 0usize;

    for chunk in texts.chunks(bs) {
        let mut pres = Vec::with_capacity(chunk.len());
        let mut metas_chunk: Vec<&ExtractionMetadata> = Vec::with_capacity(chunk.len());
        for (j, text) in chunk.iter().enumerate() {
            let global = base + j;
            let (schema, meta) = match mode {
                BatchSchemaMode::Shared { schema, meta } => (schema, meta),
                BatchSchemaMode::PerSample { schemas, metas } => (&schemas[global], &metas[global]),
            };
            let pre = transformer.transform_extract(text.as_str(), schema, opts.max_len)?;
            pres.push(pre);
            metas_chunk.push(meta);
        }

        let batch = collate_preprocessed(&pres).expect("non-empty chunk");
        let input_ids = Tensor::from_vec(
            batch.input_ids.clone(),
            (batch.batch_size, batch.max_seq_len),
            &device,
        )?;
        let mask_i64: Vec<i64> = batch.attention_mask.iter().map(|&x| x as i64).collect();
        let attention_mask =
            Tensor::from_vec(mask_i64, (batch.batch_size, batch.max_seq_len), &device)?;

        let hidden = extractor.encode_sequence(&input_ids, &attention_mask)?;

        let mut span_emb_list: Vec<Tensor> = Vec::new();
        let mut span_orig_index: Vec<usize> = Vec::new();
        for (i, pre) in batch.samples.iter().enumerate() {
            if sample_needs_span_rep(pre) {
                let tw = extractor.gather_text_word_embeddings_batch_idx(
                    &hidden,
                    i,
                    &pre.text_word_first_positions,
                )?;
                span_orig_index.push(i);
                span_emb_list.push(tw);
            }
        }

        let batched_spans = if span_emb_list.is_empty() {
            vec![]
        } else {
            extractor.compute_span_rep_batched(&span_emb_list)?
        };

        let mut span_by_sample: Vec<Option<Tensor>> = (0..batch.batch_size).map(|_| None).collect();
        for (k, &orig_i) in span_orig_index.iter().enumerate() {
            span_by_sample[orig_i] = Some(batched_spans[k].clone());
        }

        for i in 0..batch.batch_size {
            let pre = &batch.samples[i];
            let last_h = hidden.get(i)?;
            let meta = metas_chunk[i];
            let span_ref: Option<&Tensor> = if sample_needs_span_rep(pre) {
                Some(
                    span_by_sample[i]
                        .as_ref()
                        .context("internal: missing batched span rep")?,
                )
            } else {
                None
            };
            let v = extract_from_preprocessed(extractor, pre, &last_h, span_ref, meta, opts)?;
            all_out.push(v);
        }

        base += chunk.len();
    }

    Ok(all_out)
}

fn schema_prompt_raw(tokens: &[String]) -> String {
    if tokens.len() < 3 {
        return String::new();
    }
    tokens[2]
        .split(" [DESCRIPTION] ")
        .next()
        .unwrap_or(&tokens[2])
        .to_string()
}

fn field_names_from_schema_tokens(tokens: &[String]) -> Vec<String> {
    let mut out = Vec::new();
    for j in 0..tokens.len().saturating_sub(1) {
        if matches!(tokens[j].as_str(), "[E]" | "[C]" | "[R]" | "[L]") {
            out.push(tokens[j + 1].clone());
        }
    }
    out
}

fn build_cls_fields(schema: &Value) -> HashMap<String, Vec<String>> {
    let mut m = HashMap::new();
    let Some(arr) = schema.get("json_structures").and_then(|v| v.as_array()) else {
        return m;
    };
    for st in arr {
        let Some(obj) = st.as_object() else { continue };
        for (parent, fields) in obj {
            let Some(fmap) = fields.as_object() else {
                continue;
            };
            for (fname, fval) in fmap {
                if fval.get("value").is_some()
                    && let Some(choices) = fval.get("choices").and_then(|c| c.as_array())
                {
                    let ch: Vec<String> = choices
                        .iter()
                        .filter_map(|v| v.as_str().map(String::from))
                        .collect();
                    m.insert(format!("{parent}.{fname}"), ch);
                }
            }
        }
    }
    m
}

fn extract_classification(
    results: &mut Map<String, Value>,
    schema_tokens: &[String],
    schema: &Value,
    extractor: &Extractor,
    embs: &Tensor,
    include_confidence: bool,
) -> CResult<()> {
    let prompt = schema_prompt_raw(schema_tokens);
    let Some(cls) = find_classification_config(schema, &prompt) else {
        return Ok(());
    };
    let n = embs.dim(0)?;
    if n < 2 {
        return Ok(());
    }
    let cls_embeds = embs.narrow(0, 1, n - 1)?;
    let logits = extractor.classifier_logits(&cls_embeds)?;
    let logits_v = logits.to_vec1::<f32>()?;
    let labels: Vec<String> = cls
        .get("labels")
        .and_then(|v| v.as_array())
        .map(|a| {
            a.iter()
                .filter_map(|x| x.as_str().map(String::from))
                .collect()
        })
        .unwrap_or_default();
    let multi = cls
        .get("multi_label")
        .and_then(|v| v.as_bool())
        .unwrap_or(false);
    let cls_threshold = cls
        .get("cls_threshold")
        .and_then(|v| v.as_f64())
        .unwrap_or(0.5) as f32;
    let class_act = cls
        .get("class_act")
        .and_then(|v| v.as_str())
        .unwrap_or("auto");

    let schema_name = prompt.clone();

    if multi || class_act == "sigmoid" {
        let use_sigmoid = class_act != "softmax";
        let p: Vec<f32> = if use_sigmoid {
            logits_v.iter().map(|&z| 1.0 / (1.0 + (-z).exp())).collect()
        } else {
            softmax(&logits_v)
        };
        let mut chosen: Vec<(String, f32)> = Vec::new();
        for (j, lab) in labels.iter().enumerate() {
            if p[j] >= cls_threshold {
                chosen.push((lab.clone(), p[j]));
            }
        }
        if chosen.is_empty() {
            let best = argmax_f32(&p);
            chosen.push((labels[best].clone(), p[best]));
        }
        results.insert(
            schema_name,
            if include_confidence {
                json!(
                    chosen
                        .into_iter()
                        .map(|(l, c)| json!({"label": l, "confidence": c}))
                        .collect::<Vec<_>>()
                )
            } else {
                json!(chosen.into_iter().map(|(l, _)| l).collect::<Vec<_>>())
            },
        );
    } else {
        let p = if class_act == "softmax" {
            softmax(&logits_v)
        } else {
            logits_v.iter().map(|&z| 1.0 / (1.0 + (-z).exp())).collect()
        };
        let best = argmax_f32(&p);
        let label = labels.get(best).cloned().unwrap_or_default();
        let conf = p[best];
        results.insert(
            schema_name,
            if include_confidence {
                json!({"label": label, "confidence": conf})
            } else {
                Value::String(label)
            },
        );
    }
    Ok(())
}

fn softmax(logits: &[f32]) -> Vec<f32> {
    let m = logits.iter().copied().fold(f32::NEG_INFINITY, f32::max);
    let exps: Vec<f32> = logits.iter().map(|&z| (z - m).exp()).collect();
    let s: f32 = exps.iter().sum();
    exps.iter().map(|e| e / s).collect()
}

fn argmax_f32(p: &[f32]) -> usize {
    p.iter()
        .enumerate()
        .max_by(|a, b| a.1.partial_cmp(b.1).unwrap())
        .map(|(i, _)| i)
        .unwrap_or(0)
}

fn find_classification_config<'a>(
    schema: &'a Value,
    prompt: &str,
) -> Option<&'a Map<String, Value>> {
    let arr = schema.get("classifications")?.as_array()?;
    for c in arr {
        let task = c.get("task")?.as_str()?;
        if prompt.starts_with(task) {
            return c.as_object();
        }
    }
    None
}

#[allow(clippy::too_many_arguments)]
fn extract_span_task(
    extractor: &Extractor,
    results: &mut Map<String, Value>,
    schema_name: &str,
    schema_tokens: &[String],
    embs: &Tensor,
    span_rep: &Tensor,
    task_type: &TaskType,
    l_words: usize,
    text_len: usize,
    len_prefix: usize,
    text: &str,
    text_tokens: &[String],
    start_map: &[usize],
    end_map: &[usize],
    threshold: f32,
    meta: &ExtractionMetadata,
    cls_fields: &HashMap<String, Vec<String>>,
    include_confidence: bool,
    include_spans: bool,
) -> CResult<()> {
    let field_names = field_names_from_schema_tokens(schema_tokens);
    if field_names.is_empty() {
        insert_empty_span_result(results, schema_name, task_type);
        return Ok(());
    }

    let p_emb = embs.get(0)?;
    let count_logits = extractor.count_pred.forward(&p_emb.unsqueeze(0)?)?;
    let pred_count = count_logits.argmax(D::Minus1)?.get(0)?.to_scalar::<u32>()? as usize;

    if pred_count == 0 {
        insert_empty_span_result(results, schema_name, task_type);
        return Ok(());
    }

    let n = embs.dim(0)?;
    let field_embs = embs.narrow(0, 1, n - 1)?;
    let span_scores = extractor.span_scores_sigmoid(span_rep, &field_embs, pred_count)?;
    let scores_v = tensor_to_vec4(&span_scores)?;

    match task_type {
        TaskType::Entities => {
            let ent = extract_entities_inner(
                &field_names,
                &scores_v,
                pred_count,
                l_words,
                text_len,
                len_prefix,
                text,
                text_tokens,
                start_map,
                end_map,
                threshold,
                meta,
                include_confidence,
                include_spans,
            )?;
            results.insert(schema_name.to_string(), ent);
        }
        TaskType::Relations => {
            let rel = extract_relations_inner(
                schema_name,
                &field_names,
                &scores_v,
                pred_count,
                l_words,
                text_len,
                len_prefix,
                text,
                start_map,
                end_map,
                threshold,
                meta,
                include_confidence,
                include_spans,
            )?;
            results.insert(schema_name.to_string(), rel);
        }
        TaskType::JsonStructures => {
            let st = extract_structures_inner(
                schema_name,
                &field_names,
                &scores_v,
                pred_count,
                l_words,
                text_len,
                len_prefix,
                text,
                text_tokens,
                start_map,
                end_map,
                threshold,
                meta,
                cls_fields,
                include_confidence,
                include_spans,
            )?;
            results.insert(schema_name.to_string(), st);
        }
        TaskType::Classifications => {}
    }
    Ok(())
}

fn insert_empty_span_result(
    results: &mut Map<String, Value>,
    schema_name: &str,
    task_type: &TaskType,
) {
    let v = match task_type {
        TaskType::Entities => json!([]),
        TaskType::Relations => json!([]),
        TaskType::JsonStructures => json!([]),
        TaskType::Classifications => json!(null),
    };
    results.insert(schema_name.to_string(), v);
}

#[allow(clippy::too_many_arguments)]
fn extract_entities_inner(
    field_names: &[String],
    span_scores: &[Vec<Vec<Vec<f32>>>],
    _pred_count: usize,
    l_words: usize,
    text_len: usize,
    _len_prefix: usize,
    text: &str,
    _text_tokens: &[String],
    start_map: &[usize],
    end_map: &[usize],
    threshold: f32,
    meta: &ExtractionMetadata,
    include_confidence: bool,
    include_spans: bool,
) -> CResult<Value> {
    let b = 0usize;
    let slice_l = l_words.saturating_sub(text_len);
    let mut entity_map = Map::new();
    let order: Vec<String> = if meta.entity_order.is_empty() {
        field_names.to_vec()
    } else {
        meta.entity_order.clone()
    };

    for name in order {
        if !field_names.contains(&name) {
            continue;
        }
        let idx = field_names.iter().position(|x| x == &name).unwrap();
        let ent_threshold = meta
            .entity_metadata
            .get(&name)
            .and_then(|m| m.threshold)
            .unwrap_or(threshold);
        let dtype_list = meta
            .entity_metadata
            .get(&name)
            .map(|m| matches!(m.dtype, crate::schema::ValueDtype::List))
            .unwrap_or(true);

        let scores_2d = slice_scores_pk(span_scores, b, idx, slice_l, l_words, text_len);
        let spans = find_spans_from_grid(
            &scores_2d,
            text_len,
            ent_threshold,
            text,
            start_map,
            end_map,
        );
        let formatted = format_spans(&spans, include_confidence, include_spans);
        if dtype_list {
            entity_map.insert(
                name,
                json!(
                    formatted
                        .into_iter()
                        .map(|(t, c, st, en)| span_to_entity_json(
                            &t,
                            c,
                            st,
                            en,
                            include_confidence,
                            include_spans
                        ))
                        .collect::<Vec<Value>>()
                ),
            );
        } else {
            let v = if let Some((t, c, st, en)) = spans.first() {
                span_to_entity_json(t, *c, *st, *en, include_confidence, include_spans)
            } else if include_spans || include_confidence {
                Value::Null
            } else {
                Value::String(String::new())
            };
            entity_map.insert(name, v);
        }
    }

    Ok(json!([Value::Object(entity_map)]))
}

fn span_to_entity_json(
    text: &str,
    conf: f32,
    start: usize,
    end: usize,
    include_confidence: bool,
    include_spans: bool,
) -> Value {
    match (include_spans, include_confidence) {
        (true, true) => json!({"text": text, "confidence": conf, "start": start, "end": end}),
        (true, false) => json!({"text": text, "start": start, "end": end}),
        (false, true) => json!({"text": text, "confidence": conf}),
        (false, false) => Value::String(text.to_string()),
    }
}

fn slice_scores_pk(
    span_scores: &[Vec<Vec<Vec<f32>>>],
    b: usize,
    p: usize,
    slice_l: usize,
    l_words: usize,
    text_len: usize,
) -> Vec<Vec<f32>> {
    // span_scores[b][p][l][k] with l in 0..l_words
    let empty = vec![vec![0f32; 12]; text_len];
    let Some(plane) = span_scores.get(b) else {
        return empty;
    };
    let Some(row) = plane.get(p) else {
        return empty;
    };
    let max_w = row.first().map(|r| r.len()).unwrap_or(0);
    let mut out = vec![vec![0f32; max_w]; text_len];
    for (ti, l) in (slice_l..l_words).enumerate() {
        if ti >= text_len {
            break;
        }
        if let Some(sc) = row.get(l) {
            for (k, &v) in sc.iter().enumerate() {
                if k < max_w {
                    out[ti][k] = v;
                }
            }
        }
    }
    out
}

fn find_spans_from_grid(
    scores: &[Vec<f32>],
    text_len: usize,
    threshold: f32,
    text: &str,
    start_map: &[usize],
    end_map: &[usize],
) -> Vec<(String, f32, usize, usize)> {
    let max_w = scores.first().map(|r| r.len()).unwrap_or(0);
    let mut spans = Vec::new();
    for (start, row) in scores.iter().enumerate().take(text_len) {
        for (width, &conf) in row.iter().enumerate().take(max_w) {
            if conf < threshold {
                continue;
            }
            let end = start + width + 1;
            if start < text_len && end <= text_len {
                let (cs, ce) = match (start_map.get(start), end_map.get(end.saturating_sub(1))) {
                    (Some(&cs), Some(&ce)) => (cs, ce),
                    _ => continue,
                };
                let text_span = text.get(cs..ce).unwrap_or("").trim();
                if !text_span.is_empty() {
                    spans.push((text_span.to_string(), conf, cs, ce));
                }
            }
        }
    }
    spans
}

fn format_spans(
    spans: &[(String, f32, usize, usize)],
    _include_confidence: bool,
    _include_spans: bool,
) -> Vec<(String, f32, usize, usize)> {
    let mut sorted: Vec<_> = spans.to_vec();
    sorted.sort_by(|a, b| b.1.partial_cmp(&a.1).unwrap());
    let mut selected = Vec::new();
    for s in sorted {
        let overlap = selected
            .iter()
            .any(|t: &(String, f32, usize, usize)| !(s.3 <= t.2 || s.2 >= t.3));
        if !overlap {
            selected.push(s);
        }
    }
    selected
}

#[allow(clippy::too_many_arguments)]
fn extract_relations_inner(
    rel_name: &str,
    field_names: &[String],
    span_scores: &[Vec<Vec<Vec<f32>>>],
    pred_count: usize,
    l_words: usize,
    text_len: usize,
    _len_prefix: usize,
    text: &str,
    start_map: &[usize],
    end_map: &[usize],
    threshold: f32,
    meta: &ExtractionMetadata,
    include_confidence: bool,
    include_spans: bool,
) -> CResult<Value> {
    let slice_l = l_words.saturating_sub(text_len);
    let rel_threshold = meta
        .relation_metadata
        .get(rel_name)
        .and_then(|m| m.threshold)
        .unwrap_or(threshold);
    let ordered: Vec<String> = meta
        .field_orders
        .get(rel_name)
        .cloned()
        .unwrap_or_else(|| field_names.to_vec());

    let mut instances = Vec::new();
    for inst in 0..pred_count {
        let mut values: Vec<Option<String>> = Vec::new();
        let mut field_data: Vec<Option<(String, f32, usize, usize)>> = Vec::new();

        for fname in &ordered {
            if !field_names.contains(fname) {
                continue;
            }
            let fidx = field_names.iter().position(|x| x == fname).unwrap();
            let scores_2d = slice_scores_pk(span_scores, inst, fidx, slice_l, l_words, text_len);
            let spans = find_spans_from_grid(
                &scores_2d,
                text_len,
                rel_threshold,
                text,
                start_map,
                end_map,
            );
            if let Some((t, c, cs, ce)) = spans.first() {
                values.push(Some(t.clone()));
                field_data.push(Some((t.clone(), *c, *cs, *ce)));
            } else {
                values.push(None);
                field_data.push(None);
            }
        }

        if values.len() == 2 && values[0].is_some() && values[1].is_some() {
            let fd0 = field_data[0].as_ref().unwrap();
            let fd1 = field_data[1].as_ref().unwrap();
            let tup = if include_spans && include_confidence {
                json!({
                    "head": {"text": fd0.0, "confidence": fd0.1, "start": fd0.2, "end": fd0.3},
                    "tail": {"text": fd1.0, "confidence": fd1.1, "start": fd1.2, "end": fd1.3},
                })
            } else if include_spans {
                json!({
                    "head": {"text": fd0.0, "start": fd0.2, "end": fd0.3},
                    "tail": {"text": fd1.0, "start": fd1.2, "end": fd1.3},
                })
            } else if include_confidence {
                json!({
                    "head": {"text": fd0.0, "confidence": fd0.1},
                    "tail": {"text": fd1.0, "confidence": fd1.1},
                })
            } else {
                json!([values[0].clone().unwrap(), values[1].clone().unwrap()])
            };
            instances.push(tup);
        }
    }
    Ok(Value::Array(instances))
}

fn find_choice_idx(choice: &str, tokens: &[String]) -> isize {
    let cl = choice.to_lowercase();
    for (i, tok) in tokens.iter().enumerate() {
        let tl = tok.to_lowercase();
        if tl == cl || tl.contains(&cl) {
            return i as isize;
        }
    }
    -1
}

#[allow(clippy::too_many_arguments)]
fn extract_structures_inner(
    struct_name: &str,
    field_names: &[String],
    span_scores: &[Vec<Vec<Vec<f32>>>],
    pred_count: usize,
    l_words: usize,
    text_len: usize,
    _len_prefix: usize,
    text: &str,
    text_tokens: &[String],
    start_map: &[usize],
    end_map: &[usize],
    threshold: f32,
    meta: &ExtractionMetadata,
    cls_fields: &HashMap<String, Vec<String>>,
    include_confidence: bool,
    include_spans: bool,
) -> CResult<Value> {
    let slice_l = l_words.saturating_sub(text_len);
    let ordered: Vec<String> = meta
        .field_orders
        .get(struct_name)
        .cloned()
        .unwrap_or_else(|| field_names.to_vec());

    let mut instances = Vec::new();
    for inst in 0..pred_count {
        let mut instance = Map::new();
        for fname in &ordered {
            if !field_names.contains(fname) {
                continue;
            }
            let fidx = field_names.iter().position(|x| x == fname).unwrap();
            let field_key = format!("{struct_name}.{fname}");
            let fmeta = meta.field_metadata.get(&field_key);
            let field_threshold = fmeta.and_then(|m| m.threshold).unwrap_or(threshold);
            let dtype_list = fmeta
                .map(|m| matches!(m.dtype, crate::schema::ValueDtype::List))
                .unwrap_or(true);

            if let Some(choices) = cls_fields.get(&field_key) {
                let plane = &span_scores[inst][fidx];
                let prefix_len = l_words.saturating_sub(text_len);
                let mut selected = Vec::new();
                let mut seen = HashSet::new();
                if dtype_list {
                    for choice in choices {
                        if !seen.insert(choice.clone()) {
                            continue;
                        }
                        let idx = find_choice_idx(
                            choice,
                            &text_tokens[..prefix_len.min(text_tokens.len())],
                        );
                        if idx >= 0 && (idx as usize) < plane.len() {
                            let row = &plane[idx as usize];
                            let score = row.first().copied().unwrap_or(0.);
                            if score >= field_threshold {
                                if include_confidence {
                                    selected.push(json!({"text": choice, "confidence": score}));
                                } else {
                                    selected.push(Value::String(choice.clone()));
                                }
                            }
                        }
                    }
                    instance.insert(fname.clone(), Value::Array(selected));
                } else {
                    let mut best: Option<&str> = None;
                    let mut best_score = -1f32;
                    for choice in choices {
                        let idx = find_choice_idx(
                            choice,
                            &text_tokens[..prefix_len.min(text_tokens.len())],
                        );
                        if idx >= 0 && (idx as usize) < plane.len() {
                            let row = &plane[idx as usize];
                            let score = row.first().copied().unwrap_or(0.);
                            if score > best_score {
                                best_score = score;
                                best = Some(choice.as_str());
                            }
                        }
                    }
                    let v = if let Some(b) = best {
                        if best_score >= field_threshold {
                            if include_confidence {
                                json!({"text": b, "confidence": best_score})
                            } else {
                                Value::String(b.to_string())
                            }
                        } else {
                            Value::Null
                        }
                    } else {
                        Value::Null
                    };
                    instance.insert(fname.clone(), v);
                }
            } else {
                let scores_2d =
                    slice_scores_pk(span_scores, inst, fidx, slice_l, l_words, text_len);
                let spans = find_spans_from_grid(
                    &scores_2d,
                    text_len,
                    field_threshold,
                    text,
                    start_map,
                    end_map,
                );
                let formatted = format_spans(&spans, include_confidence, include_spans);
                if dtype_list {
                    let arr: Vec<Value> = formatted
                        .into_iter()
                        .map(|(t, c, st, en)| {
                            span_to_entity_json(&t, c, st, en, include_confidence, include_spans)
                        })
                        .collect();
                    instance.insert(fname.clone(), Value::Array(arr));
                } else {
                    let v = if let Some((t, c, st, en)) = formatted.first() {
                        span_to_entity_json(t, *c, *st, *en, include_confidence, include_spans)
                    } else {
                        Value::Null
                    };
                    instance.insert(fname.clone(), v);
                }
            }
        }
        let has_content = instance.values().any(|v| match v {
            Value::Null => false,
            Value::Array(a) => !a.is_empty(),
            _ => true,
        });
        if has_content {
            instances.push(Value::Object(instance));
        }
    }
    Ok(Value::Array(instances))
}

fn format_results(
    results: Map<String, Value>,
    include_confidence: bool,
    requested_relations: &[String],
    classification_tasks: &[String],
) -> Value {
    let mut formatted = Map::new();
    let mut relations = Map::new();
    let cls_set: HashSet<&str> = classification_tasks.iter().map(|s| s.as_str()).collect();

    for (key, value) in results.into_iter() {
        let is_classification = cls_set.contains(key.as_str());
        let is_relation = if !is_classification {
            if requested_relations.iter().any(|r| r == &key) {
                true
            } else {
                match &value {
                    Value::Array(a) if !a.is_empty() => match a.first() {
                        Some(Value::Array(inner)) if inner.len() == 2 => true,
                        Some(Value::Object(o))
                            if o.contains_key("head") && o.contains_key("tail") =>
                        {
                            true
                        }
                        _ => false,
                    },
                    _ => false,
                }
            }
        } else {
            false
        };

        if is_classification {
            match &value {
                Value::Array(a) => {
                    if include_confidence {
                        formatted.insert(key, value);
                    } else {
                        let labs: Vec<Value> = a
                            .iter()
                            .filter_map(|x| x.as_str().map(|s| Value::String(s.to_string())))
                            .collect();
                        formatted.insert(key, Value::Array(labs));
                    }
                }
                Value::Object(o) if include_confidence => {
                    formatted.insert(key, value);
                }
                Value::Object(o) => {
                    if let Some(l) = o.get("label") {
                        formatted.insert(key, l.clone());
                    } else {
                        formatted.insert(key, value);
                    }
                }
                _ => {
                    formatted.insert(key, value);
                }
            }
        } else if is_relation {
            if let Value::Array(a) = value {
                relations.insert(key, Value::Array(a));
            } else {
                relations.insert(key, json!([]));
            }
        } else if let Value::Array(a) = value {
            if a.is_empty() {
                if key == "entities" {
                    formatted.insert(key, json!({}));
                } else {
                    formatted.insert(key, Value::Array(a));
                }
            } else if let Some(Value::Object(ent)) = a.first() {
                if key == "entities" {
                    formatted.insert(key, format_entity_dict(ent, include_confidence));
                } else {
                    let mapped: Vec<Value> = a
                        .iter()
                        .filter_map(|v| {
                            v.as_object()
                                .map(|o| format_struct_obj(o, include_confidence))
                        })
                        .collect();
                    formatted.insert(key, Value::Array(mapped));
                }
            } else {
                formatted.insert(key, Value::Array(a));
            }
        } else {
            formatted.insert(key, value);
        }
    }

    for rel in requested_relations {
        if !relations.contains_key(rel.as_str()) {
            relations.insert(rel.clone(), json!([]));
        }
    }

    if !relations.is_empty() {
        formatted.insert("relation_extraction".into(), Value::Object(relations));
    }

    Value::Object(formatted)
}

fn format_entity_dict(ent: &Map<String, Value>, include_confidence: bool) -> Value {
    let mut out = Map::new();
    for (k, v) in ent {
        let cleaned = match v {
            Value::Array(items) => {
                let mut unique = Vec::new();
                let mut seen = HashSet::new();
                for it in items {
                    let text_key = match it {
                        Value::String(s) => Some((
                            s.to_lowercase(),
                            format_string_list_item(s, include_confidence),
                        )),
                        Value::Object(o) => o.get("text").and_then(|t| t.as_str()).map(|t| {
                            let lk = t.to_lowercase();
                            (lk.clone(), it.clone())
                        }),
                        _ => None,
                    };
                    if let Some((lk, val)) = text_key
                        && seen.insert(lk)
                    {
                        unique.push(val);
                    }
                }
                Value::Array(unique)
            }
            _ => v.clone(),
        };
        out.insert(k.clone(), cleaned);
    }
    Value::Object(out)
}

fn format_string_list_item(s: &str, include_confidence: bool) -> Value {
    if include_confidence {
        json!({"text": s, "confidence": 1.0})
    } else {
        Value::String(s.to_string())
    }
}

fn format_struct_obj(o: &Map<String, Value>, include_confidence: bool) -> Value {
    let mut m = Map::new();
    for (k, v) in o {
        m.insert(k.clone(), format_struct_value(v, include_confidence));
    }
    Value::Object(m)
}

fn format_struct_value(v: &Value, include_confidence: bool) -> Value {
    match v {
        Value::Array(a) => {
            let mut out = Vec::new();
            for it in a {
                out.push(format_struct_value(it, include_confidence));
            }
            Value::Array(out)
        }
        Value::Object(o) => {
            if o.contains_key("text") && o.contains_key("confidence") && !include_confidence {
                o.get("text").cloned().unwrap_or(Value::Null)
            } else {
                Value::Object(o.clone())
            }
        }
        _ => v.clone(),
    }
}

impl Extractor {
    /// High-level API matching Python `Extractor.extract` / `GLiNER2.extract`.
    pub fn extract(
        &self,
        transformer: &SchemaTransformer,
        text: &str,
        schema: &Value,
        meta: &ExtractionMetadata,
        opts: &ExtractOptions,
    ) -> Result<Value> {
        extract_with_schema(self, transformer, text, schema, meta, opts)
    }

    /// [`batch_extract`] with a single shared schema (Python `batch_extract` with one schema dict).
    pub fn batch_extract(
        &self,
        transformer: &SchemaTransformer,
        texts: &[String],
        schema: &Value,
        meta: &ExtractionMetadata,
        opts: &ExtractOptions,
    ) -> Result<Vec<Value>> {
        batch_extract(
            self,
            transformer,
            texts,
            BatchSchemaMode::Shared { schema, meta },
            opts,
        )
    }

    /// [`batch_extract`] with per-text schemas and metadata.
    pub fn batch_extract_per_sample(
        &self,
        transformer: &SchemaTransformer,
        texts: &[String],
        schemas: &[Value],
        metas: &[ExtractionMetadata],
        opts: &ExtractOptions,
    ) -> Result<Vec<Value>> {
        batch_extract(
            self,
            transformer,
            texts,
            BatchSchemaMode::PerSample { schemas, metas },
            opts,
        )
    }

    pub fn batch_extract_entities(
        &self,
        transformer: &SchemaTransformer,
        texts: &[String],
        entity_types: &[String],
        opts: &ExtractOptions,
    ) -> Result<Vec<Value>> {
        let mut s = crate::schema::Schema::new();
        let types: Vec<Value> = entity_types.iter().map(|t| json!(t)).collect();
        s.entities(Value::Array(types));
        let (schema_val, meta) = s.build();
        self.batch_extract(transformer, texts, &schema_val, &meta, opts)
    }

    pub fn batch_classify_text(
        &self,
        transformer: &SchemaTransformer,
        texts: &[String],
        task: &str,
        labels: Value,
        opts: &ExtractOptions,
    ) -> Result<Vec<Value>> {
        let mut s = crate::schema::Schema::new();
        s.classification_simple(task, labels);
        let (schema_val, meta) = s.build();
        self.batch_extract(transformer, texts, &schema_val, &meta, opts)
    }

    pub fn batch_extract_relations(
        &self,
        transformer: &SchemaTransformer,
        texts: &[String],
        relation_types: Value,
        opts: &ExtractOptions,
    ) -> Result<Vec<Value>> {
        let mut s = crate::schema::Schema::new();
        s.relations(relation_types);
        let (schema_val, meta) = s.build();
        self.batch_extract(transformer, texts, &schema_val, &meta, opts)
    }

    pub fn batch_extract_json(
        &self,
        transformer: &SchemaTransformer,
        texts: &[String],
        structures: &Value,
        opts: &ExtractOptions,
    ) -> Result<Vec<Value>> {
        let obj = structures.as_object().context(
            "batch_extract_json: structures must be a JSON object (parent → field spec array)",
        )?;
        let mut s = crate::schema::Schema::new();
        s.extract_json_structures(obj)?;
        let (schema_val, meta) = s.build();
        self.batch_extract(transformer, texts, &schema_val, &meta, opts)
    }

    pub fn extract_entities(
        &self,
        transformer: &SchemaTransformer,
        text: &str,
        entity_types: &[String],
        opts: &ExtractOptions,
    ) -> Result<Value> {
        let mut s = crate::schema::Schema::new();
        let types: Vec<Value> = entity_types.iter().map(|t| json!(t)).collect();
        s.entities(Value::Array(types));
        let (schema_val, meta) = s.build();
        self.extract(transformer, text, &schema_val, &meta, opts)
    }

    pub fn classify_text(
        &self,
        transformer: &SchemaTransformer,
        text: &str,
        task: &str,
        labels: Value,
        opts: &ExtractOptions,
    ) -> Result<Value> {
        let mut s = crate::schema::Schema::new();
        s.classification_simple(task, labels);
        let (schema_val, meta) = s.build();
        self.extract(transformer, text, &schema_val, &meta, opts)
    }

    pub fn extract_relations(
        &self,
        transformer: &SchemaTransformer,
        text: &str,
        relation_types: Value,
        opts: &ExtractOptions,
    ) -> Result<Value> {
        let mut s = crate::schema::Schema::new();
        s.relations(relation_types);
        let (schema_val, meta) = s.build();
        self.extract(transformer, text, &schema_val, &meta, opts)
    }

    /// Structured extraction using string or object field specs (Python `GLiNER2.extract_json`).
    ///
    /// `structures` must be a JSON object: parent name → array of specs (`"name::dtype::[a|b]::desc"` or object).
    pub fn extract_json(
        &self,
        transformer: &SchemaTransformer,
        text: &str,
        structures: &Value,
        opts: &ExtractOptions,
    ) -> Result<Value> {
        let obj = structures.as_object().context(
            "extract_json: structures must be a JSON object (parent → field spec array)",
        )?;
        let mut s = crate::schema::Schema::new();
        s.extract_json_structures(obj)?;
        let (schema_val, meta) = s.build();
        self.extract(transformer, text, &schema_val, &meta, opts)
    }
}