syllabify-fr 0.5.0

Syllabification française pour l'apprentissage de la lecture — port de LireCouleur 6
Documentation
// SPDX-License-Identifier: GPL-3.0-or-later
#![warn(missing_docs)]
//! # syllabify-fr
//!
//! Syllabification française destinée à l'apprentissage de la lecture.
//! Portage en Rust de [LireCouleur 6](https://lirecouleur.forge.apps.education.fr/),
//! créé par Marie-Pierre et Luc Brungard (GPL v3).
//!
//! ## Usage rapide
//!
//! ```
//! use syllabify_fr::syllables;
//!
//! // Mode STD (défaut, comme LC6) : sépare les consonnes doubles
//! assert_eq!(syllables("famille"), vec!["fa", "mi", "lle"]);
//! assert_eq!(syllables("parlent"), vec!["par", "lent"]);
//! assert_eq!(syllables("homme"),   vec!["hom", "me"]);
//! ```

pub(crate) mod cleaner;
pub(crate) mod data;
pub(crate) mod decoder;
pub(crate) mod homographs;
pub mod html;
pub mod liaisons;
pub(crate) mod parser;
pub(crate) mod phoneme;
pub(crate) mod rules;

pub use decoder::{AssembleMode, SyllableMode, TextChunk};
pub use html::{render_html, render_word_html};
pub use liaisons::{liaison_amont, liaison_aval, liaison_possible};

/// Syllabifie un mot seul avec les paramètres par défaut
/// (mode STD comme LireCouleur 6, syllabes écrites).
///
/// ```
/// use syllabify_fr::syllables;
/// assert_eq!(syllables("chocolat"), vec!["cho", "co", "lat"]);
/// ```
pub fn syllables(word: &str) -> Vec<String> {
    syllables_with(word, false, AssembleMode::Std, SyllableMode::Written)
}

/// Syllabifie un mot avec contrôle fin des paramètres.
///
/// * `novice_reader` — désactive les post-traitements subtils (yod, o ouvert/fermé).
/// * `assemble_mode` — [`AssembleMode::Std`] (défaut pédagogique LC6) ou
///   [`AssembleMode::Lc`] (legacy, non aligné LC6 v6).
/// * `syl_mode` — [`SyllableMode::Written`] ou [`SyllableMode::Oral`].
pub fn syllables_with(
    word: &str,
    novice_reader: bool,
    assemble_mode: AssembleMode,
    syl_mode: SyllableMode,
) -> Vec<String> {
    let phonemes = decoder::extract_phonemes_word(word, novice_reader, syl_mode);
    let (sylls, nphons) = decoder::assemble_syllables(&phonemes, assemble_mode, syl_mode);
    sylls
        .iter()
        .map(|syl| {
            syl.iter()
                .map(|&i| nphons[i].letters.clone())
                .collect::<String>()
        })
        .collect()
}

/// Extrait les phonèmes d'un mot : liste de `(code, lettres)`.
///
/// ```
/// use syllabify_fr::phonemes;
/// let ph = phonemes("chat");
/// assert_eq!(ph[0], ("s^".to_string(), "ch".to_string()));
/// ```
pub fn phonemes(word: &str) -> Vec<(String, String)> {
    decoder::extract_phonemes_word(word, false, SyllableMode::Written)
        .into_iter()
        .map(|p| (p.code, p.letters))
        .collect()
}

/// Syllabifie un texte entier en préservant la ponctuation et les espaces.
///
/// Les homographes non homophones (ex : *le couvent* vs *elles couvent*)
/// sont désambiguïsés selon le mot précédent.
///
/// ```
/// use syllabify_fr::{syllabify_text, TextChunk};
/// let chunks = syllabify_text("le chat dort");
/// assert!(matches!(&chunks[0], TextChunk::Word(s) if s == &["le"]));
/// ```
pub fn syllabify_text(text: &str) -> Vec<TextChunk> {
    decoder::extract_syllables(text, false, AssembleMode::Std, SyllableMode::Written)
}