Structs§
Functions§
- chunk_
text - Découpe le texte en chunks de taille maximale avec chevauchement
- clean_
text - Nettoie le texte en supprimant les caractères indésirables
- count_
words - Compte le nombre de mots dans un texte
- detect_
language - Détecte la langue du texte (implémentation basique)
- estimate_
tokens - Estime le nombre de tokens (approximation: 1 token ≈ 0.75 mots)
- extract_
text_ metadata - Extrait les métadonnées basiques d’un texte
- normalize_
line_ breaks - Normalise les retours à la ligne
- remove_
empty_ lines - Supprime les lignes vides consécutives