gitbook2text
Un outil CLI et une bibliothèque Rust pour télécharger des pages GitBook et les convertir en markdown et texte brut.
🚀 Installation
En tant qu'outil CLI
En tant que dépendance
Ajoutez ceci à votre Cargo.toml:
[]
= "0.2"
📖 Usage
CLI
- Créez un fichier
links.txtcontenant les URLs des pages GitBook (une par ligne):
https://docs.example.com/introduction
https://docs.example.com/getting-started
- Exécutez la commande:
Les fichiers seront sauvegardés dans:
data/md/- Fichiers markdown originauxdata/txt/- Fichiers texte nettoyés
Bibliothèque
use ;
async
🔧 Fonctionnalités
- ✅ Téléchargement concurrent de multiples pages
- ✅ Conversion markdown vers texte brut
- ✅ Nettoyage des balises GitBook spéciales
- ✅ Support des blocs de code avec titres
- ✅ Normalisation des espaces et caractères
📝 API Documentation
Pour la documentation complète de l'API, visitez docs.rs/gitbook2text.
🤝 Contribuer
Les contributions sont les bienvenues! N'hésitez pas à ouvrir une issue ou une pull request.
📄 License
Ce projet est sous double licence MIT ou Apache-2.0, à votre choix.
- MIT License (LICENSE-MIT ou http://opensource.org/licenses/MIT)
- Apache License, Version 2.0 (LICENSE-APACHE ou http://www.apache.org/licenses/LICENSE-2.0)