kreuzberg 4.8.0

High-performance document intelligence library for Rust. Extract text, metadata, and structured data from PDFs, Office documents, images, and 91+ formats and 248 programming languages via tree-sitter code intelligence with async/sync APIs.
Documentation
//! EasyOCR language support.
//!
//! EasyOCR supports 83 languages with broad multilingual coverage.

/// Get list of languages supported by EasyOCR.
///
/// # Returns
///
/// A vector of 83 language codes supported by EasyOCR.
pub(in crate::ocr) fn languages() -> Vec<String> {
    vec![
        "abq".to_string(),
        "ady".to_string(),
        "af".to_string(),
        "ang".to_string(),
        "ar".to_string(),
        "as".to_string(),
        "ava".to_string(),
        "az".to_string(),
        "be".to_string(),
        "bg".to_string(),
        "bh".to_string(),
        "bho".to_string(),
        "bn".to_string(),
        "bs".to_string(),
        "ch_sim".to_string(),
        "ch_tra".to_string(),
        "che".to_string(),
        "cs".to_string(),
        "cy".to_string(),
        "da".to_string(),
        "dar".to_string(),
        "de".to_string(),
        "en".to_string(),
        "es".to_string(),
        "et".to_string(),
        "fa".to_string(),
        "fr".to_string(),
        "ga".to_string(),
        "gom".to_string(),
        "hi".to_string(),
        "hr".to_string(),
        "hu".to_string(),
        "id".to_string(),
        "inh".to_string(),
        "is".to_string(),
        "it".to_string(),
        "ja".to_string(),
        "kbd".to_string(),
        "kn".to_string(),
        "ko".to_string(),
        "ku".to_string(),
        "la".to_string(),
        "lbe".to_string(),
        "lez".to_string(),
        "lt".to_string(),
        "lv".to_string(),
        "mah".to_string(),
        "mai".to_string(),
        "mi".to_string(),
        "mn".to_string(),
        "mr".to_string(),
        "ms".to_string(),
        "mt".to_string(),
        "ne".to_string(),
        "new".to_string(),
        "nl".to_string(),
        "no".to_string(),
        "oc".to_string(),
        "pi".to_string(),
        "pl".to_string(),
        "pt".to_string(),
        "ro".to_string(),
        "ru".to_string(),
        "rs_cyrillic".to_string(),
        "rs_latin".to_string(),
        "sck".to_string(),
        "sk".to_string(),
        "sl".to_string(),
        "sq".to_string(),
        "sv".to_string(),
        "sw".to_string(),
        "ta".to_string(),
        "tab".to_string(),
        "te".to_string(),
        "th".to_string(),
        "tjk".to_string(),
        "tl".to_string(),
        "tr".to_string(),
        "ug".to_string(),
        "uk".to_string(),
        "ur".to_string(),
        "uz".to_string(),
        "vi".to_string(),
    ]
}