Crate japanese_text

Crate japanese_text 

Source
Expand description

§japanese-text

日本語テキスト正規化のための軽量なRustライブラリ

§特徴

  • 全角⇔半角変換(ASCII文字)
  • カタカナ⇔ひらがな変換
  • シンプルでゼロ依存の実装

§使用例

use japanese_text::*;

// 全角→半角変換
assert_eq!(to_half_width("ABC123"), "ABC123");

// 半角→全角変換
assert_eq!(to_full_width("ABC123"), "ABC123");

// カタカナ→ひらがな変換
assert_eq!(to_hiragana("カタカナ"), "かたかな");

// ひらがな→カタカナ変換
assert_eq!(to_katakana("ひらがな"), "ヒラガナ");

Structs§

CharacterTypes
文字列内の各文字種の数をカウントします。

Functions§

count_character_types
expand_iteration_marks
繰り返し記号を展開します。
half_width_katakana_to_full_width
半角カタカナを全角カタカナに変換します。
is_full_width
文字が全角文字かどうかを判定します。
is_half_width_katakana
文字が半角カタカナかどうかを判定します。
is_hiragana
文字がひらがなかどうかを判定します。
is_kanji
文字が漢字(CJK統合漢字)かどうかを判定します。
is_katakana
文字がカタカナかどうかを判定します。
normalize_prolonged_sound
長音記号を正規化します(ー、〜、~などを統一)。
normalize_whitespace
文字列内の空白文字を正規化します(全角スペース、タブなどを半角スペースに統一)。
to_full_width
半角ASCII文字を全角に変換します。
to_half_width
全角ASCII文字を半角に変換します。
to_hiragana
カタカナをひらがなに変換します。
to_katakana
ひらがなをカタカナに変換します。