Expand description
§japanese-text
日本語テキスト正規化のための軽量なRustライブラリ
§特徴
- 全角⇔半角変換(ASCII文字)
- カタカナ⇔ひらがな変換
- シンプルでゼロ依存の実装
§使用例
use japanese_text::*;
// 全角→半角変換
assert_eq!(to_half_width("ABC123"), "ABC123");
// 半角→全角変換
assert_eq!(to_full_width("ABC123"), "ABC123");
// カタカナ→ひらがな変換
assert_eq!(to_hiragana("カタカナ"), "かたかな");
// ひらがな→カタカナ変換
assert_eq!(to_katakana("ひらがな"), "ヒラガナ");Structs§
- Character
Types - 文字列内の各文字種の数をカウントします。
Functions§
- count_
character_ types - expand_
iteration_ marks - 繰り返し記号を展開します。
- half_
width_ katakana_ to_ full_ width - 半角カタカナを全角カタカナに変換します。
- is_
full_ width - 文字が全角文字かどうかを判定します。
- is_
half_ width_ katakana - 文字が半角カタカナかどうかを判定します。
- is_
hiragana - 文字がひらがなかどうかを判定します。
- is_
kanji - 文字が漢字(CJK統合漢字)かどうかを判定します。
- is_
katakana - 文字がカタカナかどうかを判定します。
- normalize_
prolonged_ sound - 長音記号を正規化します(ー、〜、~などを統一)。
- normalize_
whitespace - 文字列内の空白文字を正規化します(全角スペース、タブなどを半角スペースに統一)。
- to_
full_ width - 半角ASCII文字を全角に変換します。
- to_
half_ width - 全角ASCII文字を半角に変換します。
- to_
hiragana - カタカナをひらがなに変換します。
- to_
katakana - ひらがなをカタカナに変換します。