Crate rust_mando

Expand description

Chinese → Pīnyīn conversion with jieba word segmentation.

§Architecture

Layer	Crate / module	Role
Segmentation	`jieba-rs`	word boundaries + context
Lookup	`src/pinyin_dict.rs`	Chinese characters → pinyin_numbers
Conversion	`pinyin_dict::numbers_to_marks`	pinyin_numbers → pinyin_marks
Protocol	`wasm-minimal-protocol`	Typst WASM ABI

File	Purpose
`dict/dict.txt.big`	jieba extended segmentation dict
`dict/cedict_ts.u8`	CC-CEDICT source for pinyin lookup

See dict/README.md for download instructions.

Segment: One segment per jieba word boundary, with pīnyīn syllables. pinyin is None (JSON null) for non-Chinese tokens.

__wasm_minimal_protocol_internal_function_pinyin_flat
__wasm_minimal_protocol_internal_function_pinyin_segmented
pinyin_flat: Returns flat space-separated pīnyīn as UTF-8 bytes.
pinyin_segmented: Returns JSON array [{"word":"…","pinyin":["…"]|null},…] as UTF-8 bytes.
to_pinyin_flat: Space-separated pīnyīn string. Non-Chinese tokens are omitted entirely. style: "numbers" for tone numbers, anything else for tone marks.
to_pinyin_segmented: One Segment per jieba word boundary.