Documentation

CN Util

中文繁简体转换

use cnu::is_cn_char;

#[test]
fn test() {
  let s = "B端工具型产品在企业环境中发挥着至关重要的作用,然而,它们的复杂性常常让用户感到困扰。引导式设计成为解决这一挑战的重要策略。通过本文,我们将深入探讨B端产品引导式设计的特殊性,以及如何通过它来提高效率、降低成本,满足用户需求,创造更大价值。";
  let f = cnu::j2f(s);
  let j = cnu::f2j(s);
  dbg!(f);
  dbg!(j);

  dbg!(is_cn_char('a'));
  dbg!(is_cn_char(''));
}

输出


running 0 tests

test result: ok. 0 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; finished in 0.00s


running 1 test
test test ... ok

test result: ok. 1 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; finished in 0.00s


running 0 tests

test result: ok. 0 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; finished in 0.00s

参考资料

中文汉字和常见英文数字等的 unicode 编码范围实例页面

字符集 字数 Unicode 编码 基本汉字 20902 字 4E00-9FA5 基本汉字补充 38 字 9FA6-9FCB 扩展 A 6582 字 3400-4DB5 扩展 B 42711 字 20000-2A6D6 扩展 C 4149 字 2A700-2B734 扩展 D 222 字 2B740-2B81D 康熙部首 214 字 2F00-2FD5 部首扩展 115 字 2E80-2EF3 兼容汉字 477 字 F900-FAD9 兼容扩展 542 字 2F800-2FA1D PUA(GBK) 部件 81 字 E815-E86F 部件扩展 452 字 E400-E5E8 PUA 增补 207 字 E600-E6CF 汉字笔画 36 字 31C0-31E3 汉字结构 12 字 2FF0-2FFB 汉语注音 22 字 3105-3120 注音扩展 22 字 31A0-31BA 〇 1 字 3007 字符集 字数 Unicode 编码 数字 0-9 10 字 30-39 小写英文字母 26 字 61-7a 大写英文字母 26 字 41-5a

Detecting Chinese Characters in Unicode Strings