ferrous-opencc 0.4.0

A pure Rust implementation of Open Chinese Convert (OpenCC), for fast and reliable conversion between Traditional and Simplified Chinese.
Documentation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
{
	"cases": [
		{
			"id": "case_001",
			"input": "虛偽歎息",
			"expected": {
				"hk2s": "虚伪叹息"
			}
		},
		{
			"id": "case_002",
			"input": "潮濕灶台",
			"expected": {
				"hk2s": "潮湿灶台"
			}
		},
		{
			"id": "case_003",
			"input": "讚歎沙河涌洶湧的波浪",
			"expected": {
				"hk2s": "赞叹沙河涌汹涌的波浪"
			}
		},
		{
			"id": "case_004",
			"input": "為賦新詞強説愁",
			"expected": {
				"hk2t": "爲賦新詞強說愁"
			}
		},
		{
			"id": "case_005",
			"input": "想到自己一緊張就口吃,我就沒胃口吃飯",
			"expected": {
				"hk2t": "想到自己一緊張就口吃,我就沒胃口喫飯",
				"tw2t": "想到自己一緊張就口吃,我就沒胃口喫飯"
			}
		},
		{
			"id": "case_006",
			"input": "旧字体歴史仮名遣 新字体現代仮名遣",
			"expected": {
				"jp2t": "舊字體歷史假名遣 新字體現代假名遣"
			}
		},
		{
			"id": "case_007",
			"input": "横浜 糸魚川 伊予国",
			"expected": {
				"jp2t": "橫濱 絲魚川 伊豫國"
			}
		},
		{
			"id": "case_008",
			"input": "駅弁当 弁別 弁護士 弁膜",
			"expected": {
				"jp2t": "驛辨當 辨別 辯護士 瓣膜"
			}
		},
		{
			"id": "case_009",
			"input": "芸術 欠航 欠缺 飲料缶",
			"expected": {
				"jp2t": "藝術 缺航 欠缺 飲料罐"
			}
		},
		{
			"id": "case_010",
			"input": "虚伪叹息",
			"expected": {
				"s2hk": "虛偽嘆息"
			}
		},
		{
			"id": "case_011",
			"input": "潮湿灶台",
			"expected": {
				"s2hk": "潮濕灶台"
			}
		},
		{
			"id": "case_012",
			"input": "赞叹沙河涌汹涌的波浪",
			"expected": {
				"s2hk": "讚歎沙河涌洶湧的波浪"
			}
		},
		{
			"id": "case_013",
			"input": "为了核实这说法",
			"expected": {
				"s2hk": "為了核實這説法"
			}
		},
		{
			"id": "case_014",
			"input": "高剂量的苦瓜素还会抑制胚胎发育",
			"expected": {
				"s2hk": "高劑量的苦瓜素還會抑制胚胎發育",
				"s2t": "高劑量的苦瓜素還會抑制胚胎發育",
				"s2tw": "高劑量的苦瓜素還會抑制胚胎發育",
				"s2twp": "高劑量的苦瓜素還會抑制胚胎發育"
			}
		},
		{
			"id": "case_015",
			"input": "夸夸其谈 夸父逐日",
			"expected": {
				"s2t": "誇誇其談 夸父逐日"
			}
		},
		{
			"id": "case_016",
			"input": "我干什么不干你事。",
			"expected": {
				"s2t": "我幹什麼不干你事。"
			}
		},
		{
			"id": "case_017",
			"input": "太后的头发很干燥。",
			"expected": {
				"s2t": "太后的頭髮很乾燥。"
			}
		},
		{
			"id": "case_018",
			"input": "燕燕于飞,差池其羽。之子于归,远送于野。",
			"expected": {
				"s2t": "燕燕于飛,差池其羽。之子于歸,遠送於野。"
			}
		},
		{
			"id": "case_019",
			"input": "请成相,世之殃,愚暗愚暗堕贤良。人主无贤,如瞽无相何伥伥!请布基,慎圣人,愚而自专事不治。主忌苟胜,群臣莫谏必逢灾。",
			"expected": {
				"s2t": "請成相,世之殃,愚闇愚闇墮賢良。人主無賢,如瞽無相何倀倀!請布基,慎聖人,愚而自專事不治。主忌苟勝,羣臣莫諫必逢災。"
			}
		},
		{
			"id": "case_020",
			"input": "曾经有一份真诚的爱情放在我面前,我没有珍惜,等我失去的时候我才后悔莫及。人事间最痛苦的事莫过于此。如果上天能够给我一个再来一次得机会,我会对那个女孩子说三个字,我爱你。如果非要在这份爱上加个期限,我希望是,一万年。",
			"expected": {
				"s2t": "曾經有一份真誠的愛情放在我面前,我沒有珍惜,等我失去的時候我才後悔莫及。人事間最痛苦的事莫過於此。如果上天能夠給我一個再來一次得機會,我會對那個女孩子說三個字,我愛你。如果非要在這份愛上加個期限,我希望是,一萬年。"
			}
		},
		{
			"id": "case_021",
			"input": "新的理论被发现了。",
			"expected": {
				"s2t": "新的理論被發現了。"
			}
		},
		{
			"id": "case_022",
			"input": "金胄不是金色的甲胄。",
			"expected": {
				"s2t": "金胄不是金色的甲冑。"
			}
		},
		{
			"id": "case_023",
			"input": "经理发现后劝谕两人",
			"expected": {
				"s2t": "經理發現後勸諭兩人"
			}
		},
		{
			"id": "case_024",
			"input": "想到自己一紧张就口吃,我就没胃口吃饭",
			"expected": {
				"s2t": "想到自己一緊張就口吃,我就沒胃口喫飯"
			}
		},
		{
			"id": "case_025",
			"input": "恒指最新消息,恒生指数跌破 2 万点",
			"expected": {
				"s2t": "恒指最新消息,恒生指數跌破 2 萬點"
			}
		},
		{
			"id": "case_026",
			"input": "恒生银行和恒大集团发布财报",
			"expected": {
				"s2t": "恒生銀行和恒大集團發佈財報"
			}
		},
		{
			"id": "case_027",
			"input": "着装污染虚伪发泄棱柱群众里面",
			"expected": {
				"s2tw": "著裝汙染虛偽發洩稜柱群眾裡面"
			}
		},
		{
			"id": "case_028",
			"input": "鲶鱼和鲇鱼是一种生物。",
			"expected": {
				"s2tw": "鯰魚和鯰魚是一種生物。"
			}
		},
		{
			"id": "case_029",
			"input": "鼠标里面的硅二极管坏了,导致光标分辨率降低。",
			"expected": {
				"s2twp": "滑鼠裡面的矽二極體壞了,導致游標解析度降低。"
			}
		},
		{
			"id": "case_030",
			"input": "我们在老挝的服务器的硬盘需要使用互联网算法软件解决异步的问题。",
			"expected": {
				"s2twp": "我們在寮國的伺服器的硬碟需要使用網際網路演算法軟體解決非同步的問題。"
			}
		},
		{
			"id": "case_031",
			"input": "为什么你在床里面睡着?",
			"expected": {
				"s2twp": "為什麼你在床裡面睡著?"
			}
		},
		{
			"id": "case_032",
			"input": "海内存知己",
			"expected": {
				"s2twp": "海內存知己"
			}
		},
		{
			"id": "case_033",
			"input": "摩尔线程",
			"expected": {
				"s2twp": "摩爾線程"
			}
		},
		{
			"id": "case_034",
			"input": "字节跳动",
			"expected": {
				"s2twp": "字節跳動"
			}
		},
		{
			"id": "case_035",
			"input": "潮溼的露臺",
			"expected": {
				"t2hk": "潮濕的露台"
			}
		},
		{
			"id": "case_036",
			"input": "爲了覈實這說法",
			"expected": {
				"t2hk": "為了核實這説法"
			}
		},
		{
			"id": "case_037",
			"input": "包糉子活動告一段落",
			"expected": {
				"t2hk": "包粽子活動告一段落"
			}
		},
		{
			"id": "case_038",
			"input": "舊字體歷史假名遣 新字體現代假名遣",
			"expected": {
				"t2jp": "旧字体歴史仮名遣 新字体現代仮名遣"
			}
		},
		{
			"id": "case_039",
			"input": "橫濱 絲魚川 伊豫國",
			"expected": {
				"t2jp": "横浜 糸魚川 伊予国"
			}
		},
		{
			"id": "case_040",
			"input": "驛辨當 辨別 辯護士 瓣膜",
			"expected": {
				"t2jp": "駅弁当 弁別 弁護士 弁膜"
			}
		},
		{
			"id": "case_041",
			"input": "藝術 缺航 飲料罐",
			"expected": {
				"t2jp": "芸術 欠航 飲料缶"
			}
		},
		{
			"id": "case_042",
			"input": "曾經有一份真誠的愛情放在我面前,我沒有珍惜,等我失去的時候我才後悔莫及。人事間最痛苦的事莫過於此。如果上天能夠給我一個再來一次得機會,我會對那個女孩子說三個字,我愛你。如果非要在這份愛上加個期限,我希望是,一萬年。",
			"expected": {
				"t2s": "曾经有一份真诚的爱情放在我面前,我没有珍惜,等我失去的时候我才后悔莫及。人事间最痛苦的事莫过于此。如果上天能够给我一个再来一次得机会,我会对那个女孩子说三个字,我爱你。如果非要在这份爱上加个期限,我希望是,一万年。"
			}
		},
		{
			"id": "case_043",
			"input": "二噁英",
			"expected": {
				"t2s": "二𫫇英"
			}
		},
		{
			"id": "case_044",
			"input": "著裝著作汙染虛偽發洩稜柱群眾裡面",
			"expected": {
				"tw2s": "着装著作污染虚伪发泄棱柱群众里面"
			}
		},
		{
			"id": "case_045",
			"input": "滑鼠裡面的矽二極體壞了,導致游標解析度降低。",
			"expected": {
				"tw2sp": "鼠标里面的硅二极管坏了,导致光标分辨率降低。"
			}
		},
		{
			"id": "case_046",
			"input": "我們在寮國的伺服器的硬碟需要使用網際網路演算法軟體解決非同步的問題。",
			"expected": {
				"tw2sp": "我们在老挝的服务器的硬盘需要使用互联网算法软件解决异步的问题。"
			}
		},
		{
			"id": "case_047",
			"input": "為什麼你在床裡面睡著?",
			"expected": {
				"tw2sp": "为什么你在床里面睡着?"
			}
		},
		{
			"id": "case_048",
			"input": "用滑鼠點選正規表示式",
			"expected": {
				"tw2sp": "用鼠标点击正则表达式"
			}
		},
		{
			"id": "case_049",
			"input": "KB大橋也被視為帛琉人的後花園",
			"expected": {
				"tw2sp": "KB大桥也被视为帕劳人的后花园"
			}
		},
		{
			"id": "case_050",
			"input": "這個軟體裡有一套軟體動物的資料庫",
			"expected": {
				"tw2sp": "这个软件里有一套软体动物的数据库"
			}
		},
		{
			"id": "case_051",
			"input": "為了眾人化妝床頭裡面衛生,醞釀群峰鐵鉤嘆氣事件",
			"expected": {
				"tw2t": "爲了衆人化妝牀頭裏面衛生,醞釀羣峯鐵鉤嘆氣事件"
			}
		},
		{
			"id": "case_052",
			"input": "在廚房裡做手擀麵",
			"expected": {
				"tw2t": "在廚房裏做手擀麪"
			}
		},
		{
			"id": "ByVoid_OpenCC_Issue714",
			"input": "寫一個解算器程式來解決方程式",
			"expected": {
				"tw2sp": "写一个解算器程序来解决方程式",
				"t2s": "写一个解算器程式来解决方程式"
			}
		},
		{
			"id": "ByVoid_OpenCC_Issue950_AlgorithmConversion",
			"input": "算法",
			"expected": {
				"s2t": "算法",
				"s2tw": "算法",
				"s2twp": "演算法",
				"s2hk": "算法",
				"tw2sp": "算法"
			}
		},
		{
			"id": "ByVoid_OpenCC_Issue950_AlgorithmConversionRev",
			"input": "演算法",
			"expected": {
				"s2t": "演算法",
				"s2tw": "演算法",
				"s2twp": "演算法",
				"s2hk": "演算法",
				"tw2s": "演算法",
				"tw2sp": "算法",
				"tw2t": "演算法",
				"t2s": "演算法",
				"t2hk": "演算法"
			}
		},
		{
			"id": "ByVoid_OpenCC_Issue950_AlgorithmInPhrase",
			"input": "排序算法很重要",
			"expected": {
				"s2twp": "排序演算法很重要"
			}
		},
		{
			"id": "nVidia_naming_s2t",
			"input": "英伟达",
			"expected": {
				"s2twp": "輝達",
				"s2t": "英偉達",
				"s2tw": "英偉達",
				"s2hk": "英偉達"
			}
		},
		{
			"id": "nVidia_naming_t2s",
			"input": "輝達",
			"expected": {
				"tw2sp": "英伟达",
				"t2s": "辉达",
				"tw2s": "辉达",
				"hk2s": "辉达"
			}
		},
		{
			"id": "medical_terms_tw_s2twp",
			"input": "前列腺癌、抑郁症、胰腺炎是常见疾病",
			"expected": {
				"s2t": "前列腺癌、抑鬱症、胰腺炎是常見疾病",
				"s2tw": "前列腺癌、抑鬱症、胰腺炎是常見疾病",
				"s2twp": "攝護腺癌、憂鬱症、胰臟炎是常見疾病"
			}
		},
		{
			"id": "medical_terms_tw_tw2sp",
			"input": "攝護腺、憂鬱症、胰臟的醫學術語",
			"expected": {
				"tw2s": "摄护腺、忧郁症、胰脏的医学术语",
				"tw2sp": "前列腺、抑郁症、胰腺的医学术语",
				"t2s": "摄护腺、忧郁症、胰脏的医学术语"
			}
		},
		{
			"id": "BYVoid_OpenCC_Issue_475",
			"input": "元数据 元數據 调制 调制解调器",
			"expected": {
				"s2twp": "後設資料 後設資料 調變 數據機",
				"s2tw": "元數據 元數據 調製 調製解調器",
				"s2t": "元數據 元數據 調製 調製解調器"
			}
		},
		{
			"id": "variants_tw_s2twp",
			"input": "社區 所罗门群岛 复选框 复选按钮",
			"expected": {
				"s2twp": "社群 索羅門群島 核取方塊 核取按鈕",
				"s2tw": "社區 所羅門群島 複選框 複選按鈕",
				"s2t": "社區 所羅門羣島 複選框 複選按鈕"
			}
		},
		{
			"id": "variants_tw_tw2sp",
			"input": "社群 索羅門群島 核取方塊 核取按鈕",
			"expected": {
				"tw2sp": "社区 所罗门群岛 复选框 复选按钮",
				"tw2s": "社群 索罗门群岛 核取方块 核取按钮",
				"t2s": "社群 索罗门群岛 核取方块 核取按钮"
			}
		},
		{
			"id": "BYVoid_OpenCC_Issue_988",
			"input": "上下数千年,纵横几万里",
			"expected": {
				"s2t": "上下數千年,縱橫幾萬里"
			}
		},
		{
			"id": "s2twp_gong_yuan_to_xi_yuan",
			"input": "公元前100年,公元1949年,采用公元纪年",
			"expected": {
				"s2twp": "西元前100年,西元1949年,採用公元紀年"
			}
		},
		{
			"id": "macro_terms_s2twp",
			"input": "宏定义、宏展开、宏调用、宏替换、宏命令、宏语言、宏处理、宏函数、宏指令和宏编程",
			"expected": {
				"s2twp": "巨集定義、巨集展開、巨集呼叫、巨集替換、巨集命令、巨集語言、巨集處理、巨集函式、巨集指令和巨集程式設計"
			}
		},
		{
			"id": "macro_terms_tw2sp",
			"input": "巨集定義、巨集展開、巨集呼叫、巨集替換、巨集命令、巨集語言、巨集處理、巨集函式、巨集指令和巨集程式設計",
			"expected": {
				"tw2sp": "宏定义、宏展开、宏调用、宏替换、宏命令、宏语言、宏处理、宏函数、宏指令和宏编程"
			}
		},
		{
			"id": "BYVoid_OpenCC_Issue_582",
			"input": "倒霉",
			"expected": {
				"s2t": "倒霉",
				"s2tw": "倒霉",
				"s2twp": "倒霉",
				"s2hk": "倒霉"
			}
		},
		{
			"id": "console_stays_unchanged",
			"input": "控制台",
			"expected": {
				"s2t": "控制台",
				"s2tw": "控制台",
				"s2twp": "控制台",
				"s2hk": "控制台",
				"t2s": "控制台",
				"t2tw": "控制台",
				"t2hk": "控制台",
				"tw2s": "控制台",
				"tw2sp": "控制台",
				"tw2t": "控制台",
				"hk2s": "控制台",
				"hk2t": "控制台"
			}
		},
		{
			"id": "stardew_valley",
			"input": "星露谷物语",
			"expected": {
				"s2t": "星露谷物語",
				"s2tw": "星露谷物語",
				"s2twp": "星露谷物語",
				"s2hk": "星露谷物語"
			}
		},
		{
			"id": "mobile_data_s2twp",
			"input": "移动数据",
			"expected": {
				"s2t": "移動數據",
				"s2tw": "移動數據",
				"s2twp": "行動數據"
			}
		},
		{
			"id": "mobile_data_tw2sp",
			"input": "行動數據",
			"expected": {
				"tw2sp": "移动数据"
			}
		},
		{
			"id": "big_data_s2twp",
			"input": "大数据",
			"expected": {
				"s2t": "大數據",
				"s2tw": "大數據",
				"s2twp": "大數據"
			}
		},
		{
			"id": "hk_place_connaught_road",
			"input": "干诺道",
			"expected": {
				"s2t": "干諾道",
				"s2hk": "干諾道",
				"s2tw": "干諾道",
				"s2twp": "干諾道"
			}
		},
		{
			"id": "hk_place_quarry_bay",
			"input": "鲗鱼涌",
			"expected": {
				"s2t": "鰂魚涌",
				"s2hk": "鰂魚涌",
				"s2tw": "鰂魚涌",
				"s2twp": "鰂魚涌"
			}
		},
		{
			"id": "obama_s2twp",
			"input": "奥巴马",
			"expected": {
				"s2t": "奧巴馬",
				"s2tw": "奧巴馬",
				"s2twp": "歐巴馬"
			}
		},
		{
			"id": "obama_tw2sp",
			"input": "歐巴馬",
			"expected": {
				"tw2sp": "奥巴马"
			}
		},
		{
			"id": "BYVoid_OpenCC_Issue_backpack",
			"input": "背包",
			"expected": {
				"s2t": "背包",
				"s2tw": "背包",
				"s2twp": "背包",
				"s2hk": "背包"
			}
		},
		{
			"id": "BYVoid_OpenCC_Issue_1001_nian_fo",
			"input": "念佛",
			"expected": {
				"s2t": "念佛",
				"s2tw": "念佛",
				"s2twp": "念佛",
				"s2hk": "念佛"
			}
		}
	]
}