-
Notifications
You must be signed in to change notification settings - Fork 46
/
Copy pathcnsphoneticlite.cin
93667 lines (93666 loc) · 813 KB
/
cnsphoneticlite.cin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
#文件名稱:全字庫注音輸入法表格檔(精簡版)2016-08 cnsphoneticlite.cin
#檔案修改者:趙惟倫 <[email protected]>
#修改部分1:參考全字庫注音輸入法表格檔2012-04lite CnsPhonetic2012-04lite_hime.cin(精簡版)
#修改部分2:刪除原始檔案最後35列方言發音
#修改部分3:刪除 Unicode 15 字面 U+F****
#修改部分4:依照 Unicode 排序後移動 CJK Unified Ideographs Extension A 至 B 前方
#原始檔頭如下
#-----------------------------------------------------------
#文件名稱:全字庫注音輸入法表格檔2016-08 { CnsPhonetic2016-08_GCINv2.cin (全都錄版) for Debian Linux v8.5 (AMD64) + GNOME + gcin 2.8.2 }
#文件授權1:Public Domain (公眾授權) 這是參考"全字庫注音輸入法參考檔"2006.2的。
#文件授權2:http://creativecommons.org/licenses/by-nc-nd/3.0/tw/ 姓名標示-非商業性-禁止改作 3.0 台灣 (CC BY-NC-ND 3.0 TW) 這是筆者個人看得懂的。
#檔案編製者:賀師彥 <[email protected]> 於 中華民國 臺灣
#本檔連結:http://www.openfoundry.org/of/projects/1603
#更新日期:2016年08月v2 第九次「微幅」更新(感謝網友CHChan協助debug,這份文件內移除了五筆重複資料。政府原始的參考資料就已經有資料重複的狀況)
#更新日期:2016年08月 第九次「微幅」更新(文件說明文字內容部分細節更新)
#更新日期:2016年05月 第八次「微幅」更新(文件說明文字內容大量更新)
#更新日期:2016年03月 第七次「微幅」更新(更新單位詞和符號詞)
#更新日期:2016年02月 第六次「微幅」更新
#更新日期:2016年01月 第五次「微幅」更新
#更新日期:2015年10月 第四次「微幅」更新
#更新日期:2014年04月 第三次更新
#更新日期:2012年04月 第二次修正+更新
#更新日期:2012年03月 第一次更新
#更新日期:2010年09月 第一次修正
#製作日期:2010年08月 第一次釋出
#-----------------------------------------------------------
#
#關於本檔案的編製過程:
#
#古早之前www.opendesktop.org.tw有一個"全字庫注音輸入法參考檔",但是
#v2006.2版本之後就沒更新了。因此產生一個想法,以筆者有限的試算表軟體和
#進階純文字編輯器的操作能力,有無可能參考"全字庫注音輸入法參考檔"的基本
#規格,再製作一份2016年的最新版本出來?在憑一己之力google了許多網路資
#源,以及問到關鍵的字串批次取代函示參數之後,終於製作出這份"全字庫注音輸
#入法表格檔"。筆者盡量嘗試將這個檔案的編製過程描述出來。
#
#第一步就上中華民國政府網站,下載最原始的表格檔案,有兩個網址:
#CNS11643中文標準交換碼全字庫(簡稱全字庫) | 政府資料開放平臺
#http://data.gov.tw/node/5961
#CNS11643 中文全字庫-首頁
#http://www.cns11643.gov.tw/
#政府資料開放平臺的頁面,理論上可以找到"TXT"字樣的這個可下載項目,理論
#上要可以正常下載一個約250MB上下的Open_Data.zip,這裡要注意,臺灣政
#府網站常常會「不穩」,不一定第一次就能下載成功。筆者在當下所下載的
#Open_Data.zip,解壓縮後,主要會用到的幾個檔案,檔案製作日期顯示如下:
#---
# 2015年11月26日 TW-Kai-98_1.ttf
# 2015年07月09日 TW-Kai-Ext-B-98_1.ttf
# 2016年07月28日 TW-Kai-Plus-98_1.ttf
#---
# 2015年08月05日 TW-Sung-98_1.ttf
# 2016年05月10日 TW-Sung-Ext-B-98_1.ttf
# 2016年07月28日 TW-Sung-Plus-98_1.ttf
#---
# 2016年08月01日 CNS2UNICODE_Unicode BMP.txt
# 2016年08月01日 CNS2UNICODE_Unicode 2.txt
# 2016年08月01日 CNS2UNICODE_Unicode 15.txt
#---
# 2016年08月01日 CNS_phonetic.txt
#---
#接下來將要嘗試把以上四個".txt"表格資料檔案,重新彙整排序組合成一般個
#人電腦中文輸入法框架軟體所能接受的「注音輸入法表格檔」"*.CIN"格式。
#若筆者在短時間內順利推出這個檔案,那麼「理論上」可以呈現一個情境,就是
#透過這個檔案以及相關配套(包含全字庫字型、作業系統、輸入法框架軟體的支
#援),使用者可以藉由本「注音輸入法表格」,來選取、輸入中華民國臺灣政府
#於「2016年08月份」「為止」,所規範、整理、列管、並數位化的所有"現代
#正體中文漢字",只是過了2016年08月份「之後」,就不一定了,可能變成舊
#版了,「不見得」是最全的。還有要注意,本檔案預設是所謂的「全都錄版」,
#也就是原始資料只要有在CNS_phonetic.txt裡頭就通收,不管它(對應的漢字
#)來源可能包含中華民國臺灣(正體中文漢字)以外的其它亞洲地區的漢字,例如
#對岸中國大陸的"簡化/繁體"漢字、日文漢字、韓文漢字、香港粵語白話字、越
#南喃字、以及一些異體字。甚至還包含有目前只是暫存的Unicode私人造字區碼
#位約兩萬多個漢字。所以選字的時後,還是要多看幾眼,最好把輸入法框架軟體
#「選字框的字級」設定的更大一些,以方便肉眼辨識,畢竟「全都錄」之後,有
#些字的差異可能會是只有很微小的一撇,不放大字級還不一定能在第一時間用肉
#眼辨識出來。
#
#另外,使用者可能會發現其中會有四千多個「ㄇㄡˇ」,筆者過去曾經詢問過全
#字庫單位,回應的大意是說,因為該字的發音/注音尚未被正式定義,所以暫時
#先用「ㄇㄡˇ」替代,將來若有定義正式注音符號發音,會再做出修正(奇怪,都
#過五年了,怎麼還是四千多個「ㄇㄡˇ」!?政府單位好像一點工作進度都沒有?
#另外"單位詞和符號詞"也是有的字有發音,有的字"還沒有"被定義注音符號發音
#,政府單位真的是“事情做半套”(這裡指的是當下在全字庫查詢的結果))。
#
#接下來就要開始處理四個*.TXT檔案:
#CNS2UNICODE_Unicode BMP.txt
#CNS2UNICODE_Unicode 2.txt
#CNS2UNICODE_Unicode 15.txt
#CNS_phonetic.txt
#每個使用者所熟悉慣用的進階純文字編輯器、試算表軟體、作業系統平台,皆有
#所不同,筆者在這裡描述的範例環境為TextWrangler.app + LibreOffice 5.1 Calc
# + MacOSX,這裡要先注意,試算表軟體需要搭配使用能夠處理超過65536列
#的軟體版本。在本文件中,筆者的目標是,盡可能的「只使用」進階純文字編輯
#器和試算表軟體「本身既有」的全圖形介面操作功能,互相交錯使用,兩者「互
#相」來來回回、剪剪貼貼、匯入匯出,來完成整個檔案的所有編製流程,避免接
#觸到開終端機下指令以及攥寫額外的script。
#
#開始使用進階純文字編輯器將CNS_phonetic.txt檔案內「所有的」「輕聲符號」
#移動到注音符號「之後」。將輕聲符號移動好的CNS_phonetic.txt先多備一份
#,以防萬一。將CNS_phonetic.txt第一個CNS字面欄位和第二個CNS字碼欄位
#,中間填入"-",來合併成「一個」「CNS字面-CNS字碼」的欄位。
#使用進階純文字編輯器依序前、中、後將CNS2UNICODE_Unicode BMP.txt、
#CNS2UNICODE_Unicode 2.txt、CNS2UNICODE_Unicode 15.txt三個檔
#案合併。新合併好的CNS2UNICODE_Unicode檔案,將第一個CNS字面欄位和第
#二個CNS字碼欄位,中間填入"-",來合併成「一個」「CNS字面-CNS字碼」的
#欄位。用試算表軟體準備編輯大量資料,這裡以LibreOffice 5.1 Calc為操
#作範例,首先得要將Calc的操作環境偏好設定選項做好客製化,將工作表內的
#「所有儲存格」,預設成「正體中文字型」、較大的字級,儲存格內容(儲存格
#格式化)設定「分類」為「文字」,工具\自動校正選項\選項\全部「取消勾選」
#,「取消勾選」"格式化序數後綴",偏好設定\語言設定\書寫輔助\選項「取消勾選」
#拼字和文法檢查相關的項目。或許在LibreOffice Calc更新改版之後,會出現
#新的設定選項,而大原則就是,關閉試算表軟體內的自動校正/取代、文法檢查功能。
#
#完成試算表軟體環境設定之後,將CNS_phonetic.txt的全部內容,全選複製
#貼上/匯入於試算表內的工作表(可將工作表命名為"CNS_phonetic"),修改
#「排序條件」為「先按照」「注音符號」欄位,「然後按照」「CNS字面-CNS字碼」
#欄位來排序。排序後會發現注音符號欄位的最開頭,還有另外幾十個以英文字母
#和數字組合成的拼音模式,注音符號欄位的最後端,也有幾十個標識/示意漢字
#用途的單位詞/符號詞字樣,這些內容可以「先不用」刪除,留者跟其他注音符
#號一起處理,使用者可以留到處理流程的最後,再自行決定要刪除或留下這些列
#的內容。
#
#再來將合併過的CNS2UNICODE_Unicode的全部內容,匯入/全選複製貼上於試
#算表內的第二個工作表(可將工作表命名為"CNS2UNICODE_Unicode")。
#
#試算表軟體匯入文字時,注意要設定的對話框,匯入文字\分隔,勾選「定位鍵」
#,「文字分隔符」欄位內容要清空,「全選」欄位預覽內容,然後
#「欄的類型」選「文字」。
#
#再來,需要取用CNS2UNICODE_Unicode工作表裡頭的「CNS字面-CNS字碼」、
#「Unicode字碼」這兩個欄位,整合到CNS_phonetic工作表作為對照。
#
#CNS_phonetic工作表作的「欄位A」內容此時會是「CNS字面-CNS字碼」、
#欄位B此時是「注音符號」,欄位A、B全選後的「排序條件」設定為「排序鍵1」
#選「欄B」,可以發現欄位B的排序依序變成了名詞條、注音符號、拼音符號。
#再來將CNS2UNICODE_Unicode工作表裡頭的「CNS字面-CNS字碼」、
#「Unicode字碼」這兩個欄位全選複製到CNS_phonetic工作表的欄位D和E。
#選取CNS_phonetic工作表「欄位C」(「只選擇」欄位A「有內容的列」),
#執行「函示精靈」,勾選視窗左下角的「陣列」,選用"VLOOKUP"函示。
#公式大概長以下這樣:
#(因為編輯的來源資料的版本差異以及編輯環境的不同,以下數據和欄位「不是」絕對。)
#=VLOOKUP(SearchCriterion; Array; Index; SortOrder)
#=VLOOKUP(C1:C114390,K1:L107279,2,0)
#執行後,可能因為列數太多,運算時間非常耗時,滑鼠游標圖示不斷的在狂轉
#中,感覺上會像是當掉了(等彩球轉了兩個多小時才停下來,或許VLOOKUP這個
#步驟會有更有效率的做法,但是筆者的技術能力不足,只會用現成的圖形介面,
#土法煉鋼來操作)。接下來,完成之後的欄位C是屬於背後有一串公式的儲存格,
#畫面顯示出來的數值就是跟者欄位A排序的Unicode字碼。所以必須搭配進階純
#文字編輯器,將儲存格內容複製出去然後再貼回來,要讓欄位C成為純文字內容
#的儲存格。接下來,插入新的欄位D和E和F。若欄位C已經是純文字內容的儲存
#格了,欄位D設定的公式如下:
#=HEX2DEC(C1:C114390)
#接下來,如上所述同樣透過進階純文字編輯器協助,貼回純文字的十進位數據於
#欄位D。若欄位D已經是純文字內容的儲存格了,欄位E設定的公式如下:
#=UNICHAR(D1:D114390)
#接下來,如上所述同樣透過進階純文字編輯器協助,貼回純文字的Unicode字
#元於欄位E。
#
#到此,在工作表內,可以獲得「注音符號」欄位、「Unicode字元」欄位。
#將「注音符號」、「Unicode字元」兩個欄位複製出來到另一個工作表內嘗試
#獨立編輯。每個人編輯的習慣順序不同,前文提到的將「輕聲符號」移動到注音
#符號「之後」的動作,也可以延到此時再做。若進階純文字編輯器有提供批次處
#理每行的字串頭和字串尾的功能,試算表排序注音欄位之後進階純文字編輯器批
#次處理輕聲符號,這個動作會相對比較方便。要注意,此時的「Unicode字元」
#欄位搭配全字庫全套字型,「理論上」可以全部顯示出字元出來。而不會有無法
#顯示字元的方塊圖示。至於該如何以批次處理的方式,快速將「Unicode字元」
#欄位內每個列都設定成對應的全字庫字型檔案,很抱歉筆者尚未掌握出LO的操作
#技巧,暫時做不到。
#編製檔案的過程中,有機會很不幸地遇到一個情境,就是「執行公式」=UNICHAR(D1:D114381)
#在函示精靈視窗的右下角預覽格子內,明明有看到首列的漢字字元呈現,但是轉
#換完之後,實際上卻發現整個欄完全空白,沒有字元顯示,但是背後的公式卻有
#在,筆者找不到原因,此時只好改用其他軟體來完成"「Unicode碼位」或
#「十進位」"轉「Unicode字元」這個動作了。筆者一時之間"找不到"操作流程
#相對方便且合適的全圖形介面單機轉換軟體,目前採用的是Unicode code converter [ishida >> utilities]
#這個線上網址的轉換功能,所以就非得聯網才行。
#
#MacOSX平台請參考UnicodeChecker.app,選單列\File\Show Utilities Window\Escape\input,
#雖然視覺上只有「ㄧ列」,但實際上可以輸入非常多列,當然,輸入的列數越多
#,等待回應的時間也就越久。需搭配滑鼠右鍵來將轉換後的輸出結果全選複製出
#來。另外記得要先執行 選單列\File\Download and Install Unihan Data。
#開始操作之前,請先閱讀UnicodeChecker輔助說明文件\Details\Escapes\C99
#段落的說明文字。
#
#MsWindows平台,請使用BabelPad.exe。
#
#Linux平台,請使用較新版本網路瀏覽器,聯網使用Unicode code converter [ishida >> utilities]
#這款線上轉碼服務。或者有支援ODS格式的純試算表軟體套件"Gnumeric"。
#筆者目前「找不到」「其他」現成的單機的全圖形介面操作(可搭配滑鼠右鍵)
#軟體套件能在Linx GNOME環境原生執行。
#
#在這裡,筆者選擇留下注音符號欄位中的字詞段落和拼音符號段落,並透過排序
#功能,將這兩個段落分別加以集中。接下來,要開始把「注音符號」欄位裏頭的
#「注音符號」,轉換成電腦鍵盤上對應鍵位的英文字母和數字,筆者手邊的鍵盤
#為一般常見的"QWERTY=ㄆㄊㄍㄐㄔㄗ"排序美規鍵盤。另外,筆者「額外」做
#了一個動作,就是把41個「注音符號+聲調符號」個別所對應的單個英文字母或
#數字,再插入原本的注音符號欄位,「Unicode字元」欄位則是對應填入注音
#符號和聲調符號的「Unicode字元」(因為原始表格沒有)。筆者將「符號詞」
#暫時採用"zjcl4"鍵位替代,「單位詞」暫時採用"20jo4"鍵位替代。拼音符
#號因為筆者不知道該如何處理,乾脆原封不動,原樣保留。
#
#最後,將已經轉換成英文鍵位的「注音符號」欄位,和「Unicode字元」,
#「有字串內容」的「部份」,全部選取。複製貼上到進階純文字編輯器內,繼續
#編輯。儲存時記得存為UTF-8格式,副檔名為"CIN"。若儲存視窗還有另一個選
#項,請選其中的"Windows(CRLF)"項目。
#
#關於本檔案的已測試環境:
#
#Debian 8 jessie + GNOME桌面環境 + Debian Jessie官方套件庫收錄的
#gcin 2.8.2版本套件。請於終端機模式執行指令"gcin2tab 本表格檔案全名"
#,會轉換出gtab格式的檔案,將gtab格式的檔案複製到對應路徑下,例如:
#/home/妳的帳號/.gcin/ 或 /usr/share/gcin/table/ 並修改同路徑下
#的gtab.list內容,再重新登入系統即可,透過"gcin-tools"設定並啟用本
#表格檔。gcin2tab轉檔過程中可能會在最末尾段落的『包含有音調符號』的拼音
#符號那幾行轉換過不去(注音符號欄位直接就是原始檔的內容),請使用者端自行
#選用替代的英文字母來改掉。若要顯示CnsPhonetic2016-08_GCIN.cin內的
#所有字元,務請搭配全字庫全套共六個字型。
#
#關於本檔案的免責聲明:
#
#筆者發現,線上的维基百科有所謂的免責聲明,不保證其資料百分之百正確,很
#多商業軟體公司也有其免責聲明,不保證其軟體百分之百沒有BUG。
#所以筆者當然也要附上免責聲明,不保證本表格檔案中每一筆對照資料的注音都
#是100%正確的,有可能是筆者在剪貼/轉換的過程中疏忽了什麼,「更有可能」
#「資料來源」(全字庫)就「已經是錯的」(範例例如像是政府原始資料中,理應
#列出注音符號“ㄧ”(unicode碼位:3127)的格子內,卻被填入了正體中文漢字
#小寫“一”(unicode碼位:4E00),這樣一個資料輸出時,校稿不實的BUG。),
#所以筆者也附上這個檔案是怎麼製作出來的解說,如果使用者有所質疑,在等不
#到修正更新版本的情境下,大不了參考本文的製作過程,自己去做一個。筆者當
#初就是等不到「全字庫注音輸入法參考檔2006.2」的版本更新,也無法得知該
#檔案到底是如何編製出來的,所以嘗試自己打電話到政府單位去問,經過一連串
#的嘗試與碰壁之後,編製出這個檔案的最初版本。
#
#關於本檔案的授權模式:
#
#筆者非法律專業,很多英文法律文字筆者也看不懂,在參考諸多資訊之後,因為
#筆者不知道使用者會是哪一種思考角度來使用本檔,所以決定採用雙授權模式,
#讓終端使用者去自由心證,選用一種。
#
#Public Domain (公眾授權):
#
#使用者直接把筆者製作的檔案拿去套用在輸入法框架軟體內,例如"開放香草輸
#入法框架"或"gcin",或著剪貼部分「表格內容」來用,這時候筆者製作的檔
#案可以被當成軟體子元件(或著插件)來看待,若需要剪貼的話可以參考檔案內
#的說明文字,在剪貼時會有參考方向,筆者非法律專業,只知道或許若跟著使用
#2006年版本的"全字庫注音輸入法參考檔2006.2"所採用的Public Domain
#(公眾授權),對終端使用者來說,或許應該有最大的檔案使用自由度(包含直接
#套用整個檔案到輸入法框架和剪貼部分表格內容)。
#
#姓名標示-非商業性-禁止改作 3.0 台灣 (CC BY-NC-ND 3.0 TW):
#http://creativecommons.org/licenses/by-nc-nd/3.0/tw/
#
#使用者把筆者所製作的檔案當成一份"導覽文件"來"閱讀",參考其說明文字去
#政府單位網站下載檔案,並自行實做出一個新版的檔案,而導覽文件中說明文字
#的下方,附上了說明文字實作成果的範例樣板表格,可以用來對照與參考。
#在筆者所製作的檔案被當成導覽文件來閱讀的情境下,筆者選用了其中一款
#創用CC的法律文字樣板來用,因為相對於其他法律文字樣板,創用CC的法律文
#字樣板有被"正體中文化",內容白話,筆者易於閱讀,其他的法律文字樣板都
#是英文的,筆者根本看不懂。
#
#關於本檔案的抱怨:
#
#筆者發現了這麼一個頁面:
#CNS11643 中文全字庫-全字庫服務-全字庫授權-授權聲明:
#http://www.cns11643.gov.tw/AIDB/cns_authorization_statement.do
#直接剪貼擷取自2016/05/17看到的正文內容如下:
#----------------------------------------------------------
#首頁 › 認識全字庫 › 全字庫授權聲明
#全字庫授權聲明
#
#授權方式及範圍
#
#本網站以無償及非專屬授權方式授權使用者得不限時間及地域,重製、編輯、公開傳輸或為其他利用方式,開發各種產品或服務(以下簡稱加值產品),但授權範圍不包含商標權及專利權。
#使用者公開發行、公開展示或其他利用本網站相關字型、資料、元件或程式所產生之加值產品,應以適當方式註明字型、資料、元件或程式之來源出處(行政院國家發展委員會,CNS11643中文標準交換碼全字庫網站,http://www.cns11643.gov.tw。)
#
#使用者承諾事項
#
#使用者利用本網站相關字型、資料、元件或程式,視同同意遵守本聲明。
#使用者利用本網站相關字型、資料、元件或程式,如有發現錯誤或遺漏,應同意無償提供本網站參考及修正。
#使用者提供之加值產品,如因其故意或過失,致第三人權益受損時,應同意自行負責處理,本網站概不負責。如因其故意或過失導致本網站遭受損害或第三人向本網站請求賠償損害,使用者應對本網站負賠償責任。
#
#本網站責任之限制
#
#本網站之相關字型、資料、元件或程式僅供參考,不構成任何保證或暗示其同意、認可、推薦之意思表示。
#本網站之相關字型、資料、元件或程式之正確性及完整性,不負擔保之責。使用者如因使用而受損害或損失,或因此導致使用者或第三人遭受損害或損失而遭求償者,本網站不負任何賠償或補償之責。
#本網站如因網路線路或設備故障、檢修、保養、停電或其他天災事變等不可抗力情事,致無法提供使用者時,使用者因此所產生損害或損失,本網站不負任何賠償或補償之責。
#----------------------------------------------------------
#對於政府網站所論述的"使用者承諾事項""本網站責任之限制"。筆者個人非常的
#「不認同」。全字庫屬於民眾"納稅錢"所建構出來的中文漢字文化資料庫,具有
#結合現代科技的教育性質使用情境,政府單位本來就義務應該要確保其資料庫24
#小時不間斷的維護其資料正確性達100%,怎麼可以如此的免責/推卸責任!?
#
#試舉例假設情境如下:
#
#某國中/高中國文教師,因課程需而要教授非常用漢字/罕用字的結構和屬性,因
#為國家政府單位已經提供了數位化的資料庫"全字庫",想當然爾的課前準備就是
#上"全字庫"來查,結果因為全字庫的資料內容在增補上線前沒有確實校稿,導致
#輸出錯誤的漢字屬性資料,國文教師不疑有他(一般常理而言,會假設國家單位
#在資料上線前都應該較過稿了),就把這些資料整理出來再教給學生,結果沒想
#到後來都下學期了,才發現當初教的"是錯的",錯的理由居然是全字庫上線前沒
#有確實校稿,那麼政府單位"當然要負起責任",因為政府單位的疏忽導致國文教
#師教給學生錯誤的資料。
#
#政府單位應該有計劃的主動驗證資料庫內容有無資料瑕疵/錯誤,而不是光只是
#坐在那邊,等民眾來回報BUG。
#
#關於本檔案的其它:
#
#若使用者發現本檔案有任何可能的"BUG!",時間上允許且方便的話,麻煩回報,
#百密總有一疏,讓筆者釐清問題到底是出在筆者的檔案在編製過程時出包,還是來
#自全字庫的原始檔案「本來就有問題」。
#例如"圕"這個字("教育部"稱之:符號詞,且現在當下"沒有"定義"單一注音"),
#全字庫卻標示"單一注音"為"ㄕㄨ",於是筆者很困惑,"政府單位"到底誰才是
#對的?多頭馬車,無所適從,於是只好重複收錄,"注音"和"符號詞"都收。
#全字庫"圕"
#http://www.cns11643.gov.tw/AIDB/query_general_view.do?page=3&code=4052
#
#最後,本檔案的漢字收字量粗估為九萬五千多個漢字。
#
#最後的最後,筆者想利用這個欄位表達一些延伸議題,近幾年筆者也會追蹤多位臺灣
#在地的圖文影音創作者與外文翻譯家(外文翻譯成中文),在其粉絲頁閱覽作品和
#翻譯字幕的時候,發現有部分的圖文影音創作者與外文翻譯家「所選用的」
#「中文字形檔」,仔細一看,嚴格來說其實算是日文漢字、韓文漢字、對岸中國大陸
#的繁體字,而「不是」符合中華民國臺灣教育部規範的「正體中文漢字」字形檔,於
#是筆者嘗試私訊、留言、email給這些臺灣在地的圖文影音創作者與外文翻譯家,並
#提供給他們相關資料,包括符合中華民國臺灣教育部規範的字形檔還有哪些可以參考
#、漢字差異比對資料等等。到目前為止以結果論而言,真的有即時在新作品之中,更
#換成符合規範的字形的圖文影音創作者與外文翻譯家的人數,只有十二分之一。筆者
#也只好自我安慰說,至少曾經嘗試建議過,也盡力了。
#
#關於本檔案的參考連結:
#
#東南亞不同國家各自所規範的「現代漢字」,一筆一畫的細節差異。
#Unicode DEMO PDF
#http://unicode.org/charts/PDF/U4E00.pdf
#
#CNS11643 中文全字庫
#http://www.cns11643.gov.tw/
#
#gcin 園地
#http://hyperrate.com/?eid=67
#
#LibreOffice Calc 5.0本身能否處理 字串/格子/欄 的批次取代?
#http://hyperrate.com/thread.php?tid=31850
#
#OpenVanilla
#http://openvanilla.org/
#
#OpenVanilla 使用說明 » 刪除、修改與設計自己的輸入法
#https://docs.google.com/document/pub?id=1ew408138FCRivleknnw5IRnFqSFH3bHnDyammmiasDo
#
#公有領域 - 維基百科,自由的百科全書:
#http://zh.wikipedia.org/zh-tw/公有领域
#
#Creative Commons — Attribution-NonCommercial-ShareAlike:
#http://creativecommons.org/licenses/by-nc-sa/3.0/tw/
#
#TextWrangler
#http://www.barebones.com/products/textwrangler/
#
#Notepad++
#http://notepad-plus-plus.org/zh/
#
#Apache OpenOffice
#https://www.openoffice.org/zh-tw/
#
#LibreOffice
#建議下載使用"最新""安定版"
#http://zh-tw.libreoffice.org/
#
#Unicode code converter [ishida >> utilities]
#https://r12a.github.io/apps/conversion/
#
#BabelMap Online
#http://babelstone.co.uk/Unicode/babelmap.html
#
#BabelPad : A free Unicode text editor for Windows
#BabelMap : A free Unicode character map tool for Windows
#http://www.babelstone.co.uk/
#
#UnicodeChecker
#http://earthlingsoft.net/UnicodeChecker/
#
#DTL OTMaster Light
#http://www.fontmaster.nl/english/OTMaster.html
#http://www.fontmaster.nl/english/OTMaster_rdrct.html
#
#FontForge Open Source Font Editor
#http://fontforge.github.io/en-US/
#
#單位詞參考表
#http://dict.variants.moe.edu.tw/fulu/fu10/index.htm
#
#符號詞參考表
#http://dict.variants.moe.edu.tw/fulu/fu11/index.htm
#
#正確率的前提
#http://zonble.net/archives/2008_06/1009.php
#
#電腦沒有的字 不能當商號註冊
#http://news.tvbs.com.tw/old-news.html?nid=181442
#
#OIKOS 生活網 蘋果電腦/iPod網站 / X!數典忘祖的中文電腦:
#http://www.oikos.com.tw/v4/viewtopic.php?pid=521942
#
#筆者個人的文字作品,包含有以MsWindows終端使用者的思維來用MacOSX和Linux圖形桌面的兩份文件。
#http://www.scribd.com/ianian1979/
#
#筆者編製的其他文書作業輔助工具小作品:
#
#中華民國台灣正體中文標點符號工具列 for OpenOffice.org 家族
#http://www.openfoundry.org/of/projects/2223
#
#Unicode規範字元的大列表(超級陽春版的"字元對應表"或"字元檢視器") for OpenOffice.org
#http://www.openfoundry.org/of/projects/2267
#
#----------------------------------------------------------
%gen_inp
%ename CnsPhoneticLite
%cname 全字庫注音
%selkey 1234567890
%dupsel 10
%endkey 3467
%keyname begin
, ㄝ
- ㄦ
. ㄡ
/ ㄥ
0 ㄢ
1 ㄅ
2 ㄉ
3 ˇ
4 ˋ
5 ㄓ
6 ˊ
7 ˙
8 ㄚ
9 ㄞ
; ㄤ
a ㄇ
b ㄖ
c ㄏ
d ㄎ
e ㄍ
f ㄑ
g ㄕ
h ㄘ
i ㄛ
j ㄨ
k ㄜ
l ㄠ
m ㄩ
n ㄙ
o ㄟ
p ㄣ
q ㄆ
r ㄐ
s ㄋ
t ㄔ
u ㄧ
v ㄒ
w ㄊ
x ㄌ
y ㄗ
z ㄈ
%keyname end
%chardef begin
3 ˇ
6 ˊ
4 ˋ
7 ˙
tji4 ⾡
xu/6 〇
1 ㄅ
q ㄆ
a ㄇ
z ㄈ
2 ㄉ
w ㄊ
s ㄋ
x ㄌ
e ㄍ
d ㄎ
c ㄏ
r ㄐ
f ㄑ
v ㄒ
5 ㄓ
t ㄔ
g ㄕ
b ㄖ
y ㄗ
h ㄘ
n ㄙ
8 ㄚ
i ㄛ
k ㄜ
, ㄝ
9 ㄞ
o ㄟ
l ㄠ
. ㄡ
0 ㄢ
p ㄣ
; ㄤ
/ ㄥ
- ㄦ
u ㄧ
j ㄨ
m ㄩ
u 一
u4 一
u6 一
2u/ 丁
5/ 丁
dl3 丂
fu 七
g;3 丄
g;4 丄
vu84 丅
a.3 丆
ai4 万
j04 万
5;4 丈
n0 三
n04 三
n8 三
g;3 上
g;4 上
vu84 下
ru 丌
1j4 不
1j6 不
z. 不
z.3 不
zj 不
m3 与
au03 丏
e94 丐
t.3 丑
t.3 丒
5j0 专
fu,3 且
rm 且
qu 丕
g4 世
g4 丗
fu. 丘
1u/3 丙
u,4 业
hj/6 丛
2j/ 东
n 丝
t/6 丞
2u. 丟
fu. 丠
xu;3 両
xu;4 両
2u. 丢
al3 丣
u.3 丣
xu;3 两
xu;4 两
u06 严
1;4 並
1u/4 並
n; 丧
n;4 丧
ejp3 丨
ru. 丩
ek4 个
ek7 个
u8 丫
5j;4 丬
5j/ 中
5j/4 中
ru6 丮
ru,4 丯
z/ 丰
ej04 丱
ej04 串
tj04 串
t03 丳
t04 丳
xup4 临
xup6 临
5ji6 丵
5j3 丶
c8 丷
j06 丸
20 丹
jo4 为
jo6 为
5j3 主
203 丼
ru/3 丼
xu4 丽
xu6 丽
rm3 举
qu,3 丿
zj6 乀
u6 乁
94 乂
u4 乂
s93 乃
j3 乄
ru.3 久
ru.3 乆
5k6 乇
wji 乇
ul 么
t8 义
t83 义
t86 义
u4 义
a.3 乊
5 之
j 乌
584 乍
cj 乎
cj6 乎
z86 乏
m,4 乐
xk4 乐
5j/4 乑
q0 乑
up6 乑
qu/ 乒
q; 乓
ful6 乔
rul 乔
cj3 乕
ej9 乖
g/4 乗
t/6 乗
g/4 乘
t/6 乘
u3 乙
u3 乚
u4 乚
up3 乚
up4 乚
j0 乛
u8 乛
au, 乜
su,4 乜
ru.3 九
fu3 乞
fu4 乞
u,3 也
vu6 习
vu; 乡
ck6 乢
e94 乢
ek3 乢
ru.3 乣
a.3 乤
a.3 乥
gj 书
2.3 乧
g3 乨
g4 乨
xj04 乨
ru 乩
s;6 乪
a.3 乫
a.3 乬
a.3 乭
a.3 乮
a.3 乯
a93 买
x04 乱
xj04 乱
a.3 乲
bj3 乳
vm,6 乴
u03 乵
a.3 乶
g8 乷
s83 乸
s86 乸
e0 乹
fu06 乹
a.3 乺
a.3 乻
hjo 乼
a.3 乽
e0 乾
fu06 乾
54 乿
t4 乿
t6 乿
xj04 乿
ejo 亀
fu. 亀
rmp 亀
e0 亁
fu06 亁
xj04 亂
xup3 亃
xup6 亃
u4 亄
rm,6 亅
xk7 了
xul3 了
ek4 亇
ek7 亇
m3 予
m6 予
5/ 争
54 亊
g4 亊
g4 事
-4 二
tj4 亍
m6 于
vm 于
djo 亏
m6 亏
vm 亏
m 亐
m6 亐
mp6 云
cj4 互
fu6 亓
j3 五
ru/3 井
n4 亖
njo4 亗
cj06 亘
cj4 亘
e/4 亘
ep4 亘
vm0 亘
e/4 亙
ep4 亙
u8 亚
u84 亚
nji4 些
vu, 些
u83 亜
u84 亜
59 亝
fu6 亝
ru4 亝
y 亝
u8 亞
u83 亞
u84 亞
fu4 亟
ru6 亟
j6 亡
j;6 亡
d;4 亢
e; 亢
284 亣
294 亣
fu6 亣
ru 亣
ru4 亣
w94 亣
rul 交
c94 亥
u4 亦
t03 产
c/ 亨
c/6 亨
q/ 亨
aj3 亩
u, 亪
vu;3 享
m06 京
ru/ 京
wu/6 亭
xu;4 亮
xu;6 亮
c/ 亯
c/6 亯
q/ 亯
vu;3 亯
m04 亰
m06 亰
ru/ 亰
u,4 亱
fu/4 亲
fup 亲
vup 亲
1i4 亳
u.4 亴
vu,4 亵
203 亶
xu06 亷
2ji3 亸
ap6 亹
jo3 亹
bp6 人
bp6 亻
ru6 亼
a.3 亽
j6 亾
j;6 亾
u 亿
u4 亿
g6 什
gk6 什
gp6 什
bp6 仁
xk4 仂
2u/ 仃
yk4 仄
rup3 仅
rup4 仅
sj6 仅
zj4 仅
qj 仆
zj4 仆
fu.6 仇
t.6 仇
18 仈
5;3 仉
rup 今
ru,4 介
1u/ 仌
su/6 仌
b/6 仍
hj/ 从
hj/6 从
yj/ 从
yj/4 从
1u4 仏
n4 仏
zi6 仏
zj6 仏
n03 仐
xjp4 仑
xjp6 仑
a.3 仒
h; 仓
tj;4 仓
y 仔
y3 仔
y93 仔
g4 仕
w8 他
wji 他
5;4 仗
zj4 付
vu0 仙
vu0 仚
t84 仛
wji 仛
cj/6 仜
wj/6 仝
bp4 仞
fu0 仟
e03 仠
fu4 仡
u4 仡
1i6 仢
5ji6 仢
294 代
xu/4 令
u3 以
aul3 仦
tl4 仦
5;3 仧
5;4 仧
t;6 仧
n8 仨
g;4 仩
t;6 仩
u6 仪
aj4 仫
ap4 们
ap6 们
ap7 们
bp4 仭
ru83 仮
ru84 仮
z0 仮
z03 仮
z04 仮
aul3 仯
tl4 仯
u;3 仰
fu06 仱
ru/ 仱
rup 仱
5j/4 仲
qu3 仳
ji4 仴
k4 仴
j3 仵
ru04 件
e87 价
ru,4 价
ru84 价
ul3 仸
z/ 仹
h; 仺
bp4 任
bp6 任
dj;6 仼
ej;4 仼
j;3 仼
j;6 仼
1up 份
zp4 份
2u 仾
z;3 仿
5j/ 伀
fu4 企
qo4 伂
m6 伃
2ul4 伄
2jp4 伅
jp3 伆
u4 伇
vup3 伈
d;4 伉
u 伊
ru6 伋
94 伌
j3 伍
ru4 伎
zj6 伏
z8 伐
z86 伐
vm3 休
vu. 休
vu.3 休
rup4 伒
up6 伒
1o 伓
tp6 伔
zj 伕
sj6 伖
w;3 伖
5j/4 众
q0 众
up6 众
u. 优
cji3 伙
cjo3 会
cjo4 会
dj94 会
ejo4 会
d.4 伛
fm 伛
m3 伛
hjo4 伜
mp6 伝
n03 伞
jo3 伟
5j04 传
tj06 传
rm 伡
tk 伡
u86 伢
fu04 伣
vu04 伣
g; 伤
t/6 伥
t; 伥
t;4 伥
xjp6 伦
h; 伧
tp7 伧
vmp4 伨
vmp6 伨
vup4 伩
jo3 伪
jo6 伪
5j4 伫
t3 伬
vu06 伭
sj3 伮
184 伯
193 伯
1i6 伯
ej 估
ej3 估
ej4 估
su3 伱
su3 伲
vu,4 伳
104 伴
vm4 伵
xu/6 伶
5.4 伷
gp 伸
fm 伹
h4 伺
n4 伺
1/ 伻
n4 似
fu,6 伽
ru8 伽
qu 伾
54 伿