EvoTalk

Posts Tagged ‘big5

use command line tool : sed 、 iconv
Create a batch file 「u2b.bat」
view plain

CODE:

@echo off

SET FILE=%1

IF NOT DEFINED FILE GOTO USAGE

 

iconv -f utf-8 -t cp950 %FILE%> 1.tmp

del %FILE%

ren 1.tmp %FILE%

 

EXIT /B 0

 

:USAGE

ECHO Convert encoding from utf8 to big5

ECHO Usage: u2b.bat [file]

 

EXIT /B 1

Create a batch file 「unix2dos.bat」
view plain

CODE:

@echo off

SET FILE=%1

IF NOT DEFINED FILE GOTO USAGE

 

sed -i "s/$/\r/" %FILE%

 

EXIT [...]

Tags: ,

28 一月, 2008

中文編碼資源

Posted by: asd In: 科技新知| 網站推薦

GBK code range
Big5 code range
中文字符编码格式判断
cp950 to Unicode table
cp936 to Unicode table

Tags:

21 七月, 2006

Change Dos Code Page

Posted by: asd In: 科技新知| 軟體使用

更改 msdos 的 codepage 可下指令
chcp codepage代碼

950 : Big5
932 : 日文
936 : GB
949 : 韓文

但是切換上述的代碼卻顯示「 無效字碼頁」。比較正規的作法是到執行「控制台」-> 「地區及語言選項」-> 「非Unicode程式的語言」,選擇「日文」。然後重新開機,這時再到 msdos 下,執行 chcp,此時的codepage 就是 932。另外一種取巧的方式就是改註冊表
REGEDIT4
[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
“CodePage”=dword:000003a4
“FaceName” = “MS Gothic”
“FontFamily”=dword:00000000

Tags:

29 三月, 2006

計算Big5筆劃及部首筆劃

Posted by: asd In: 科技新知| 網站推薦

沒有什麼高深的技術,就是查表。原來倚天中文造字順序是依照筆劃順序造字,參考

VB程式: Big5 中文筆劃換算
換算姓名學筆劃

倚天中文字型筆劃順序內碼對照表

筆劃
常用字區
次常用字區

01
A440-A441
 

02
A442-A453
C940-C944

03
A454-A47E
C945-C94C

04
A4A1-A4FD
C94D-C95C

05
A4FE-A5DF
C95D-C9AA

06
A5E0-A6E9
C9AB-C959

07
A6EA-A8C2
CA5A-CBB0

08
A8C3-AB44
CBB1-CDDC

09
AB45-ADBB
CDDD-D0C7 F9DA

10
ADBC-B0AD
D0C8-D44A

11
B0AE-B3C2
D44B-D850

12
B3C3-B6C3
D851-DCB0 F9DB

13
B6C4-B9AB
DCB1-E0EF F9D6-F9D8

14
B9AC-BBF4
E0F0-E4E5

15
BBF5-BEA6
E4E6-E8F3 F9DC

16
BEA7-C074
E8F4-ECB8 F9D9

17
C075-C24E
ECB9-EFB6

18
C24F-C35E
EFB7-F1EA

19
C35F-C454
F1EB-F3FC

20
C455-C4D6
F3FD-F5BF

21
C3D7-C56A
F5C0-F6D5

22
C56B-C5C7
F6D6-F7CF

23
C5C8-C5C7
F6D6-F7CF

24
C5F1-C654
F8A5-F8ED

25
C655-C664
F8E9-F96A

26
C665-C66B
F96B-F9A1

27
C66C-C675
F9A2-F9B9

28
C676-C67A
F9BA-F9C5

29
C67B-C67E
F9C6-F9DC

Tags:

GBK高位元,行碼0xA1-0xFE,低位元,列碼0xA1-0xFE,每行94個漢字
其中:

GBK碼範圍
1-15行 (A1-AF) 全形字母、符號
16-55行(B0-CF) 以拼音為序的一級漢字3755字
56-87行(D0-F7) 以部首為序的二級漢字3008字

例如:GB碼16行1列表示「啊」字,編碼為0xB0A1。
Big5高位元,行碼0xA1-0xFE,低位元,列碼0x40-0x7E, 0xA1-0xFE,每行157個漢字
其中:

Big5碼範圍
1-3/38-40行(A1-A3, C6-C8) 全形字母、符號
4-39行(A4-C6) 一級漢字5401字
41-89行(C9-F9) 二級漢字7652字

例如:BIG5碼16行121列同樣表示「啊」字,編碼為0xB0DA。

Tags: