29 十月, 2008
Posted by: asd In: 科技新知| 軟體使用
use command line tool : sed 、 iconv
Create a batch file 「u2b.bat」
view plain
CODE:
@echo off
SET FILE=%1
IF NOT DEFINED FILE GOTO USAGE
iconv -f utf-8 -t cp950 %FILE%> 1.tmp
del %FILE%
ren 1.tmp %FILE%
EXIT /B 0
:USAGE
ECHO Convert encoding from utf8 to big5
ECHO Usage: u2b.bat [file]
EXIT /B 1
Create a batch file 「unix2dos.bat」
view plain
CODE:
@echo off
SET FILE=%1
IF NOT DEFINED FILE GOTO USAGE
sed -i "s/$/\r/" %FILE%
EXIT [...]
28 一月, 2008
Posted by: asd In: 科技新知| 網站推薦
GBK code range
Big5 code range
中文字符编码格式判断
cp950 to Unicode table
cp936 to Unicode table
21 七月, 2006
Posted by: asd In: 科技新知| 軟體使用
更改 msdos 的 codepage 可下指令
chcp codepage代碼
950 : Big5
932 : 日文
936 : GB
949 : 韓文
但是切換上述的代碼卻顯示「 無效字碼頁」。比較正規的作法是到執行「控制台」-> 「地區及語言選項」-> 「非Unicode程式的語言」,選擇「日文」。然後重新開機,這時再到 msdos 下,執行 chcp,此時的codepage 就是 932。另外一種取巧的方式就是改註冊表
REGEDIT4
[HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe]
“CodePage”=dword:000003a4
“FaceName” = “MS Gothic”
“FontFamily”=dword:00000000
29 三月, 2006
Posted by: asd In: 科技新知| 網站推薦
沒有什麼高深的技術,就是查表。原來倚天中文造字順序是依照筆劃順序造字,參考
VB程式: Big5 中文筆劃換算
換算姓名學筆劃
倚天中文字型筆劃順序內碼對照表
筆劃
常用字區
次常用字區
01
A440-A441
02
A442-A453
C940-C944
03
A454-A47E
C945-C94C
04
A4A1-A4FD
C94D-C95C
05
A4FE-A5DF
C95D-C9AA
06
A5E0-A6E9
C9AB-C959
07
A6EA-A8C2
CA5A-CBB0
08
A8C3-AB44
CBB1-CDDC
09
AB45-ADBB
CDDD-D0C7 F9DA
10
ADBC-B0AD
D0C8-D44A
11
B0AE-B3C2
D44B-D850
12
B3C3-B6C3
D851-DCB0 F9DB
13
B6C4-B9AB
DCB1-E0EF F9D6-F9D8
14
B9AC-BBF4
E0F0-E4E5
15
BBF5-BEA6
E4E6-E8F3 F9DC
16
BEA7-C074
E8F4-ECB8 F9D9
17
C075-C24E
ECB9-EFB6
18
C24F-C35E
EFB7-F1EA
19
C35F-C454
F1EB-F3FC
20
C455-C4D6
F3FD-F5BF
21
C3D7-C56A
F5C0-F6D5
22
C56B-C5C7
F6D6-F7CF
23
C5C8-C5C7
F6D6-F7CF
24
C5F1-C654
F8A5-F8ED
25
C655-C664
F8E9-F96A
26
C665-C66B
F96B-F9A1
27
C66C-C675
F9A2-F9B9
28
C676-C67A
F9BA-F9C5
29
C67B-C67E
F9C6-F9DC
GBK高位元,行碼0xA1-0xFE,低位元,列碼0xA1-0xFE,每行94個漢字
其中:
GBK碼範圍
1-15行 (A1-AF) 全形字母、符號
16-55行(B0-CF) 以拼音為序的一級漢字3755字
56-87行(D0-F7) 以部首為序的二級漢字3008字
例如:GB碼16行1列表示「啊」字,編碼為0xB0A1。
Big5高位元,行碼0xA1-0xFE,低位元,列碼0x40-0x7E, 0xA1-0xFE,每行157個漢字
其中:
Big5碼範圍
1-3/38-40行(A1-A3, C6-C8) 全形字母、符號
4-39行(A4-C6) 一級漢字5401字
41-89行(C9-F9) 二級漢字7652字
例如:BIG5碼16行121列同樣表示「啊」字,編碼為0xB0DA。