全角字符的数字定义
全角字符的第一个字节称为前导字节,第二个字节称为尾字节。
GB既“国标”的汉语拼音缩写,为中华人民共和国国家标准的意思。国标编 码就是中华人民共和国信息交换汉字编码标准(GB2312--80),在此标准中 制定了每一个汉字及非汉字符号的编码。 规定将汉字字符分为87个区,每个区有 94个汉字(94位),因此共制定了87x94=8178个汉字、字符。每一 个字符的编码由2个字节 (Byte, 一个字节有8位-- Bit, 可以有 256种不同表示) 构成(分别称高字节和低字节),其值分别为其区位码值各加上32(既16进制 的20H),方便起见把这称作国标码,则国标码所覆盖的范围为2121H...全部
全角字符的第一个字节称为前导字节,第二个字节称为尾字节。
GB既“国标”的汉语拼音缩写,为中华人民共和国国家标准的意思。国标编 码就是中华人民共和国信息交换汉字编码标准(GB2312--80),在此标准中 制定了每一个汉字及非汉字符号的编码。
规定将汉字字符分为87个区,每个区有 94个汉字(94位),因此共制定了87x94=8178个汉字、字符。每一 个字符的编码由2个字节 (Byte, 一个字节有8位-- Bit, 可以有 256种不同表示) 构成(分别称高字节和低字节),其值分别为其区位码值各加上32(既16进制 的20H),方便起见把这称作国标码,则国标码所覆盖的范围为2121H--77 7EH,如中国的“中”字位于54区48位,其国标码就是5650H。
当想在由西 方人发明的计算机中使用汉字时,由于国标码的范围与计算机中使用的 ASCII码( American Standard Code for Information Interchange,美国信息交换标准码, 只用了一个字节中的低7位,范围是32-126这95个)重叠,无法分出是中文或是西 文,于是规定将国标码的高低字节的最高位均置1( Set the MSB,相当于加上12 8--16进制的80H),来使之区分于 ASCII码。
这样,在计算机中使用的汉字编码实 际上是真正的国标码的高位置1后的变形码(以后称此码为GB码),编码范围是 0 A1A1H-- 0F7FEH,前面的“中”字的 GB 码就是 0D6D 0H。
在国标中规定:
1区是标点符号及下列以外的各种符号
2区是各种各样的数字符号
3区是全角西文字符(英文字母,数字,符号等)
4区是日文平假名
5区是日文片假名
6区是希腊字母表
7区是俄文字母表
8区是中文拼音字母表
9区是制表符号
10区----15区目前空着备用,
16区----55区是按Pin1音字母排序的常用汉字(一级汉字)
56区----87区是按部首笔画排序的非常用汉字(二级汉字)
。收起