汉字在计算机中的存储形式涉及多个层面的编码方式,具体如下:
一、存储形式的核心概念
机内码 汉字在计算机内部存储、处理和传输时采用 机内码
(又称汉字ASCII码),其本质是二进制代码,由0和1组成。机内码是计算机硬件能够直接识别和处理的编码形式。
字形码
汉字最终以 字形码形式输出到显示器或打印机。字形码是点阵代码的一种,将汉字转换为由像素点组成的点阵图形,用于显示或打印。
二、编码转换过程
输入码到机内码的转换
用户通过输入法输入汉字时,输入的 输入码(如拼音或全码)需通过操作系统的“输入码转换模块”转换为机内码。这一转换过程与所使用的键盘输入法无关。
国标码与机内码的转换
由于汉字国标码(如GB2312)与ASCII码存在冲突(如字符“啊”的国标码与ASCII码0和!相同),实际存储时需将国标码每个字节加128转换为机内码,形成唯一的二进制代码。
三、其他相关概念
区位码: 是国标码的简化形式,用两个字节表示一个汉字,但需通过查表转换为机内码后才能使用。 存储容量
四、总结
汉字在计算机中的存储流程可概括为: 输入码 → 输入码转换 → 机内码 → 字形码 → 输出设备。其中,机内码是核心存储形式,确保了汉字与英文字符系统的兼容性。
声明:
本站内容均来自网络,如有侵权,请联系我们。