第3个回答 2015-06-30
计算机在遇到基本字符的时候,通常采用Unicode编码进行储存,只有在文字不符合Unicode编码(不能使用Unicode编码表示)的时候才会使用其他兼容的字体或者编码进行数据储存。
Unicode编码中的英文字符、数字等仿照ASCII编码,对此类字符采用ASCII编码储存,前面空余的位数用0填充成Unicode标准的8位。因此一个标准的可以使用Unicode编码储存的字符,在储存时占用8个二进制位,2个字节占用16个二进制位。
要注意的是,类似于高棉语、Javanese(古爪哇语)之类的语言是不能使用Unicode编码储存的,这个时候就必须使用当地编码、字体储存,此时一个字节的字符可以不占用8个二进制位。在遇到没有可用字体或者编码能够兼容时,会采用“□”进行代替,此时数据仍然使用8位进行储存,但是无法查看。