Java Unicode编码系统
作者:-- 发布时间:2019-11-20
unicode是一种通用的国际标准字符编码,能够表示世界上大多数的书面语言。
为什么java使用unicode系统?
在unicode之前,有很多语言标准:
- ascii (美国信息交换标准代码)。
- iso 8859-1 用于表示西欧语言。
- koi-8 用于表示俄文。
- gb18030 和 big-5 用于表示中文等等。
问题
这导致两个问题:
- 指定代码值对应于各种语言标准中的不同字母。
- 具有大字符集的语言的编码具有可变长度。一些常见字符被编码为单字节,其他需要两个或多个字节。
解决办法
为了解决这些问题,开发了一种新的语言标准,即unicode系统。在unicode中,每个字符保存为2
个字节,因此java也使用2
个字节的字符。
最小值: \u0000
最高值: \uffff