punycode是根据rfc 3492标准定义的字符编码方案,主要用于把域名从地方语言所采用的unicode编码转换成为可用于dns系统的编码。
稳定性: 2 - 不稳定
punycode.js从node.js v0.6.2+开始内置. 使用require('punycode')
来访问。 (要在其他node.js版本中访问,先用npm来punycode
安装)。
将一个纯ascii的punycode字符串转换为unicode字符串。
// decode domain name parts
punycode.decode('maana-pta'); // 'mañana'
punycode.decode('--dqo34k'); // '☃-⌘'
将一个纯unicode punycode字符串转换为纯ascii字符串。
// encode domain name parts
punycode.encode('mañana'); // 'maana-pta'
punycode.encode('☃-⌘'); // '--dqo34k'
将一个表示域名的punycode字符串转换为unicode。只有域名中的punycode部分会被转换,也就是说你也可以在一个已经转换为unicode的字符串上调用它。
// decode domain names
punycode.tounicode('xn--maana-pta.com'); // 'mañana.com'
punycode.tounicode('xn----dqo34k.com'); // '☃-⌘.com'
将一个表示域名的unicode字符串转换为punycode。只有域名中的非ascii部分会被转换,也就是说你也可以在一个已经转换为ascii的字符串上调用它。
// encode domain names
punycode.toascii('mañana.com'); // 'xn--maana-pta.com'
punycode.toascii('☃-⌘.com'); // 'xn----dqo34k.com'
创建一个包含字符串中每个unicode符号的数字编码点的数组。由于javascript在内部使用ucs-2, 该函数会按照utf-16将一对代半数(ucs-2暴露的单独的字符)转换为单独一个编码点。
punycode.ucs2.decode('abc'); // [0x61, 0x62, 0x63]
// surrogate pair for u+1d306 tetragram for centre:
punycode.ucs2.decode('\ud834\udf06'); // [0x1d306]
创建以一组数字编码点为基础一个字符串。
punycode.ucs2.encode([0x61, 0x62, 0x63]); // 'abc'
punycode.ucs2.encode([0x1d306]); // '\ud834\udf06'
表示当前punycode.js版本数字的字符串。