String
编码
UTF8
UTF-8(8-bit Unicode Transformation Format)是一种针对 Unicode 的可变长度字符编码, 也是一种前缀码。 它可以用来表示 Unicode 标准中的任何字符, 且其编码中的第一个字节仍与 ASCII 兼容, 这使得原来处理 ASCII 字符的软件无须或只须做少部分修改, 即可继续使用。
UTF-8 使用一至六个字节为每个字符编码(尽管如此, 2003 年 11 月 UTF-8 被 RFC 3629 重新规范, 只能使用原来 Unicode 定义的区域, U+0000 到 U+10FFFF, 也就是说最多四个字节)