utf-8编码已经成为主流
- hongleij - 阮一峰的网络日志今天,我在网上看到一张图,据说是来自Google内部的统计——世界上所有网页编码统计图. 第一眼看到这张图,我感到很振奋,utf-8编码终于成为了主流. 可是再看第二眼,顿时就泄气了. 因为份额下降的是ASCII和ISO 8859-1这两类编码,而GB类的中文编码份额几乎保持不变. 那样的话,utf-8编码份额的上升,其实没有多大实际意义,因为ASCII和ISO 8859-1本身就是同utf-8兼容的,转不转化无所谓.
今天,我在网上看到一张图,据说是来自Google内部的统计——世界上所有网页编码统计图。
第一眼看到这张图,我感到很振奋,utf-8编码终于成为了主流。
可是再看第二眼,顿时就泄气了。因为份额下降的是ASCII和ISO 8859-1这两类编码,而GB类的中文编码份额几乎保持不变。那样的话,utf-8编码份额的上升,其实没有多大实际意义,因为ASCII和ISO 8859-1本身就是同utf-8兼容的,转不转化无所谓。
GB类的中文编码,才是真正需要被淘汰的。除了最基本的ASCII码,它同所有其他编码都不兼容,为互联网应用带来无尽的麻烦。许多很简单的问题,就是因为要考虑语言转化,而变得无比麻烦。
可是,直到今天,我们国家主流的门户网站,全部都是GB2312编码,这让人无法理解。我怀疑是不是有什么法规,规定一定要这样做。如果真是这样,那么实在是太愚蠢了。
P.S.
想了解字符编码基本知识的朋友,可以参考我以前的笔记。
(完)