HTML5 Charset能用吗?

标签: Tips HTML5 | 发表时间:2012-12-20 14:11 | 作者:神飞
出处:http://www.qianduan.net

前一段某项目中页面在IE6突然出现了乱码,当时做了各种排查,最终推测是使用了HTML5的DOCTYPE和Charset以及中文注释的问题,于是临时采用旧的Charset方法来修复了下,后面乱码再没出现。

其实一直不太确定HTML5的Charset能否被IE6识别,于是做了一些测试。

先说下两种Charset声明方法,其实大家应该都很熟悉的:

1
<meta charset="UTF-8"><!--HTML5方法-->
1
<meta http-equiv="content-type" content="text/html; charset=UTF-8"> <!--HTML4及XHTML方法-->

后面我们简称第一种方法为HTML5方法,第二种方法为HTML4方法。

测试环境:

Windows XP Sp2,中文版+英文版两个版本的IE6,及Windows 7 下IE9及其各种兼容模式和Chrome、Firefox等的当前Stable版本;

因为我们用到的HTML文件都是UTF8编码的,所以这里测试用例的HTML文件也都是UTF8(无BOM)格式,项目用gbk或者gb2312编码的类似。

测试用了两种方法:

  1. meta方法:包括HTML5和HTML4两种方法及其混搭
  2. 服务器端方法:服务器端设置charset,这里使用nginx,charset=utf-8

测试用例——Meta方法:

  1. UTF8
  2. UTF8 HTML4方法
  3. UTF8-GB2312
  4. UTF8+中文注释在meta前
  5. UTF8+中文注释在HTML和HEAD之间
  6. GB2312
  7. GB2312 HTML4方法
  8. GB2312-UTF8
  9. GB2312+中文注释在meta前
  10. GB2312+中文注释在HTML和HEAD之间

测试用例——服务器方法:

  1. 服务器设置编码
  2. meta编码和服务器编码不一致

上面各用例均可直接访问

测试结果:

  1. 测试个用例在各浏览器中表现一致;
  2. UTF-8的方案中,全部正常显示;
  3. charset声明为gb2312,由于和文档的UTF-8编码不符,所以全部乱码;
  4. 1,6用HTML5 charset分别定义了UTF8和gb2312,1正常显示没有乱码,6乱码——在中文版IE6和英文版IE6均如此,说明IE6能识别HTML5的charset;
  5. 1,2用例和6,7用例,分别用单独用HTML5和HTML4方法定义charset,效果一样;
  6. 值得注意的是,第三个用例先用HTML5的方法设定UTF-8编码,再用HTML4的编码设定为gb2312,但页面显示正常,而第八个用例反之,结果页面显示乱码,所以可以推测,第二个meta标签并没有生效;
  7. 4、5用例并没有乱码,说明单纯的HTML注释并不一定会导致乱码,这里没有测试这两个位置加载不同编码的js等外部文件时可能发生的情况;
  8. 服务器方法中,用例1并没有用meta设置charset,页面显示正常,而用例2中用meta设置charset=gb2312,与服务器版本不同,但依然没有乱码,说明服务器端返回的charset优先级更高;

结论:

其实关于charset的规范, Google的开发文档中也有解释:

  1. 要在HEAD标签中;
  2. 在任何其它内容之前,也就是要在HEAD中的最前面;
  3. 包括空格和DOCTYPE声明在内,要在前512个字节之内;
  4. HTML5和HTML4两种写法效果一样,用其中之一即可;

上面的测试也证明,第4条是正确的,两种写法均可。

另外,服务器端设置charset也是很不错的做法,charset声明直接在HTTP response中获得,效率更高,而且更方便。Google目前在用这种方法。

所以只要页面写的规范,并不会出现乱码的问题。所以可以大胆的使用HTML5的DOCTYPE和Charset声明。但是请尽量按照上面说的Google文档中的规范来,头部不要放太多东西,js等外部资源更要放到后面去。

测试中难免会有遗漏,如果有不正确的地方,欢迎指正并一起讨论~~

相关 [html5 charset] 推荐:

HTML5 Charset能用吗?

- - 前端观察
前一段某项目中页面在IE6突然出现了乱码,当时做了各种排查,最终推测是使用了HTML5的DOCTYPE和Charset以及中文注释的问题,于是临时采用旧的Charset方法来修复了下,后面乱码再没出现. 其实一直不太确定HTML5的Charset能否被IE6识别,于是做了一些测试. 先说下两种Charset声明方法,其实大家应该都很熟悉的:.

HTML5 logo 发布

- Greyby - 酷壳 - CoolShell.cn
2011年1月19日,W3C发布了HTML5的log,打开W3C的页面,下在的图片印入眼前. 我的第一感觉,就像是看到了小时候看的八一电影制片产的电影. 这分明是号召全世界的无产Web程序员们团结起来,不畏艰难,不怕牺牲,一定要把HTML5的革命事业进行到底. 所以,请各位Web程序员不但在你们的HTML5的网页上加上下面的徽章(关于各个徽章的含义,请参看这里).

html5 canvas入门

- - Marshal's Blog
可以把canvas看做div,不过,它的长和宽不能通过css来定义,要使用标签属性:. 或者javascript对象属性设置:. 使用canvas,只有一种操作方式,使用javascript. 获得canvas对象的上下文对象,该对象是操作canvas的主要对象:. 使用canvas画最简单的线, 点击运行示例,结果看起来是这样:.

HTML5新特性

- - CSDN博客推荐文章
 通过fillStyle和strokeStyle 属性可以轻松的设置矩形的填充和线条. 颜色值使用方法和CSS 一样:十六进制数、rgb()、rgba() 和 hsla. 通过 fillRect可以绘制带填充的矩形. 使用 strokeRect 可以绘制只有边框没有填充的矩形. 如果想清除部分 canvas可以使用clearRect.

【转载】HTML5 Messaging

- - HTML5研究小组
HTML5 的Message API能够让HTML5页面之间传递消息,甚至这些页面可以不在同一样域名下. 为了让消息能从一个页面发送到另一个页面,主动发送消息的页面必须拥有另一个页面的窗口引用. 然后发送 页面针对接受页调用 postMessage() 方法. postMessage() 方法中 origin 参数的值必须与页面所在的iframe的域名相匹配.

Adobe、标准和HTML5 -HTML5 and CSS3 开发

- - HTML5研究小组
“[提供商之间的]最激烈的竞争将与 标准密切相关. 大部分聪明人的眼睛将紧盯着技术标准. 但在计算机行业,新标准既可能是无限财富的源泉,也可能导致企业帝国的毁灭. 尽管存在着如此多的风险,标准仍然点燃了无限激情”. —The Economist, 1993年2月23日. 在编写这段有关标准化的话时,计算领域的主要争议是Unix是否是一个可行的操作系统(以及是否为IBM、DEC和HP的更多专用操作系统带来了挑战),以及哪个视窗平台(SUN/AT&T还是IBM/DEC/HP)将成为标准.

HTML5漫谈(4)–HTML5应用平台:PhoneGAP

- - HTML5研究小组
(  程宝平 chengbp @gmail.com). http://phonegap.com)按官方说法,是HTML5移动应用平台,它包括两部分:. 1)       应用开发框架:采用Web/HTML5技术编写应用,支持设备能力(如GPS、重力感应等)调用;支持能力插件灵活扩展. 图1 PhoneGAP支持设备能力API列表.

HTML5新特性之CSS+HTML5实例

- - CSDN博客Web前端推荐文章
1、新的DOCTYPE和字符集. HTML5的一项准则就是化繁为简,Web页面的DOCTYPE被极大的简化. HTML5引入了很多新的标签,根据内容和类型的不同,被分为7大类. 语义化标签可以简化HTML页面设计,并且将来搜索引擎在抓取和索引网页的时候,也会利用这些元素的优势. HTML5的宗旨之一就是存在即合理.

HTML5设计原理

- jessie - 蓝色理想
Jeremy Keith在 Fronteers 2010 上的主题演讲 下载PPT(PDF) 观看视频 今天我想跟大家谈一谈HTML5的设计. 主要分两个方面:一方面,当然了,就是HTML5. 我可以站在这儿只讲HTML5,但我并不打算这样做,因为如果你想了解HTML5的话,你可以Google,可以看书,甚至可以看规范.

HTML5的SEO探索

- Amo - HTML5研究小组
所有现代浏览器对HTML5的支持问题不大. HTML5被智能手机浏览器和越来越多的网站广泛的采用,甚至作为最优的选择. 但是,Googlebot,Bidubot等其他搜索引擎呢. 引擎是否会由于HTML5这任何额外因素,在搜索结果中优先推荐您的网站吗. 另一方面,少数搜索引擎会认为所有这些额外的H1标记的是垃圾网站吗.