java,根据头文件判断文件类型

标签: java 头文件 文件类型 | 发表时间:2013-12-09 18:16 | 作者:VitoCorleoneDemo
出处:http://www.iteye.com

web判断文件的格式的时候,我们一般都是通过扩展名来判断,这个有点不太靠谱和安全。一般要判断是利用头文件来判断。下面是利用头文件来判断的代码:

package com.app.util;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

public class T {
	 public static String bytesToHexString(byte[] src){     
	        StringBuilder strBuilder = new StringBuilder();     
	        if (src == null || src.length <= 0) {     
	            return null;     
	        }     
	        for (int i = 0; i < src.length; i++) {     
	            int v = src[i] & 0xFF;     
	            String strhs = Integer.toHexString(v);     
	            if (strhs.length() < 2) {     
	            	strBuilder.append(0);     
	            }     
	            strBuilder.append(strhs);     
	        }     
	        return strBuilder.toString();     
	    }
	 
	 /**
	  * 根据文件流读取图片文件真实类型
	  * @param is
	  * @return
	  */
	public static String getTypeByStream(FileInputStream is) {
		byte[] b = new byte[4];
		try {
			is.read(b, 0, b.length);
		} catch (IOException e) {
			e.printStackTrace();
		}
		String type = bytesToHexString(b).toUpperCase();
		if (type.contains("FFD8FF")) {
			return "jpg";
		} else if (type.contains("89504E47")) {
			return "png";
		} else if (type.contains("47494638")) {
			return "gif";
		} else if (type.contains("49492A00")) {
			return "tif";
		} else if (type.contains("424D")) {
			return "bmp";
		}
		return type;
	}
	
	public static void main(String args[]) {
//	     String src = "D:/workspace//8129.jpg";
//	     String src = "D:/workspace//temp/1.gif";
	     String src = "D:/003-004-join.jpg";
	     FileInputStream is = null;
		try {
			is = new FileInputStream(src);
		} catch (FileNotFoundException e) {
			e.printStackTrace();
		}  
//	        byte[] b = new byte[4];  
//	        is.read(b, 0, b.length);  
//	        System.out.println(bytesToHexString(b));
	       
	        String type = getTypeByStream(is);
	        System.out.println(type);
	}
	
}

 网上搜索了一些头文件的格式,但是强调一下,txt文件没有固定的头名,需要另外考虑,供参考:

  1. 用文件头判断。直接读取文件的前几个字节。  
  2. 常用文件的文件头如下:  
  3. JPEG (jpg),文件头:FFD8FF  
  4. PNG (png),文件头:89504E47  
  5. GIF (gif),文件头:47494638  
  6. TIFF (tif),文件头:49492A00   
  7. Windows Bitmap (bmp),文件头:424D  
  8. CAD (dwg),文件头:41433130  
  9. Adobe Photoshop (psd),文件头:38425053  
  10. Rich Text Format (rtf),文件头:7B5C727466  
  11. XML (xml),文件头:3C3F786D6C  
  12. HTML (html),文件头:68746D6C3E  
  13. Email [thorough only] (eml),文件头:44656C69766572792D646174653A  
  14. Outlook Express (dbx),文件头:CFAD12FEC5FD746F   
  15. Outlook (pst),文件头:2142444E   
  16. MS Word/Excel (xls.or.doc),文件头:D0CF11E0  
  17. MS Access (mdb),文件头:5374616E64617264204A  
  18. WordPerfect (wpd),文件头:FF575043  
  19. Postscript. (eps.or.ps),文件头:252150532D41646F6265  
  20. Adobe Acrobat (pdf),文件头:255044462D312E  
  21. Quicken (qdf),文件头:AC9EBD8F   
  22. Windows Password (pwl),文件头:E3828596   
  23. ZIP Archive (zip),文件头:504B0304   
  24. RAR Archive (rar),文件头:52617221   
  25. Wave (wav),文件头:57415645   
  26. AVI (avi),文件头:41564920   
  27. Real Audio (ram),文件头:2E7261FD   
  28. Real Media (rm),文件头:2E524D46   
  29. MPEG (mpg),文件头:000001BA   
  30. MPEG (mpg),文件头:000001B3  
  31. Quicktime (mov),文件头:6D6F6F76   
  32. Windows Media (asf),文件头:3026B2758E66CF11   
  33. MIDI (mid),文件头:4D546864 


已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [java 头文件 文件类型] 推荐:

java,根据头文件判断文件类型

- - Java - 编程语言 - ITeye博客
web判断文件的格式的时候,我们一般都是通过扩展名来判断,这个有点不太靠谱和安全. 下面是利用头文件来判断的代码:. * 根据文件流读取图片文件真实类型.  网上搜索了一些头文件的格式,但是强调一下,txt文件没有固定的头名,需要另外考虑,供参考:. JPEG (jpg),文件头:FFD8FF  .

Java根据文件头获取文件类型

- - BlogJava_首页
文件头是位于文件开头的一段承担一定任务的数据,一般都在开头的部分. 头文件作为一种包含功能函数、数据接口声明的载体文件,用于保存程序的声明(declaration),而定义文件用于保存程序的实现 (implementation).      为了解决在用户上传文件的时候在服务器端判断文件类型的问题,故用获取文件头的方式,直接读取文件的前几个字节,来判断上传文件是否符合格式.

Evernote 取消针对免费账号的文件类型限制

- Ruby - FeedzShare
来自: 36氪 - FeedzShare  . 发布时间:2011年09月08日,  已有 2 人推荐. 来自Evernote 的消息,他们刚刚取消了针对免费账号的文件类型限制,免费用户也将可以为任何笔记添加任何类型的文件附件. 不过对于笔记的大小限制及每月流量限制没有改变,免费用户每个笔记最大只能是25MB,每月流量最多60MB.

Java中的锁(Locks in Java)

- - 并发编程网 - ifeve.com
原文链接 作者:Jakob Jenkov 译者:申章 校对:丁一. 锁像synchronized同步块一样,是一种线程同步机制,但比Java中的synchronized同步块更复杂. 因为锁(以及其它更高级的线程同步机制)是由synchronized同步块的方式实现的,所以我们还不能完全摆脱synchronized关键字( 译者注:这说的是Java 5之前的情况).

Java PaaS 对决

- 呆瓜 - IBM developerWorks 中国 : 文档库
本文为 Java 开发人员比较了三种主要的 Platform as a Service (PaaS) 产品:Google App Engine for Java、Amazon Elastic Beanstalk 和 CloudBees RUN@Cloud. 它分析了每种服务独特的技术方法、优点以及缺点,而且还讨论了常见的解决方法.

Java浮点数

- d0ngd0ng - 译言-电脑/网络/数码科技
Thomas Wang, 2000年3月. Java浮点数的定义大体上遵守了二进制浮点运算标准(即IEEE 754标准). IEEE 754标准提供了浮点数无穷,负无穷,负零和非数字(Not a number,简称NaN)的定义. 在Java开发方面,这些东西经常被多数程序员混淆. 在本文中,我们将讨论计算这些特殊的浮点数相关的结果.

Qt——转战Java?

- - 博客 - 伯乐在线
编者按:事实上,在跨平台开发方面,Qt仍是最好的工具之一,无可厚非,但Qt目前没有得到任何主流移动操作系统的正式支持. 诺基亚的未来计划,定位非常模糊,这也是令很多第三方开发者感到失望,因此将导致诺基亚屡遭失败的原因. Qt的主要开发者之一Mirko Boehm在博客上强烈讽刺Nokia裁了Qt部门的决定,称其为“绝望之举”,而非“策略变更”.

java 验证码

- - ITeye博客
// 创建字体,字体的大小应该根据图片的高度来定. // 随机产生160条干扰线,使图象中的认证码不易被其它程序探测到. // randomCode用于保存随机产生的验证码,以便用户登录后进行验证. // 随机产生codeCount数字的验证码. // 得到随机产生的验证码数字. // 产生随机的颜色分量来构造颜色值,这样输出的每位数字的颜色值都将不同.

Java异常

- - CSDN博客推荐文章
“好的程序设计语言能够帮助程序员写出好程序,但是无论哪种语言都避免不了程序员写出坏的程序.                                                                                                                          ----《Java编程思想》.