Java实现HTML页面转PDF解决方案

标签： java html 页面 | 发表时间：2013-12-15 09:08 | 作者：flycars001

出处：http://www.iteye.com

首先，当然是找到能够解析PDF的完美组件，百度和谷歌不约而同的告诉我们。IText是王道。而目前开源的组件中，Itext的确是一个First Choice，如果各位单纯是做把图片转成PDF或者自己写了Velocity或者FreeMarker模板生成了HTML是非常推荐直接用Itext来进行的。而如果，大家像我这样已经有前人写好了HTML页面或者懒得写FreeMarker模板的话。可以直接看下一段。

　　由于他们已经写好了HTML页面，而且显示已经很完美了。那我要做的就是能完美解析HTML+CSS的PDF生成工具。这时候flying-saucer进入了我的选择范围中。

　　http://code.google.com/p/flying-saucer/

　　上面是网址，这个工具托管在GoogleCode上面，作者做他们能够做下面的工作：

　　Flying Saucer takes XML or XHTML and applies CSS 2.1-compliant stylesheets to it, in order to render to PDF (via iText), images, and on-screen using Swing or SWT。

　　不难看出工作原理，就是解析XML或者XHTML并且包括css样式表，并且用Swing或者SWT的组件生成PDF的功能。这解决了页面的显示问题。IText自身的一个很严重的问题就是解析CSS有很大的问题。而这个解决了。下面就是用Flying Saucer来实现的代码：

public boolean convertHtmlToPdf(String inputFile, String outputFile)
throws Exception {
OutputStream os = new FileOutputStream(outputFile);
ITextRenderer renderer = new ITextRenderer();
String url = new File(inputFile).toURI().toURL().toString();
renderer.setDocument(url);
// 解决中文支持问题
ITextFontResolver fontResolver = renderer.getFontResolver();
fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);
//解决图片的相对路径问题
renderer.getSharedContext().setBaseURL("file:/D:/");
renderer.layout();
renderer.createPDF(os);
os.flush();
os.close();
return true;
}

上面这段代码是这样的，输入一个HTML地址URL = inputFile，输入一个要输出的地址，就可以在输出的PDF地址中生成这个PDF。

　　 注意事项：

　　 1.输入的HTML页面必须是标准的XHTML页面。页面的顶上必须是这样的格式：

　　<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

　　并且HTML页面的语法必须是非常严谨的，所有标签都必须闭合等等（由于flying-Saucer做了XML解析的工作，不严谨会报错的。），这是对页面的第一个要求。

　　2.要用到图片的地方写相对路径的形式，比如：

　　而它的图片位置则必须在Java代码中指定。

　　renderer.getSharedContext().setBaseURL("file:/D:/");

　　也有另一种方法就是直接在<img>标签中写绝对路径。

　　 3.Flying-Saucer在解析tiff格式的图片的时候会报错。具体原因我还没找到。希望大家能够指点我。

　　 4.如果在页面中有中文字体的话。必须在HTML代码中的样式中写上某种字体的css，并且必须是用英文的，然后在Java代码中写上对应的文件位置。

　　ITextFontResolver fontResolver = renderer.getFontResolver();

　　fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);

　　上面的方法是添加了宋体。也可以添加其他字体。

　　以上就是解决方案。

已有 0 人发表留言，猛击->> 这里<<-参与讨论

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

Java实现HTML页面转PDF解决方案

相关 [java html 页面] 推荐：

Java实现HTML页面转PDF解决方案

了解html页面的渲染过程

HTML页面实现全方位页面缓存

Java实现HTML代码生成PDF文档

CSS3 Region：基于HTML和CSS3的富页面布局

使用HTML与CSS3进行富页面布局

怪异模式（Quirks Mode）对 HTML 页面的影响

页面架构HTML+CSS ●▽● 各种布局各种实现

Java实现将字符串中的html代码过滤掉的方法

Java与Flex学习笔记----用CSS控制页面样式

相关文章

订阅