解决POI大数据导出Excel内存溢出、应用假死

标签: bigdata | 发表时间:2017-09-18 00:00 | 作者:
出处:http://itindex.net/relian

大数据

作者:怪咖_OOP

最近公司一个06年统计项目在导出Excel时造成应用服务器内存溢出、假死现象;查看代码发现问题一次查询一整年的数据导致堆内存被撑爆(<span style=”color:red;”>假死</span>),随后改用批量查询往Excel中写数据,同样的问题又出现了!!!随后在网上查阅了部分资料只是在POI大数据导出API的基础上写的demo示例无任何参考价值…

解决内存溢出常用方法就是打开GC日志

{Heap before GC invocations=29 (full 14):
 par new generation   total 306688K, used 306687K [0x0000000080000000, 0x0000000094cc0000, 0x0000000094cc0000)
  eden space 272640K, 100% used [0x0000000080000000, 0x0000000090a40000, 0x0000000090a40000)
  from space 34048K,  99% used [0x0000000090a40000, 0x0000000092b7ffe0, 0x0000000092b80000)
  to   space 34048K,   0% used [0x0000000092b80000, 0x0000000092b80000, 0x0000000094cc0000)
 concurrent mark-sweep generation total 1756416K, used 1756415K [0x0000000094cc0000, 0x0000000100000000, 0x0000000100000000)
 Metaspace       used 43496K, capacity 44680K, committed 45056K, reserved 1089536K
  class space    used 5254K, capacity 5515K, committed 5632K, reserved 1048576K
2017-09-12T21:55:02.954+0800: 239.209: [Full GC (Allocation Failure) 2017-09-12T21:55:02.954+0800: 239.209: [CMS: 1756415K->1756415K(1756416K), 5.4136680 secs] 2063103K->1971243K(2063104K), [Metaspace: 43496K->43496K(1089536K)], 5.4138690 secs] [Times: user=5.41 sys=0.00, real=5.41 secs] 
Heap after GC invocations=30 (full 15):
 par new generation   total 306688K, used 214827K [0x0000000080000000, 0x0000000094cc0000, 0x0000000094cc0000)
  eden space 272640K,  78% used [0x0000000080000000, 0x000000008d1cacb0, 0x0000000090a40000)
  from space 34048K,   0% used [0x0000000090a40000, 0x0000000090a40000, 0x0000000092b80000)
  to   space 34048K,   0% used [0x0000000092b80000, 0x0000000092b80000, 0x0000000094cc0000)
 concurrent mark-sweep generation total 1756416K, used 1756415K [0x0000000094cc0000, 0x0000000100000000, 0x0000000100000000)
 Metaspace       used 43238K, capacity 44256K, committed 45056K, reserved 1089536K
  class space    used 5213K, capacity 5441K, committed 5632K, reserved 1048576K
}

主要信息:

2017-09-12T21:55:02.954+0800: 239.209: [Full GC (Allocation Failure) 2017-09-12T21:55:02.954+0800: 239.209: <span style="color:red;">[CMS: 1756415K->1756415K(1756416K), 5.4136680 secs] 2063103K->1971243K(2063104K), [Metaspace: 43496K->43496K(1089536K)], 5.4138690 secs]</span> [Times: user=5.41 sys=0.00, real=5.41 secs]

通过查看GC日志发现<span style=”color:#278bd2;”>堆空间、元空间不能被回收</span>(对象强引用导致)

解决方法:

查看业务代码:

SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook(1000);
    for(int i=1;i<=pageCount;i++){
        int tableNum = i;
        int pageIndex = i;
        //分页数据查询
        List<Map<String, Object>> maps = dbFactory.getJdbcTemplate().queryForList(finalSql,(pageIndex-1)*pageSize,pageIndex*pageSize);
        SXSSFSheet sheet = sxssfWorkbook.createSheet("sheet"+tableNum);
        SXSSFRow sxssfRow = sheet.createRow(0);
        for(int a=0;a<titles.length;a++){
            sxssfRow.createCell(a).setCellValue(titles[a]);
        }
        for(int a=1;a<=maps.size();a++){
            SXSSFRow sxssfRow = sheet.createRow(a);
            Map<String,Object> data = maps.get(a-1);
            Set<String> keySet = data.keySet();
            Iterator<String> iterator = keySet.iterator();
            int cell = 0;
            while(iterator.hasNext()){
                String key = iterator.next();
                Object valueObject = data.get(key);
                SXSSFCell sxssfCell =  sxssfRow.createCell(cell);
                sxssfCell.setCellValue(valueObject==null?"":valueObject.toString()); 
                cell++;
            }
        }
        //数据清理
        maps.clear();
        //设置空引用
        maps = null;
    }

    FileOutputStream fos = new FileOutputStream(tempPath+fileName);
    sxssfWorkbook.write(fos);
    fos.close();
    sxssfWorkbook.dispose();

代码中数据清理、设置空引用都做了,为什么还是不能被回收呢???

通过JVM自带检测工具jmap查看活跃对象

jmap使用说明: 论持久战之Java性能监控工具(jmap)

大数据

重大发现原来是<span style=”color:#278bd2″>org.apache.poi.xssf.streaming.SXSSFCell、org.apache.poi.xssf.streaming.SXSSFCell$PlainStringValue、org.apache.poi.xssf.streaming.SXSSFRow</span>这三个鬼把内存占完了

优化代码

SXSSFWorkbook sxssfWorkbook = new SXSSFWorkbook(1000);
    SXSSFCell sxssfCell = null;
    SXSSFRow sxssfRow = null;
    for(int i=1;i<=pageCount;i++){
        int tableNum = i;
        int pageIndex = i;
        List<Map<String, Object>> maps = dbFactory.getJdbcTemplate().queryForList(finalSql,(pageIndex-1)*pageSize,pageIndex*pageSize);
        SXSSFSheet sheet = sxssfWorkbook.createSheet("sheet"+tableNum);
        sxssfRow = sheet.createRow(0);
        for(int a=0;a<titles.length;a++){
            sxssfRow.createCell(a).setCellValue(titles[a]);
        }
        for(int a=1;a<=maps.size();a++){
            sxssfRow = sheet.createRow(a);
            Map<String,Object> data = maps.get(a-1);
            Set<String> keySet = data.keySet();
            Iterator<String> iterator = keySet.iterator();
            int cell = 0;
            while(iterator.hasNext()){
                String key = iterator.next();
                Object valueObject = data.get(key);
                sxssfCell =  sxssfRow.createCell(cell);
                sxssfCell.setCellValue(valueObject==null?"":valueObject.toString()); 
                cell++;
            }
            //map数据清理
            data.clear();
        }
        //数据清理
        maps.clear();
        //设置空引用
        maps = null;
    }

    FileOutputStream fos = new FileOutputStream(tempPath+fileName);
    sxssfWorkbook.write(fos);
    fos.close();
    sxssfWorkbook.dispose();

程序SXSSFRow、SXSSFCell这两个对象持有一个引用,每当新创建一个对象时候原来引用失效jvm会自动回收

End.

转载请注明来自36大数据(36dsj.com): 36大数据» 解决POI大数据导出Excel内存溢出、应用假死

相关 [poi 大数据 excel] 推荐:

解决POI大数据导出Excel内存溢出、应用假死

- - IT瘾-bigdata
最近公司一个06年统计项目在导出Excel时造成应用服务器内存溢出、假死现象;查看代码发现问题一次查询一整年的数据导致堆内存被撑爆(<span style=”color:red;”>假死</span>),随后改用批量查询往Excel中写数据,同样的问题又出现了. 随后在网上查阅了部分资料只是在POI大数据导出API的基础上写的demo示例无任何参考价值….

POI Excel导入导出 - milan's

- - 博客园_首页
   基本思路:点击导出后生成临时.xls文件,返回文件名,供用户下载,下载完后删除文件.    带查询的导出(前端EasyUI),如下为导出界面图.   下面为导出按钮绑定的函数:. var exportCondition={};//导出条件.      //按条件进行查询数据,首先我们得到数据的值.

使用POI操作Excel和Word

- - ITeye博客
前言:今天在项目中看到有小模块是上传Excel解释后保存到数据库的操作,好奇之下去了解了如何使用Apache POI操纵Excel和Word,以下为小分享.       POI是Apache下的一个项目,是用Java编写的开源框架,提供API供开发者直接操作Microsoft Office(Excel,Word,PowerPoint...).

Java读写Excel:Apache POI, JXL与OpenCSV

- - ITeye博客
前些日子把JXL替换为ApachePOI,原因很简单,JXL在2009年10月已经停止更新,并且不支持Excel 2007 OOXML (.xlsx)格式的文件. 事实上把JXL与POI进行比较并不公平,因为JXL只能够操作OLE2格式的Excel(即.xls),而POI则是能够读写xls(x)、doc(x)、ppt(x)的一整套解决方案.

POI处理Excel大文件的问题和解决方法

- - 编程语言 - ITeye博客
    最近在测试上传Excel2007大文件的功能,采用的是Apache POI工具.     发现POI在处理24MExce2007l文件的时候,几乎占用了2G的Heap Space..     由于Excel2007的文件是经过压缩的,其实数据都是存放在shareStringl.xml文件中.

POI读写Word docx文件

- - 开源软件 - ITeye博客
使用 POI 读写 word docx 文件. 1     读docx文件. 1.1     通过XWPFWordExtractor读. 1.2     通过XWPFDocument读. 2     写docx文件. 2.1     直接通过XWPFDocument生成. 2.2     以docx文件作为模板.

PHP导出excel

- syeye - scofield PHP开发-SEO SEM
最近做一个项目,其中涉及到了数据导成excel的功能. 后来使用了 开源的 PHPExcel  http://phpexcel.codeplex.com/ 目前最新版是1.7.6. PHPExcel 可以生成 .xls 和 .xlsx (office2007). 比如设置 excel的title,keywords,description.

[简单] poi word2007简单图文混排

- - ITeye博客
       直接上代码:. POI_图文混排_S3_Test t = new POI_图文混排_S3_Test();. setTextFontInfo(p, false, false, "基本实验技能(常见实验仪器及基本操作)", "宋体", "000000",.

Excel 数据分析

- - ITeye博客
用Excel做数据分析——直方图. 已有 0 人发表留言,猛击->> 这里<<-参与讨论. —软件人才免语言低担保 赴美带薪读研.

Excel高级使用技巧

- demonhunterl - 互联网的那点事
如果直接输入“1/5”,系统会将其变为“1月5日”,解决办法是:先输入“0”,然后输入空格,再输入分数“1/5”. (2) 序列“001”的输入. 如果直接输入“001”,系统会自动判断001为数据1,解决办法是:首先输入“’”(西文单引号),然后输入“001”. 如果要输入“4月5日”,直接输入“4/5”,再敲回车就行了.