POI用户模型的重构与优化

2019-10-08吉豪杰宋欣潮

软件 2019年5期

吉豪杰宋欣潮

摘要： Apache POI中的用户模型是目前用于处理Excel数据的最为广泛的应用技术，但用户模型存在许多明显的弊端。本文将以一个学生档案管理系统为例，对用户模型中存在的问题以及产生问题的原因进行分析，并针对这些问题，借用面向过程的设计思想对用户模型进行优化和改进。使用不同规模的数据量对改进前后的用户模型进行测试，并对测试结果进行比较和分析，最终在一定程度上解决了用户模型的弊端，提升了用户模型的性能。

关键词：用户模型;生产者消费者模型;POI技术;数据优化;内存溢出;设计模式;java多线程

中图分类号： TP315 文献标识码： A DOI：10.3969/j.issn.1003-6970.2019.05.038

本文著录格式：吉豪杰，宋欣潮. POI用户模型的重构与优化[J]. 软件，2019，40（5）：193199

【Abstract】： The UserModel in Apache POI is the most widely used technology for processing Excel data at present， but the user model has many obvious disadvantages.This paper will take a student file management system as an example to analyze the problems existing in the UserModel and the causes of the problems. In view of these problems， the UserModel will be optimized and improved by using the process-oriented design idea.The data volumes of different scales were used to test the UserModel before and after the improvement， and the test results were compared and analyzed. Finally， the disadvantages of the UserModel were solved to some extent， and the performance of the UserModel was improved.

【Key words】： UserModel; Producer consumer model; POI; Data optimization; Out of memoryerror; Design mode; Java multithreading

0 引言

在当前的软件开发中，越来越多的需求涉及到对MicroSoft Office文档的处理，其中对Excel数据文档的处理尤为普遍。因此，关于对Excel文件处理的讨论与研究也愈演愈烈。到目前为止，已经出现了许多关于处理Excel文件的技术和开源项目，例如Java Excel Api（jxl），Apache POI[1]，Alibaba EasyExcel等。这些开源项目各有特色，都能够适用于不同的开发场景，满足了大多数不同的开发需求，但也存在诸多问题，其中对Apache POI相关技术所存在问题的研究是本文讨论的重点。本文的创新点在于将面向过程的生产者消费者模型[2]的设计思想应用到传统的用户模型当中，以及采用多线程[3-9]的方式实现用户模型，对传统的用户模型处理Excel数据的程序进行重构，使用户模型在程序结构上逻辑更加清晰、功能更加明确，在数据处理能力上更加高效。

1 POI用户模型

1.1 用户模型简介

POI是由Apache组织提供的用java编写的免费开源的跨平台的 Java API，Apache POI提供API给Java程序对MicroSoft office格式档案读和写的功能[1]。POI中关于Excel数据处理的部分主要包括User API、Event API和Streaming UserModel API。本文将重点讨论User API中的UserModel。

所謂的UserModel实际上就是基于Dom方式的解析，Dom解析就是将文件全部读入内存，对文件内部的结构进行建模，形成一颗Dom树的过程，如图1用户模型的Dom树结构。

从图1中可以看出，用户模型提供封装好的Workbook、Sheet、Row、Cell等实例来完成对excel数据的读写。

1.2 用户模型的应用

经过对用户模型的简单介绍，现在以文献[4]中提到的学生档案管理系统为例，对用户模型的Excel数据解析功能进行实现。该功能的业务处理过程为：①以流的方式接受excel文件;②根据接受的文件生成WorkBook对象;③根据Dom结构，遍历每个Sheet的每一个Row，将每一个Row中的Cell的值读取出来，存放到list集合中;④对list中的数据进行类型转换，并封装到领域对象Student中，生成存放Student对象的集合;⑤利用数据库的批量添加操作，将Student集合持久化到数据库中（涉及到多表操作）。

用户模型代码：

Student类：

public class Student {

private BigInteger stuId;//学号

private Archive archive;//档案

private Profession pro;//专业

private Department department;//院系

private String stuName;//姓名

private String stuSex;//性别

private String stuSendnum;//派遣证号

private String stuClass;//班级

private String stuLocation;//生源地

//省略部分属性和set、get方法

}

用户模型解析excel方法：

public static List> getListByExcel（InputStream in，String fileName） throws Exception{

List> list=null;

Workbook wb=getWorkBook（in，fileName）; //获取WorkBook对象

if （wb！=null）{

Sheet sheet=null;

Row row=null;

Cell cell=null;

list=new ArrayList>（）;

for （int i=0;i

sheet=wb.getSheetAt（i）;

if （sheet==null）{continue;}

//遍历每一行

for （int j=sheet.getFirstRowNum（）; j<=sheet.getLastRowNum（）;j++）{

row=sheet.getRow（j）;

Integer columns= （int）row. getLastCellNum（）;

//遍歷每一列

List

POI用户模型的重构与优化

猜你喜欢

杂志排行

软件的其它文章