Java使用Apache POI库读取Excel表格文档的示例

作者:it_wangxiangpan 时间:2021-06-02 04:32:49 

Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。
项目下载页:http://poi.apache.org/download.html

Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案。

  • HSSF - 提供读写Microsoft Excel XLS格式档案的功能。

  • XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。

  • HWPF - 提供读写Microsoft Word DOC格式档案的功能。

  • HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

  • HDGF - 提供读Microsoft Visio格式档案的功能。

  • HPBF - 提供读Microsoft Publisher格式档案的功能。

  • HSMF - 提供读Microsoft Outlook格式档案的功能。

读取Excel文档示例
我们使用POI中的HSSFWorkbook来读取Excel数据。


public void test(File file) throws IOException {
   InputStream inp = new FileInputStream(file);
   HSSFWorkbook workbook = new HSSFWorkbook(inp);

// workbook...遍历操作
 }

上边代码,读取Excel2003(xls)的文件没问题,但是一旦读取的是Excel2007(xlsx)的文件,就会报异常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)”
查阅了资料,Excel2007版本的Excel文件需要使用XSSFWorkbook来读取,如下:


public void test(File file) throws IOException {
   InputStream inp = new FileInputStream(file);
   XSSFWorkbook workbook = new XSSFWorkbook(inp);

// workbook...遍历操作
 }

注意:XSSFWorkbook需要额外导入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。
这样,Excel2007的导入没问题了,但是导入Excel2003又报异常。

所以,在导入Excel的时候,尽量能判断导入Excel的版本,调用不同的方法。
我想到过使用文件后缀名来判断类型,但是如果有人将xlsx的后缀改为xls时,如果使用xlsx的函数来读取,结果是报错;虽然后缀名对了,但是文件内容编码等都不对。
最后,推荐使用poi-ooxml中的WorkbookFactory.create(inputStream)来创建Workbook,因为HSSFWorkbook和XSSFWorkbook都实现了Workbook接口。代码如下:


Workbook wb = WorkbookFactory.create(is);

可想而知,在WorkbookFactory.create()函数中,肯定有做过对文件类型的判断,一起来看一下源码是如何判断的:


/**
  * Creates the appropriate HSSFWorkbook / XSSFWorkbook from
  * the given InputStream.
  * Your input stream MUST either support mark/reset, or
  * be wrapped as a {@link PushbackInputStream}!
  */
 public static Workbook create(InputStream inp) throws IOException, InvalidFormatException {
   // If clearly doesn't do mark/reset, wrap up
   if(! inp.markSupported()) {
     inp = new PushbackInputStream(inp, 8);
   }

if(POIFSFileSystem.hasPOIFSHeader(inp)) {
     return new HSSFWorkbook(inp);
   }
   if(POIXMLDocument.hasOOXMLHeader(inp)) {
     return new XSSFWorkbook(O * ackage.open(inp));
   }
   throw new IllegalArgumentException("Your InputStream was neither an OLE2 stream, nor an OOXML stream");
 }

可以看到,有根据文件类型来分别创建合适的Workbook对象。是根据文件的头部信息去比对进行判断的,此时,就算改了后缀名,还是一样通不过。

标签:Java,Excel
0
投稿

猜你喜欢

  • java Long类型转为String类型的两种方式及区别说明

    2022-11-12 18:03:38
  • Spring BeanFactory和FactoryBean区别解析

    2023-09-18 15:38:28
  • C# 使用Fluent API 创建自己的DSL(推荐)

    2022-03-30 23:36:48
  • c#生成站点地图(SiteMapPath)文件示例程序

    2022-08-03 02:26:55
  • Spring @Bean注解的使用场景与案例实现

    2023-11-20 04:44:22
  • 员工管理系统java版

    2022-05-04 23:33:18
  • java 完全二叉树的构建与四种遍历方法示例

    2022-03-21 00:48:04
  • Java本地缓存工具之LoadingCache的使用详解

    2023-06-24 11:28:11
  • Spring JPA find分页示例详解

    2023-05-09 00:36:46
  • 从搭建Struts2 开发环境说起

    2023-11-18 08:54:53
  • 学生信息管理系统java版

    2023-06-16 15:48:10
  • SpringBoot如何实现word文档转pdf

    2023-04-19 09:33:55
  • shiro之记住登录信息

    2023-03-06 18:39:13
  • MyBatis查询结果resultType返回值类型的说明

    2021-10-25 21:37:39
  • Spring原生Rpc六种的正确打开方式实现示例

    2021-06-23 19:35:03
  • springboot+mybatis-plus 两种方式打印sql语句的方法

    2022-12-29 13:41:11
  • 实现分布式WebSocket集群的方法

    2021-06-12 22:55:10
  • MyBatis ofType和javaType的区别说明

    2021-09-10 22:56:43
  • Java实现的读取资源文件工具类ResourcesUtil实例【可动态更改值的内容】

    2022-01-15 17:27:12
  • Java try catch finally异常处理组合详解

    2021-07-04 18:19:51
  • asp之家 软件编程 m.aspxhome.com