完美解决java读取大文件内存溢出的问题
作者:jingxian 时间:2023-07-31 17:53:17
1. 传统方式:在内存中读取文件内容
读取文件行的标准方式是在内存中读取,Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法:
Files.readLines(new File(path), Charsets.UTF_8);
FileUtils.readLines(new File(path));
实际上是使用BufferedReader或者其子类LineNumberReader来读取的。
传统方式的问题: 是文件的所有行都被存放在内存中,当文件足够大时很快就会导致程序抛出OutOfMemoryError 异常。
问题思考:我们通常不需要把文件的所有行一次性地放入内存中,相反,我们只需要遍历文件的每一行,然后做相应的处理,处理完之后把它扔掉。所以我们可 以通过行迭代方式来读取,而不是把所有行都放在内存中。
2. 大文件读取处理方式
不重复读取与不耗尽内存的情况下处理大文件:
(1)文件流方式:使用java.util.Scanner类扫描文件的内容,一行一行连续地读取
FileInputStream inputStream = null;
Scanner sc = null;
try {
inputStream = new FileInputStream(path);
sc = new Scanner(inputStream, UTF-8);
while (sc.hasNextLine()) {
String line = sc.nextLine();
// System.out.println(line);
}
}catch(IOException e){
logger.error(e);
}finally {
if (inputStream != null) {
inputStream.close();
}
if (sc != null) {
sc.close();
}
}
该方案将会遍历文件中的所有行,允许对每一行进行处理,而不保持对它的引用。总之没有把它们存放在内存中!
(2)Apache Commons IO流:使用Commons IO库实现,利用该库提供的自定义LineIterator
LineIterator it = FileUtils.lineIterator(theFile, UTF-8);
try {
while (it.hasNext()) {
String line = it.nextLine();
// do something with line
}
} finally {
LineIterator.closeQuietly(it);
}
该方案由于整个文件不是全部存放在内存中,这也就导致相当保守的内存消耗。
来源:http://www.cnblogs.com/echoty/p/7326827.html
标签:java,读取,大文件,内存溢出
0
投稿
猜你喜欢
java实现简单年龄计算器
2022-01-28 02:23:34
SpringBoot ResponseBody返回值处理的实现
2023-06-29 23:18:43
Spring JPA find单表查询方法示例详解
2022-11-03 19:43:38
C#中string.Empty和null的区别详解
2023-05-19 16:01:45
springboot自动扫描添加的BeanDefinition源码实例详解
2023-11-24 15:15:22
java实现抽奖功能解析
2021-08-29 16:08:21
关于Java中的IO流总结(推荐)
2023-08-23 18:13:56
Java实现AWT四大事件的详细过程
2023-11-28 18:39:52
C#中判断、验证字符串是否为日期格式的实现代码
2021-06-05 01:57:26
执行java请求时导致在脚本执行结束时JVM无法退出
2023-11-25 05:57:13
引入mybatis-plus报 Invalid bound statement错误问题的解决方法
2021-06-01 14:28:00
java设计模式之外观模式学习笔记
2022-07-02 18:48:06
浅谈Java常见的排序算法
2023-09-08 11:11:11
executor包执行器功能
2023-07-26 21:07:36
Java最简洁数据结构之冒泡排序快速理解
2023-12-01 06:31:52
详解IntelliJ IDEA中TortoiseSVN修改服务器地址的方法
2023-11-25 04:51:04
SpringBoot创建maven多模块项目实战代码
2023-11-11 04:05:32
C#实现观察者模式(Observer Pattern)的两种方式
2023-06-20 21:05:18
spring boot集成smart-doc自动生成接口文档详解
2023-11-28 23:08:02
Android之复选框对话框用法实例分析
2023-10-03 05:07:03