python实现大文本文件分割
作者:Angryshark_128 时间:2023-09-03 10:00:53
本文实例为大家分享了python实现大文本文件分割的具体代码,供大家参考,具体内容如下
开发环境
Python 2
实现效果
通过文件拖拽或文件路径输入,实现自定义大文本文件分割。
代码实现
#coding:gbk
import os,sys,shutil
is_file_exits=False
while not is_file_exits:
files_list=[]
if(len(sys.argv)==1):
print('请输入要切割的文件完整路径:')
files_path=raw_input().strip()
for str_file_path in files_path.split(' '):
if(str_file_path.strip()==''):
continue
if(not os.path.exists(str_file_path.strip())):
print(str_file_path.strip()+'文件路径不存在,请重新输入!')
is_file_exits=False
break
else:
files_list.append(str_file_path.strip());
is_file_exits=True
else:
for str_file_path in sys.argv[1:len(sys.argv)]:
if(str_file_path.strip()==''):
continue
if(not os.path.exists(str_file_path.strip())):
print(str_file_path.strip()+'文件路径不存在,请重新输入!')
is_file_exits=False
break
else:
files_list.append(str_file_path.strip());
is_file_exits=True
print('待切割文件:'+str(files_list))
is_continue=False
while not is_continue:
print('请输入要切割的文件个数:')
str_files_count=raw_input()
if str_files_count.isdigit():
is_continue=True
else:
print('请输入正确的数字!')
for file_path in files_list:
split_file_path=''
total_lines_count=0
lines_count=0
files_count=int(str_files_count)
print('正在统计文本行数.....')
total_lines_count = len(open(file_path,'rU').readlines())
print('文本总行数:'+str(total_lines_count))
if files_count>total_lines_count:
print('文本太小,不值得分割!')
sys.exit()
(filepath,filename) = os.path.split(file_path);
(filepathname,extension) = os.path.splitext(file_path)
if os.path.exists(filepathname):
shutil.rmtree(filepathname)
os.mkdir(filepathname)
lines_count=int(total_lines_count/files_count)
mod_count=total_lines_count%files_count
print('正在进行文件分割.....')
line_num=0
file_num=0
temp=-1
for line in open(file_path,'rU').readlines():
if file_num<mod_count:
file_num=int(line_num/(lines_count+1))
else:
file_num=int((line_num-mod_count*(lines_count+1))/lines_count+mod_count)
split_file_path=filepathname+'/'+str.replace(filename,extension,'_'+str(file_num)+extension)
with open(split_file_path,'a+') as split_file:
split_file.write(line)
if temp!=file_num:
print('正在生成:'+split_file_path)
temp=file_num
line_num+=1
print(file_path+'分割完成!')
split_file.close()
os.system('pause')
源码地址
来源:https://blog.csdn.net/weixin_42078760/article/details/89033381
标签:python,文本分割,文件分割
0
投稿
猜你喜欢
ASP FSO显示特殊文件夹的实现代码(畸形目录名、UNC路径)
2012-11-30 20:10:46
Python全景系列之数据类型大盘点
2021-01-10 15:29:19
Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例
2022-11-13 00:12:24
对numpy中shape的深入理解
2023-12-09 03:43:41
golang实现多协程下载文件(支持断点续传)
2024-01-31 23:54:34
php中数字、字符与对象判断函数用法实例
2023-07-24 03:27:08
bootstrapTable+ajax加载数据 refresh更新数据
2023-10-18 13:21:13
python保存字典数据到csv文件的完整代码
2023-04-09 17:02:02
vue.js父组件使用外部对象的方法示例
2024-05-29 22:43:22
在数据库中自动生成编号的实现方法分享
2011-11-03 16:55:24
数据库报错:Unknown column 'xxx' in 'where clause'问题的解决过程
2024-01-22 23:23:04
清除浮动新说
2009-12-25 18:49:00
Mysql之SQL Mode用法详解
2024-01-24 06:19:19
python操作toml文件的示例代码
2023-06-12 03:58:33
asp获取客户端的MAC地址
2007-08-17 10:58:00
Webpack path与publicPath的区别详解
2024-04-29 13:37:49
python字符串,数值计算
2022-12-28 11:20:32
细化解析:SQL Server 2005 数据库镜像
2009-01-23 13:41:00
pandas使用get_dummies进行one-hot编码的方法
2023-10-22 06:43:02
MySQL数据库与表的最基本命令大盘点
2010-08-31 14:29:00