python利用pandas将excel文件转换为txt文件的方法

作者:NStock20133 时间:2022-04-05 18:49:01 

python将数据换为txt的方法有很多,可以用xlrd库实现。本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件。

直接上代码:


'''
function:将excel文件转换为text
author:Nstock
date:2018/3/1
'''
import pandas as pd
import re
import codecs

#将excel转化为txt文件
def exceltotxt(excel_dir, txt_dir):
with codecs.open(txt_dir, 'w', 'utf-8') as f:
neg=pd.read_excel(excel_dir, header=None, index=None)
f.write(neg.to_string())

#去除记录行首的数字和空格
def del_linehead_number_speace(orig_txt_dir,saveas_txt_dir):
with open(orig_txt_dir,'r+') as f, open(saveas_txt_dir,'r+') as fw:
lines = f.readlines()
print(len(lines)) #行数
texts = [re.sub(r'(\d)+(\s)+','',lines[num]) for num in range(len(lines)) ]

texts = list(set(texts)) #去重如果要保留重复记录注释该行

line_num = len(texts)
#  for num in range(line_num):   #查看转化后的文本
#  print(texts[num])
fw.writelines(texts)

exceltotxt('./data/neg.xls', './data/neg_temp.txt')
del_linehead_number_speace('./data/neg_temp.txt','./data/neg.txt')

说明:xxx_dir带目标文件名为:xxx_dir='保存路径/'+'文件名'

来源:https://blog.csdn.net/teacher20133/article/details/79410464

标签:python,pandas,excel,txt
0
投稿

猜你喜欢

  • pandas使用fillna函数填充NaN值的代码实例

    2023-09-29 05:51:48
  • linux下通过go语言获得系统进程cpu使用情况的方法

    2024-05-08 10:13:01
  • SQL Server中查看对象定义的SQL语句

    2024-01-18 05:52:43
  • Python跨文件全局变量的实现方法示例

    2021-05-26 08:13:23
  • Python利用PyExecJS库执行JS函数的案例分析

    2022-10-26 08:53:19
  • 浅谈Pycharm最有必要改的几个默认设置项

    2021-10-13 05:33:38
  • Golang优雅保持main函数不退出的办法

    2023-07-12 21:15:54
  • JavaScript中随机数方法 Math.random()

    2024-04-10 13:56:30
  • 你是真正的用户体验设计者吗? Ⅱ

    2008-03-21 12:30:00
  • Python中实现结构相似的函数调用方法

    2021-12-04 10:31:03
  • JavaScript与JQuery框架基础入门教程

    2024-04-22 22:23:08
  • Django中URL的参数传递的实现

    2022-12-24 13:53:25
  • 判断触发器正在处理的是插入,删除还是更新触发

    2012-01-29 18:30:34
  • 给自定义对象加上自定义事件的支持的教程

    2023-10-14 20:49:00
  • python实现批量转换文件编码(批转换编码示例)

    2023-07-28 22:03:47
  • 详解Python中find()方法的使用

    2022-08-25 04:25:53
  • js 遍历json返回的map内容示例代码

    2024-04-16 10:32:32
  • JavaScript实现同步于本地时间的动态时间显示方法

    2024-05-11 09:33:19
  • python利用beautifulSoup实现爬虫

    2022-05-17 21:10:34
  • Python的Django框架中的URL配置与松耦合

    2022-11-19 10:23:33
  • asp之家 网络编程 m.aspxhome.com