python将excel转换为csv的代码方法总结
作者:laozhang 时间:2022-09-16 02:20:48
python:如何将excel文件转化成CSV格式
import pandas as pd
data = pd.read_excel('123.xls','Sheet1',index_col=0)
data.to_csv('data.csv',encoding='utf-8')
将Excel文件转为csv文件的python脚本
#!/usr/bin/env python
__author__ = "lrtao2010"
'''
Excel文件转csv文件脚本
需要将该脚本直接放到要转换的Excel文件同级目录下
支持xlsx 和 xls 格式
在同级目录下生成名为excel_to_csv.csv 的文件,采用UTF-8编码
'''
import xlrd
import csv
import os
#生成的csv文件名
csv_file_name = 'excel_to_csv.csv'
def get_excel_list():
#获取Excel文件列表
excel_file_list = []
file_list = os.listdir(os.getcwd())
for file_name in file_list:
if file_name.endswith('xlsx') or file_name.endswith('xls'):
excel_file_list.append(file_name)
return excel_file_list
def get_excel_header(excel_name_for_header):
#获取表头,并将表头全部变为小写
workbook = xlrd.open_workbook(excel_name_for_header)
table = workbook.sheet_by_index(0)
#row_value = table.row_values(0)
row_value = [i.lower() for i in table.row_values(0)]
return row_value
def read_excel(excel_name):
#读取Excel文件每一行内容到一个列表中
workbook = xlrd.open_workbook(excel_name)
table = workbook.sheet_by_index(0) #读取第一个sheet
nrows = table.nrows
ncols = table.ncols
# 跳过表头,从第一行数据开始读
for rows_read in range(1,nrows):
#每行的所有单元格内容组成一个列表
row_value = []
for cols_read in range(ncols):
#获取单元格数据类型
ctype = table.cell(rows_read, cols_read).ctype
#获取单元格数据
nu_str = table.cell(rows_read, cols_read).value
#判断返回类型
# 0 empty,1 string, 2 number(都是浮点), 3 date, 4 boolean, 5 error
#是2(浮点数)的要改为int
if ctype == 2:
nu_str = int(nu_str)
row_value.append(nu_str)
yield row_value
def xlsx_to_csv(csv_file_name,row_value):
#生成csv文件
with open(csv_file_name, 'a', encoding='utf-8',newline='') as f: #newline=''不加会多空行
write = csv.writer(f)
write.writerow(row_value)
if __name__ == '__main__':
#获取Excel列表
excel_list = get_excel_list()
#获取Excel表头并生成csv文件标题
xlsx_to_csv(csv_file_name,get_excel_header(excel_list[0]))
#生成csv数据内容
for excel_name in excel_list:
for row_value in read_excel(excel_name):
xlsx_to_csv(csv_file_name,row_value)
print('Excel文件转csv文件结束 ')
标签:python,excel,csv
0
投稿
猜你喜欢
Mysql全局ID生成方法
2023-07-02 13:59:53
浅谈mysql中多表不关联查询的实现方法
2024-01-14 21:29:21
python标准库 datetime的astimezone设置时区遇到的坑及解决
2022-05-01 23:54:56
python深度学习之多标签分类器及pytorch实现源码
2022-09-26 01:09:12
python将txt文档每行内容循环插入数据库的方法
2024-01-25 21:37:29
python Event事件、进程池与线程池、协程解析
2023-09-06 00:39:19
Python3基础教程之递归函数简单示例
2022-07-19 17:19:16
sql脚本查询数据库表,数据,结构,约束等操作的方法
2024-01-19 17:23:26
在pyCharm中下载第三方库的方法
2022-12-17 10:37:16
Python实现按照指定要求逆序输出一个数字的方法
2023-12-21 23:37:46
MySQL 基础常用命令总结
2024-01-22 16:35:40
如何用CSS实现图像替换链接文本显示并保证链接可点击
2011-03-03 12:37:00
在Python中使用判断语句和循环的教程
2022-06-03 22:31:27
python定时复制远程文件夹中所有文件
2023-08-17 17:55:32
利用ADODB.Stream使用浏览器下载服务器文件
2008-10-09 12:42:00
Python绘制计算机CPU占有率变化的折线图
2021-08-11 05:50:37
PHP常用字符串函数用法实例总结
2024-05-11 10:01:28
JavaScript多种页面刷新方法小结
2024-04-22 12:53:09
重学Go语言之运算符与控制结构详解
2024-02-07 23:42:06
golang 执行命令行的实现
2024-04-28 09:14:40