python3 循环读取excel文件并写入json操作
作者:qubeijun 时间:2022-11-07 15:40:11
文件内容:
excel内容:
代码:
import xlrd
import json
import operator
def read_xlsx(filename):
# 打开excel文件
data1 = xlrd.open_workbook(filename)
# 读取第一个工作表
table = data1.sheets()[0]
# 统计行数
n_rows = table.nrows
data = []
# 微信文章属性:wechat_name wechat_id title abstract url time read like number
for v in range(1, n_rows-1):
# 每一行数据形成一个列表
values = table.row_values(v)
# 列表形成字典
data.append({'wechat_name': values[0],
'wechat_id': values[1],
'title': values[2],
'abstract': values[3],
'url': values[4],
'time': values[5],
'read': values[6],
'like': values[7],
'number': values[8],
})
# 返回所有数据
return data
if __name__ == '__main__':
d = []
# 循环打开每个excel
for i in range(1, 16):
d1 = read_xlsx('./excel data/'+str(i)+'.xlsx')
d.extend(d1)
# 微信文章属性
# 按时间升序排列
d = sorted(d, key=operator.itemgetter('time'))
# 写入json文件
with open('article.json', 'w', encoding='utf-8') as f:
f.write(json.dumps(d, ensure_ascii=False, indent=2))
name = []
# 微信id写文件
f1 = open('wechat_id.txt', 'w')
for i in d:
if i['wechat_id'] not in name:
name.append(i['wechat_id'])
f1.writelines(i['wechat_id'])
f1.writelines('\n')
print(len(name))
结果:
补充知识:Python mysql数据 读取时间参数 for循环写入Excel文件
最近在利用Python 实现自动化表报时,有个功能是mysql的业务时间是读取模板文件的时间参数,需要用到for循环功能,基本思路是:
1.自动创建一个输出文件的文件夹
2.根据模板文件创建一个新的excel文件到新创建的文件夹中
3.每次写入时返回sheet的最大行数max_row,下次写入时从最大行的下一行开始继续写入
4.每次读取必须为同一个文件
代码如下:
#! /usr/bin/env python
# -*- coding:utf-8 -*-
import MySQLdb
from openpyxl import load_workbook
import sys
import time
import os
reload(sys)
sys.setdefaultencoding('utf8')
# 打开数据库连接
db = MySQLdb.connect(host="localhost", user="zimu", passwd="zimu", db="xxx", port=0000,charset='utf8')
template_file_demo = r"D:\path\demo.xlsx"
# makedirs 创建文件时如果路径不存在会创建这个路径
output_path = r"D:\output\demo"+"_"+ time.strftime("%Y%m%d", time.localtime()) +"_" + str(int(time.time()))+"\\"
os.makedirs(output_path)
#创建文件到新创建的文件夹中
book_demo = load_workbook(template_file_demo)
book_demo.save(output_path + "demo" +"_"+time.strftime("%Y%m%d", time.localtime())+".xlsx")
#读取指定文件夹下的文件
demo_file = output_path+"demo"+"_"+time.strftime("%Y%m%d", time.localtime())+".xlsx"
def savedata(start_time,end_time):
demosql = '''select * from demo where start_date<='%s' and end_date>='%s''''%(start_time,end_time)
cursor = db.cursor()
cursor.execute(demosql)
demodata = cursor.fetchall()
demo_book = load_workbook(demo_file)
demosheet = demo_book['demo']
row_t = demosheet.max_row
i = 0
while i < len(demodata):
for j in range(0, 8):
demosheet.cell(row_t + i + 1, j + 1).value = demodata[i][j]
i += 1
demo_book.save(output_path+"demo"+"_"+time.strftime("%Y%m%d", time.localtime())+".xlsx")
book_template = load_workbook(template_file_demo)
timet = book_template['时间配置']
for t in range(2, timet.max_row + 1): # 读取配置表中的时间
savedata(timet.cell(t, 1).value, timet.cell(t, 2).value)
5.模板文件的时间参数设置如下:
来源:https://blog.csdn.net/qubeijun/article/details/81389980
标签:python3,excel,json
0
投稿
猜你喜欢
JavaScript实现计算圆周率到小数点后100位的方法示例
2024-02-27 02:38:58
封装html的select标签的js操作实例
2024-05-09 10:34:07
django在开发中取消外键约束的实现
2021-10-12 05:47:57
php预定义常量
2023-11-14 10:35:27
Python设计模式之MVC模式简单示例
2023-02-24 16:58:33
Python的装饰器使用详解
2023-07-26 02:21:17
python装饰器decorator介绍
2021-12-18 10:56:25
MySQL外键设置的方法实例
2024-01-19 14:10:42
Mysql Explain命令的使用与分析
2024-01-29 08:39:04
Python+Matplotlib实现给图像添加文本标签与注释
2022-05-02 12:40:16
解决PyCharm import torch包失败的问题
2023-12-05 14:27:24
python实现的希尔排序算法实例
2023-03-27 05:01:38
Python 网络爬虫--关于简单的模拟登录实例讲解
2022-11-21 16:52:55
MySQL数据库完全卸载的方法
2024-01-28 05:59:21
python抓取搜狗微信公众号文章
2021-10-25 17:56:08
完全卸载MYSQL
2011-02-23 12:11:00
python 获取域名到期时间的方法步骤
2022-09-02 13:37:43
python爬取一组小姐姐图片实例
2023-08-03 15:05:45
Python使用wget实现下载网络文件功能示例
2022-04-28 03:27:46
python3实现猜数字游戏
2022-09-11 16:10:38