Python把csv数据写入list和字典类型的变量脚本方法
作者:坏蛋是我 时间:2021-05-27 22:04:20
如下所示:
#coding=utf8
import csv
import logging
logging.basicConfig(level=logging.DEBUG,
format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
datefmt='%a, %d %b %Y %H:%M:%S',
filename='readDate.log',
filemode='w')
'''
该模块的主要功能,是根据已有的csv文件,
通过readDataToDicl函数,把csv中对应的部分,
写入字典中,每个字典当当作一条json数据
'''
class GenExceptData(object):
def __init__(self):
try:
#存放csv中读取的数据
self.mdbuffer=[]
#打开csv文件,设置读的权限
csvHand=open("20170510174450.csv","r")
#创建读取csv文件句柄
readcsv=csv.reader(csvHand)
#把csv的数据读取到mdbuffer中
for row in readcsv:
self.mdbuffer.append(row)
#把数据穿件为为字典类型的
#self.readDataToList()
#保存文件
except Exception,e:
logging.error("Read Excel error:"+e)
finally:
#关闭csv文件
csvHand.close()
def readDataToList(self):
try:
#获取mdbuffer中的元素个数
rowNumber=len(self.mdbuffer)
#设置当前行号
currentrow=1
#设置json数据的属性值
propertyJson={}
#propertyJsonList=[]
#count=0
#读取列表中的元素
dataList=[]
try:
for row in range(1,rowNumber):
#创建一个临时变量用来存取一次循环的属性键值
temp={}
#获取列表中一个元素
item=self.mdbuffer[row]
#获取当前元素,当前元素代表的是每个
#事件起始的位置
currentItem=self.mdbuffer[currentrow]
#获取serviceId并进行解码
serviceId= currentItem[2].decode("gbk")
#获取属性并进行解码,把解码的值存入propertyName
propertyName=item[3].decode("gbk")
#获取属性值并进行解码,把解码的值存入propertyValue
propertyValue=item[4].decode("gbk")
try:
#判断埋点事件与serviceId是否相等
if item[0]==currentItem[0] and item[2]==currentItem[2]:
#把serviceId方式字典propertyJson中
propertyJson["serviceId"]=serviceId
#把属性/值对放入temp字典中
temp[propertyName]=propertyValue
#调用字典的update函数,把temp中的键值对
#添加到 propertyJson字典中
propertyJson.update(temp)
#使用continue,如果为if条件为true则循环执行if语句模块
continue
else:
#把行号设置为当前行
currentrow=row
#把当前的属性解码放入propertyName
propertyName=currentItem[3].decode("gbk")
#把当前的属性值解码放入propertyName
propertyValue=currentItem[4].decode("gbk")
#把serviceId方式字典propertyJson中
propertyJson["serviceId"]=serviceId
#把属性/值对放入propertyJson字典中
propertyJson[propertyName]=propertyValue
#propertyJsonList.append(propertyJson)
dataList.append(propertyJson)
'''
在这说下:
propertyJson.clear()与propertyJson={}的区别:
propertyJson.clear()是删除字典的值,不创建引用,会改变字典本身的值;
propertyJson={}是创建新的引用,字典的中的值不发现变化;
如果想让 self.dataDic.append(propertyJson)该语句执行成功,而且添加每次循环的值,
需要使用propertyJson={}方法;
如果使用propertyJson.clear(),只会把最后一次propertyJson存储的值,添加到self.dataDic中
'''
propertyJson={}
except Exception,e:
logging.error("Get Property Json Error:"+e)
print "Get Property Json Error:",e
except Exception,e:
logging.error("Get Date Error:"+e)
print "Get Date Error:",e
return dataList
except Exception,e:
logging.error("Reading Data TO Dic Error:"+e)
print "Reading Data TO Dic Error:",e
def getAllServiceId(self):
try:
dataList=self.readDataToList()
serList=[item["serviceId"] for item in dataList if item["serviceId"] ]
serList=list(set(serList))
return serList
except Exception,e:
logging.error("Create ServiceId List Error:"+e)
print "Create ServiceId List Error:"+e
def oupPutData(self):
try:
dataList=self.readDataToList()
for item in dataList:
print "{"
for key,val in item.items():
print key,":",val
print "}"
print "#"*50
except Exception,e:
logging.error("OutPut Data Error:"+e)
print "OutPut Data Error:"+e
def createDataDic(self):
try:
dataDic={}
dataList=self.readDataToList()
count=0
for item in dataList:
if item["serviceId"]==u"pageview":
count+=1
print count
serviceIdList=self.getAllServiceId()
if len(serviceIdList)>0 and len(dataList)>0:
for serviceId in serviceIdList:
sameServiceidJosnList=[]
for item in dataList:
itemServiceId=item["serviceId"]
if itemServiceId:
if serviceId==itemServiceId:
sameServiceidJosnList.append(item)
else:
print "ServiceId is null"
dataDic[serviceId]=sameServiceidJosnList
else:
print "seriviceIdList or dataList is null"
return dataDic
'''
for key,val in dataDic.items():
print key,len(val)
print "*"*50
for item in val:
print "{"
for ke,va in item.items():
print ke,":",va
print "}"
print "-"*50
'''
except Exception,e:
print "Create Data Dictionary Error:",e
def test():
gen =GenExceptData()
gen.oupPutData()
if __name__=="__main__":
test()
来源:https://blog.csdn.net/henni_719/article/details/74990209
标签:Python,csv,list,字典
0
投稿
猜你喜欢
SecureCRTSecure7.0查看连接密码的步骤
2021-01-28 07:34:14
用书的概念理解小网站结构
2007-10-31 18:08:00
如何用 Python 处理不平衡数据集
2023-02-21 07:35:31
Python实现简单的代理服务器
2023-03-28 15:13:50
pycharm 使用心得(三)Hello world!
2022-10-08 09:59:56
Python 多线程抓取图片效率对比
2021-12-08 10:10:48
Python如何截图保存的三种方法(小结)
2023-08-24 22:17:19
使用Vue.js和MJML创建响应式电子邮件
2023-07-02 17:08:59
使用基于Python的Tornado框架的HTTP客户端的教程
2023-05-15 06:50:43
详解使用Vue Router导航钩子与Vuex来实现后退状态保存
2024-05-05 09:24:27
python函数存储在模块的优点及用法总结
2023-06-03 16:52:41
段正淳的css笔记(6)-浅谈css框架开发
2008-01-13 22:42:00
js 代码优化点滴记录
2024-05-28 15:41:47
用Python手把手教你实现2048小游戏
2023-02-22 23:27:57
Python多线程通信queue队列用法实例分析
2023-09-22 21:11:44
python调用fortran模块
2023-12-22 23:36:40
python向量化与for循环耗时对比分析
2023-12-21 14:14:59
Python爬虫Xpath定位数据的两种方法
2022-07-03 16:36:53
使用SQL语句将相同名的多行字段内容拼接(方法详解)
2024-01-15 00:11:13
如何利用数据库内容建立一个下拉式列表?
2010-01-01 15:46:00