python:pandas合并csv文件的方法(图书数据集成)
作者:kevinelstri 时间:2021-06-22 09:34:40
数据集成:将不同表的数据通过主键进行连接起来,方便对数据进行整体的分析。
两张表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:
ReaderRentRecode.csv:
pandas读取csv文件,并进行csv文件合并处理:
# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv读取表格数据
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas读取表格数据
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 读者借阅信息表
'''
print df.head()
print '----------------'
print df[['读者证号', '读者姓名', '书名', '中图法分类号']] # 选取其中的四列
print '------------------------------------------------------------------'
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['读者证号', '读者性别', '读者单位', '读者类别']]
print '------------------------------------------------------------------'
'''
data = pd.merge(df, dd, on=['读者证号', '读者姓名'], how='left') # pandas csv表左连接
data = data[['读者证号', '读者姓名', '读者性别', '书名', '中图法分类号', '读者单位', '读者类别']]
print data
print '------------------------------------------------------------------'
# -------------
# pandas写入表格数据
# -------------
data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv
通过使用pandas的函数merge来进行两个表的左连接,最后得到相应的data.csv文件。
来源:https://blog.csdn.net/kevinelstri/article/details/55049179
标签:python,pandas,csv,合并,图书
![](/images/zang.png)
![](/images/jiucuo.png)
猜你喜欢
如何利用python查找电脑文件
2022-02-16 18:30:37
![](https://img.aspxhome.com/file/2023/5/80505_0s.jpg)
ASP中使用Set ors=oConn.Execute()时获取记录数的方法
2011-02-20 10:48:00
Python进阶之高级用法详细总结
2022-01-20 10:00:53
![](https://img.aspxhome.com/file/2023/8/128198_0s.png)
链接与文本标签们
2008-04-04 18:07:00
解决Django no such table: django_session的问题
2022-04-13 22:06:21
![](https://img.aspxhome.com/file/2023/0/127710_0s.jpg)
采用XMLHTTP编写一个天气预报的程序
2007-10-15 12:35:00
解决Building wheel for wrapt (setup.py) ... error的问题
2023-09-25 22:24:17
![](https://img.aspxhome.com/file/2023/1/86261_0s.jpg)
python3实现UDP协议的服务器和客户端
2022-07-01 09:17:08
深入解析python中的实例方法、类方法和静态方法
2022-07-23 09:05:57
![](https://img.aspxhome.com/file/2023/8/72828_0s.png)
Python Opencv任意形状目标检测并绘制框图
2023-06-06 19:03:43
![](https://img.aspxhome.com/file/2023/7/92417_0s.jpg)
Python3如何将源目录中的图片用MD5命名并可以设定目标目录
2023-11-28 10:33:17
详解Golang语言HTTP客户端实践
2023-09-17 13:52:07
Python中如何引入第三方模块
2023-08-27 08:34:48
python关闭占用端口方式
2022-03-26 14:10:53
关于tensorflow的几种参数初始化方法小结
2023-10-15 12:05:26
鼠年发几张可爱老鼠的表情gif
2008-01-29 12:50:00
![](https://img.aspxhome.com/file/UploadPic/20081/29/2008129125546627s.gif)
机器学习的框架偏向于Python的13个原因
2023-09-28 06:24:42
![](https://img.aspxhome.com/file/2023/8/112008_0s.jpg)
python3.4中清屏的处理方法
2023-11-14 04:09:21
![](https://img.aspxhome.com/file/2023/3/64603_0s.jpg)
ASP导出Excel数据的四种办法
2007-08-26 18:32:00
python实现八大排序算法(2)
2023-09-05 06:28:23
![](https://img.aspxhome.com/file/2023/9/90779_0s.png)