Python从csv文件中读取数据及提取数据的方法
作者:施施吖 时间:2021-01-26 07:12:44
数据保存在csv文件中
1.从csv文件中读取数据
参数header=None的有无
(1)没有header=None——直接将csv表中的第一行当作表头
# 读取数据
import pandas as pd
data = pd.read_csv("data1.csv")
print(data)
打印结果为:
(2)有header=None——自动添加第一行当作表头
# 读取数据
import pandas as pd
data = pd.read_csv("data1.csv",header=None)
print(data)
打印结果为:
2.数据切割
(这里根据csv表的格式,将header=None不写)
(1)获取所有列,并存入一个数组中
# 读取数据
import pandas as pd
data = pd.read_csv("data1.csv")
# print(data)
# ①获取所有列,并存入一个数组中
import numpy as np
data = np.array(data)
print(data) # 用户编号 性别 年龄(岁) 年收入(元) 是否购买
# [[15624510 1 19 19000 0]
# [15810944 1 35 20000 0]
# [15668575 2 26 43000 0]
# [15603246 2 27 57000 0]
# [ ... ... ... ... ...]]
(2)获取指定列的数据,并存入一个数组中
方法一:从csv文件获取data,data[ ] ——需要考虑数据的维度问题
# 读取数据
import pandas as pd
data = pd.read_csv("data1.csv")
print(data) # 用户编号 性别 年龄(岁) 年收入(元) 是否购买
# (1)获取第1列,并存入一个数组中
import numpy as np
col_1 = data["用户编号"] #获取一列,用一维数据
data_1 = np.array(col_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
# 15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
# 15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
# 15705113 15631159 15792818 15633531 15744529]
# (2)获取第1,2列
col_12 = data[["用户编号","性别"]] #获取两列,要用二维数据
data_12 = np.array(col_12)
print(data_12)
# [[15624510 1]
# [15810944 1]
# [15668575 2]
# [15603246 2]
# [ ... ..]]
方法二:usecols=[ ] —— 直接写入获取的列数
import pandas as pd
import numpy as np
data_1 = pd.read_csv("data1.csv",usecols=["用户编号"])
data_1 = np.array(data_1)
print(data_1)
# [[15624510]
# [15810944]
# [15668575]
# [15603246]
# [ ... ]]
# (2)如获取第1,2列
data_12 = pd.read_csv("data1.csv",usecols=["用户编号","性别"])
data_12 = np.array(data_12)
print(data_12)
# [[15624510 1]
# [15810944 1]
# [15668575 2]
# [15603246 2]
# [ ... ..]]
方法三:iloc[ ] ——实质就是切片操作
import pandas as pd
import numpy as np
data = pd.read_csv("data1.csv")
# (1)获取第1列
data_1 = data.iloc[:,0]
data_1 =np.array(data_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
# 15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
# 15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
# 15705113 15631159 15792818 15633531 15744529]
# (2)获取第1,2列
data_12 = data.iloc[:,0:2]
data_12 = np.array(data_12)
print(data_12)
# [[15624510 1]
# [15810944 1]
# [15668575 2]
# [15603246 2]
# [ ... ..]]
# 获取最后两列
data_last = data.iloc[:,-2:]
data_last = np.array(data_last)
print(data_last)
# [[ 19000 0]
# [ 20000 0]
# [ 26 43000 0]
# [ 27 57000 0]
# [ ... ... ...]]
来源:https://blog.csdn.net/lucky_shi/article/details/105321149
标签:Python,csv文件,数据
0
投稿
猜你喜欢
python应用文件读取与登录注册功能
2023-04-17 17:04:03
vue动态添加store、路由和国际化配置方式
2024-05-05 09:10:09
PDO::_construct讲解
2023-06-06 03:22:31
pygame实现贪吃蛇小游戏
2023-04-18 19:09:07
Pycharm生成可执行文件.exe的实现方法
2023-07-19 12:09:54
JavaScript Reduce使用详解
2024-04-19 10:16:03
Go使用Gin+mysql实现增删改查的详细实例
2024-01-20 20:38:43
golang简单读写文件示例
2024-05-22 10:13:21
python能自学吗
2023-09-25 09:33:47
SQL基础查询和LINQ集成化查询
2024-01-18 21:51:47
Python 绘制酷炫的三维图步骤详解
2022-08-28 21:07:08
golang grpc配置使用实战
2024-02-06 01:17:09
在VS2017中用C#调用python脚本的实现
2021-09-19 00:59:06
Python3.6基于正则实现的计算器示例【无优化简单注释版】
2023-07-19 05:29:25
网页版面布局的方法及技巧
2007-10-29 12:41:00
PHP闭包定义与使用简单示例
2023-11-23 03:12:15
JS实现普通轮播图特效
2024-04-17 10:19:52
pycharm配置当鼠标悬停时快速提示方法参数
2022-12-07 09:24:41
Pytest+request+Allure实现接口自动化框架
2023-08-12 17:29:33
IE7的web标准之道 Ⅰ
2008-08-13 12:42:00