如何使用pandas读取txt文件中指定的列(有无标题)
作者:莫不问 时间:2022-04-25 15:30:18
最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了。
我的需求是取出指定的列的数据,踩了些坑给研究出来了。
import pandas as pd
# 我们的需求是取出所有的姓名
# test1的内容
'''
id name score
1 张三100
2 李四 99
3 王五 98
'''
test1 = pd.read_table("test1.txt") # 这个是带有标题的文件
names = test1["name"] # 根据标题来取值
print(names)
'''
张三
李四
王五
'''
# test2的内容
'''
4 Allen100
5 Bob 99
6 Candy 98
'''
test2 = pd.read_table("test2.txt", header=None) # 这个是没有标题的文件
names = test2[1] # 根据index来取值
print(names)
'''
Allen
Bob
Candy
'''
补充知识:关于python中pandas读取txt文件注意事项
语法:pandas.read_table()
参数:
filepath_or_buffer 文件路径或者输入对象
sep 分隔符,默认为制表符
names 读取哪些列以及读取列的顺序,默认按顺序读取所有列
engine 文件路径包含中文的时候,需要设置engine = ‘python'
encoding 文件编码,默认使用计算机操作系统的文字编码
na_values 指定空值,例如可指定null,NULL,NA,None等为空值
常见错误:设置不全
import pandas
data = pandas.read_table(‘D/anaconda/数据分析/文本.txt',
engine=‘python')
print(data)
输出结果:
补全代码:
import pandas
data = pandas.read_table(‘D/anadondas/数据分析/文本.txt',
sep = ‘,' ,#指定分隔符‘,',默认为制表符
names = [‘names',‘age'],#设置列名,默认将第一行数据作为列名
engine = ‘python',
encoding = ‘utf8'#指定编码格式)
print(data)
输出结果:
来源:https://blog.csdn.net/weixin_40283454/article/details/84942859
标签:pandas,读取,txt文件,指定列
0
投稿
猜你喜欢
ajax代理程序,自动判断字符编码
2007-11-04 13:17:00
Python zip()函数用法实例分析
2022-10-28 21:39:53
python神经网络InceptionV3模型复现详解
2021-05-29 16:53:01
python DataFrame中stack()方法、unstack()方法和pivot()方法浅析
2023-12-13 17:38:55
初步讲解Python中的元组概念
2022-06-03 23:05:55
Zend Framework动作助手Redirector用法实例详解
2024-05-13 09:53:15
JS、jQuery中select的用法详解
2024-04-19 09:57:43
Python 26进制计算实现方法
2022-12-09 03:26:36
python查找指定依赖包简介信息实现
2023-11-02 22:04:11
mcrypt启用 加密以及解密过程详细解析
2023-07-15 19:41:55
pygame实现键盘的连续监控
2023-09-26 11:17:10
常用的匹配正则表达式和实例
2008-06-07 09:19:00
如何理解python面向对象编程
2023-01-01 20:19:56
Vue mockjs编写假数据并请求获取实现流程
2024-04-28 09:27:22
python中super().__init__()的用法
2023-09-06 11:43:07
JS仿iGoogle自定义首页模块拖拽特效的方法
2024-04-22 22:36:37
Python处理时间日期坐标轴过程详解
2021-04-28 08:05:27
Oracle数据库下载及安装图文操作步骤
2024-01-26 11:15:49
浅谈tensorflow中张量的提取值和赋值
2022-06-23 19:20:55
Python自动采集微信联系人的实现示例
2023-09-08 07:28:03