python 读取以空格分开的文件操作

作者:jingxian 时间:2022-09-08 05:33:21 

在查找数据集的时候发现,并不是所有的数据集都是以csv的格式存储,也就是每一列特征数据的分割并不是都以逗号分割,有的数据格式是以空格为分割

例如.data格式,

接下来就实现对.data格式数据的读取:

(数据来源于Boston房价预测数据集,文件名称为“housing.data”)


import pandas as pd
data = pd.read_csv('./housing.data', delim_whiteshape=True)

以上代码就是实现了对空格的分割,但是不知道针对也是以一列存储,并且数据分割也是空格的csv文件此方法还行得通不。

另外pd.read_csv()中的参数sep和delimiter表示的意义一样,具体如何使用不清楚,目前用到不多。

遇到读取文件不知如何操作的,最后要访问下官方文档或者google查询。

pd.read_csv官方文档

另外,可以直接在原数据集文件加后缀名.csv即可转换成csv文件,但前提是data中的数据已经以,分割好了。

pd.read_csv()中读取文件时,默认第一行作为列名,但有时候第一行也是我们需要的数据,这时需制定参数header=None,或者给每列提前设置好名字,names=[‘column0',‘column1',…]

补充:python 实现以空格分隔的文件读写及二维数组按列折半查找

最近文件读写的工作比较多,每一次读文件都会写单独的函数来适应文件格式,所以写了一个类对文件进行操作。

(用pandas.read_csv读取文件更好用)


import os
class DealData:
   # 数据加载函数
   def load(self, filename):
       data = []
       file = open(filename, 'r')
       for line in file.readlines():
           line = line.strip('\n')         # 除去换行
           line = line.split(' ')          # 文件以“ ”分隔
           if "" in line:                  # 解决每行结尾有空格的问题
               line.remove("")
           data.append(line)
       file.close()
       return data

# 折半查找                               # array是一个二维数组,函数实现的功能是按照array的第lie列折半查找
   def search(self, array, lie, target):
       low = 0
       high = len(array) - 1
       while array[low][lie] <= array[high][lie]:
           mid = int((low + high) / 2)
           midval = array[mid][lie]
           if midval < target:
               low = mid + 1
           elif midval > target:
               high = mid - 1
           if high < 0 or low >= len(array):
               break
       return high
   # 将数据保存到文件                
   def save(self, data, filename):
       file = open(filename, 'w')
       for i in range(0, len(data), 1):
           for k in range(0, len(data[i]), 1):
               file.write(str(data[i][k]))
               file.write(" ")
           file.write("\n")
       file.close()

可以将Dealdata类单独创建一个python文件,命名为Dealdata,调用方法如下:


from DealData import DealData
deal = DealData()
totaldata = deal.load("E:\low_data.txt")

之前先引用类:from Dealdata import Dealdata, 其中第一个Dealdata为被调用的python文件名, 第二个Dealdata为被调用的类名。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

来源:https://blog.csdn.net/weixin_44778883/article/details/90051029

标签:python,空格,分开,文件
0
投稿

猜你喜欢

  • Python删除列表中重复元素的七种方法举例

    2021-08-16 06:10:15
  • 一文带你吃透什么是PHP中的序列化

    2023-06-12 19:44:20
  • 人民币的符号的正确表示法?一杠?两杠?¥还是¥呢?

    2010-03-24 12:21:00
  • Python开发工具Pycharm的安装以及使用步骤总结

    2022-09-15 08:21:01
  • Python configparser模块配置文件过程解析

    2023-03-04 09:35:49
  • 一步步教你安装VSCode(附带图解步骤)

    2023-09-30 05:13:06
  • 几个javascript特效代码

    2010-04-23 20:39:00
  • 基于Python实现商场抽奖小系统

    2021-07-01 14:46:14
  • Django实现文件分享系统的完整代码

    2022-07-12 11:28:21
  • 背景图片千万不要gzip压缩,尤其是PNG

    2009-06-19 12:42:00
  • 三分钟掌握PHP操作数据库

    2023-06-01 01:15:43
  • 浅析MySQL内存的使用说明(全局缓存+线程缓存)

    2024-01-26 02:46:20
  • OraclePL/SQL单行函数和组函数详解

    2010-07-28 13:02:00
  • MSMQ微软消息队列详解

    2024-05-03 15:32:00
  • 如何用C代码给Python写扩展库(Cython)

    2023-06-08 17:06:32
  • python 包之 multiprocessing 多进程

    2021-02-25 12:13:15
  • 如何调试 XMLHttpRequest

    2008-08-15 13:59:00
  • python实现PID算法及测试的例子

    2021-08-30 00:57:33
  • 用python处理图片之打开\\显示\\保存图像的方法

    2021-03-16 11:37:08
  • python基础之while循环语句的使用

    2021-03-16 16:54:20
  • asp之家 网络编程 m.aspxhome.com