Pandas实现在线文件和剪贴板数据读取详解

作者:尤而小屋 时间:2021-06-02 16:49:55 

前言

大家好,我是Peter~

本文记录的是Pandas两种少用的读取文件方式:

  • 读取在线文件的数据

  • 读取剪贴板的数据

声明:本文案例和在线数据仅用于学术分享

read_html

该函数表示的是直接读取在线的html文件,一般是表格的形式;将HTML的表格转换为DataFrame的一种快速方便的方法。

这个方法对于快速合并来自不同网页上的表格非常有用,就省去了爬取数据再来读取的时间。

具体函数的参数为:

pandas.read_html(io,??#?文件 io 对象;路径或者io.Strings对象
?????????????????match='.+',??#?str?或编译的正则表达式,可选
?????????????????flavor=None,?#?要使用的解析引擎,?None是默认值
?????????????????header=None,??#?文件表头
?????????????????index_col=None,??#?索引
?????????????????skiprows=None,??#?跳过行
?????????????????attrs=None,???#?属性
?????????????????parse_dates=False,???#?日期解析
?????????????????thousands=',',???#?千分位
?????????????????encoding=None,???#?编码
?????????????????decimal='.',???#?识别为小数点的字符
?????????????????converters=None,???#?属性转换
?????????????????na_values=None,??#??空值信息
?????????????????keep_default_na=True,???#?是否保持空值
?????????????????displayed_only=True??#?是否应该解析带有“display:none”?的元素
????????????????)

在线文件1

读取 * 上一份历届奥运会乒乓球冠军的相关数据。该地址下的部分表格形式的数据:

Pandas实现在线文件和剪贴板数据读取详解

Pandas实现在线文件和剪贴板数据读取详解

In [3]:

url?=?"https://zh.m.wikipedia.org/zh/%E5%A5%A5%E6%9E%97%E5%8C%B9%E5%85%8B%E8%BF%90%E5%8A%A8%E4%BC%9A%E4%B9%92%E4%B9%93%E7%90%83%E5%A5%96%E7%89%8C%E5%BE%97%E4%B8%BB%E5%88%97%E8%A1%A8"

df?=?pd.read_html(url)
df

Out[3]:

我们观察到此时读取到的df是一个列表,总长度是15

list

In [4]:

len(df)

Out[4]:

9

查看列表中的部分元素:此时就是一个个的DataFrame形式的数据

Pandas实现在线文件和剪贴板数据读取详解

Pandas实现在线文件和剪贴板数据读取详解

在线文件2

一个国外网站下的数据

Pandas实现在线文件和剪贴板数据读取详解

In [7]:

df1?=?pd.read_html("https://www.fdic.gov/resources/resolutions/bank-failures/failed-bank-list")
type(df1)

Out[7]:

list

In [8]:

len(df1)

Out[8]:

1

In [9]:

df1[0]

Out[9]:

Pandas实现在线文件和剪贴板数据读取详解

读取在线CSV文件

以读取GitHub上一个CSV文件为例:

方式1:直接读取

url="https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"
pd.read_csv(url)

Pandas实现在线文件和剪贴板数据读取详解

方式2:通过io.Strings对象

url="https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"

response=requests.get(url).content??#?先发请求
df2?=?pd.read_csv(io.StringIO(response.decode('utf-8')))
?
df2??#?效果同上

Pandas读取剪贴板

pandas.read_clipboard(sep='\\s+',?**kwargs)

Pandas实现在线文件和剪贴板数据读取详解

官网地址

一个简单的例子说明函数使用:假设本地目录下有这样Excel表格的数据

Pandas实现在线文件和剪贴板数据读取详解

1、先剪贴数据:【Ctrl + C】

Pandas实现在线文件和剪贴板数据读取详解

2、运行代码下面的代码,按下MacOS中的【向上的箭头】 + 【回车键】,完成读取

Windows下面应该是【Shift + Enter】

如果数据比较少,省去了通过Excel或者CSV文件的读取方式的时间:

Pandas实现在线文件和剪贴板数据读取详解

来源:https://mp.weixin.qq.com/s/qyWnRtTyyDNt9LxIYwM0BQ

标签:Pandas,数据,读取
0
投稿

猜你喜欢

  • 详解MySQL导出指定表中的数据的实例

    2024-01-15 05:23:09
  • python实现音乐播放和下载小程序功能

    2023-07-03 17:59:03
  • python 如何用terminal输入参数

    2023-02-19 08:06:15
  • 举例详解Python中循环语句的嵌套使用

    2022-11-23 05:52:07
  • Yii2中SqlDataProvider用法示例

    2023-11-20 10:10:05
  • opencv python模糊影像检测效果

    2021-07-27 04:44:13
  • X/HTML5 v.s. XHTML2(II)

    2008-06-18 13:19:00
  • jupyter读取错误格式文件的解决方案

    2022-04-02 18:56:57
  • Python实现访问者模式详情

    2021-02-16 05:37:51
  • 详解Oracle数据库各类控制语句的使用

    2024-01-13 16:49:00
  • Numpy np.array()函数使用方法指南

    2023-05-23 09:33:37
  • SQL Server 在Management Studio中使用Web浏览器

    2024-01-24 12:48:20
  • python人工智能tensorflow函数tf.get_collection使用方法

    2023-08-09 14:27:54
  • python中内置库csv的使用及说明

    2022-02-22 07:31:54
  • Python读取文件内容为字符串的方法(多种方法详解)

    2023-05-18 18:16:27
  • Python 实现将某一列设置为str类型

    2022-07-27 03:20:12
  • python list格式数据excel导出方法

    2023-09-19 14:21:01
  • python GUI库图形界面开发之PyQt5图片显示控件QPixmap详细使用方法与实例

    2023-05-31 17:41:29
  • CSS的学习应该注意学习方法

    2007-11-27 00:20:00
  • 解决pycharm每次打开项目都需要配置解释器和安装库问题

    2021-10-19 08:38:24
  • asp之家 网络编程 m.aspxhome.com