Python数据分析 Pandas Series对象操作

作者:??tigeriaf???? 时间:2021-07-17 20:18:52 

一、Pandas Series对象

Pandas 是基于 NumPy 设计实现的 Python 数据分析库,Pandas 提供了大量的能让我们高效处理数据的函数和方法,也纳入了很多数据处理的库以及一些数据模型,可以说非常强大。

可以使用以下命令进行安装:

conda install pandas
# 或
pip install pandas

Series数据结构

Pandas 最常用的数据结构主要有两种:Series 和 DataFrame,这篇文章主要介绍一下Series及如何创建Series对象。

Series 是一维数组,由一列索引index和一列值values组成,索引和值是一一对应的,可以存储不同种类的数据类型,字符串、布尔值、数字、Python对象等都可以。

创建Series对象

创建Series对象的格式如下:

s = pd.Series(data, index)

参数data为数据,可以是字典、列表、Numpy的 ndarray 数组等;
参数index为索引,值必须唯一,类似于Python字典的键,可以不传,默认为从0开始递增的整数。

从列表创建:

data = ["a", "b", "c", "d", "e"]
s = pd.Series(data)
s

从字典创建:

当data为字典时,如果没有传入索引的话,会按照字典的键来构造索引,索引对应的值就是字典的键对应的值。

data = {"a": 1, "b": 2, "c": 3}
s = pd.Series(data)
s

结果输出如下:

a    1
b    2
c    3
dtype: int64

从 ndarray 数组创建:

ndarray 为Numpy 的数组类型,在Python数据分析 Numpy 的使用方法的文章已经介绍过。

data = np.array([1, 2, 3, 4])
s = pd.Series(data)
s

我们可以通过创建的Series对象,调用相应的属性和方法来进行数据的处理分析等。下面继续来看Series对象的基本操作

二、Series对象的基本操作

Series 常用属性

  • index:获取索引

  • values:获取数组

  • size:获取元素数量

  • dtype:获取对象的数据类型

获取索引及修改索引

data = ["a", "b", "c", "d"]
s = pd.Series(data)
print(s.index)
s.index = ["A", "B", "C", "D"]
print(s.index)

结果输出如下:

RangeIndex(start=0, stop=4, step=1)
Index(['A', 'B', 'C', 'D'], dtype='object')

指定索引对应元素的获取、修改及删除

Series 通过索引获取、修改及删除对应元素和Python字典的操作有些类似,具体使用方法如下:

# 获取数据
print(s["A"])
# 修改数据
s['A'] = 99
# 删除数据
s = s.drop("B")
s

另外,Series 也支持通过筛选条件获取数据,例如获取能被2整除的数据:

data = np.array([1, 2, 3, 4])
s = pd.Series(data)
s[s%2==0]

Series 切片

Series 切片操作同Python列表的切面也是类似的,如下:

s[0:3]

表示取第0、1、2个数据。

也可以使用索引值来进行切片,例如获取索引值B-D的值:

s["B":"D"]
复制代码

Series 常用方法

  • head(n):返回前n行数据,默认前5行

  • tail(n):返回后n行数据,默认后5行

  • isnull()&nonull():判断是否为空,返回True和False

  • sort_values():排序,通过传递ascending参数来确定升序or降序,默认为True,表示升序

  • dropna():删除空值

Series 运算

统计信息

可以通过describe()方法获取统计信息,如下:

Python数据分析 Pandas Series对象操作

也可以通过如下方法分别获取:

  • min():获取最小值

  • max():获取最大值

  • mean():获取均值

  • median():获取中位数

  • sum():获取总和

  • count():获取总数

  • ······

四则运算

s+2  # 对每个元素进行+2
s*100  # 对每个元素乘100

也可以调用如下方法进行:加法add()、减法sub()、乘法mul()、除法div()

来源:https://juejin.cn/post/7084925907307069447

标签:Python,Pandas,Series,对象
0
投稿

猜你喜欢

  • mac下给python3安装requests库和scrapy库的实例

    2023-11-06 09:44:52
  • PHP PDOStatement::columnCount讲解

    2023-06-04 22:24:39
  • 使用Dreamweaver便捷技巧方法十六则

    2010-07-02 16:28:00
  • 自己用的ASP分页函数

    2009-10-18 11:30:00
  • [译]“我心中的ebay”

    2008-06-04 12:09:00
  • Python脚本提取fasta文件单序列信息实现

    2023-03-06 12:55:02
  • Python中True(真)和False(假)判断详解

    2021-12-16 11:22:36
  • 深入浅出SQL嵌套SELECT语句

    2009-02-06 14:25:00
  • Python 中 -m 的典型用法、原理解析与发展演变

    2023-07-09 17:11:40
  • Python 内置高阶函数详细

    2022-07-26 11:02:07
  • thinkphp3.x连接mysql数据库的方法(具体操作步骤)

    2023-11-22 20:04:41
  • 白鸦:贪守米缸者,饿死灶台

    2009-02-23 13:03:00
  • php实现xml与json之间的相互转换功能实例

    2023-11-22 05:38:00
  • 解决jupyter运行pyqt代码内核重启的问题

    2022-01-29 21:28:40
  • python+splinter实现12306网站刷票并自动购票流程

    2023-08-02 20:50:18
  • 用python编写第一个IDA插件的实例

    2022-01-09 13:05:14
  • python的numpy模块安装不成功简单解决方法总结

    2022-10-23 18:33:15
  • Python-docx 实现整体修改或者部分修改文字的大小和字体类型

    2022-07-19 10:07:25
  • Python教程之基本运算符的使用(上)

    2023-12-16 23:11:40
  • Python自动化测试PO模型封装过程详解

    2023-08-23 18:59:49
  • asp之家 网络编程 m.aspxhome.com