关于Pandas count()与values_count()的用法及区别

作者:Elvirangel 时间:2021-09-25 08:28:20 

Pandas count()与values_count()用法

count()

关于Pandas count()与values_count()的用法及区别

values_count()在指定的统计的列名上

结果多了该列:

关于Pandas count()与values_count()的用法及区别

对比:

关于Pandas count()与values_count()的用法及区别

对比:

关于Pandas count()与values_count()的用法及区别

Pandas:count()与value_counts()对比

1. Series.value_counts(self, normalize=False, sort=True, ascending=False, bins=None, dropna=True)

返回一个包含所有值及其数量的 Series。 且为降序输出,即数量最多的第一行输出。

参数含义如下:

Parameters:

normalize : boolean, default False

If True then the object returned will contain the relative frequencies of the unique values.

sort : boolean, default True

Sort by frequencies.

ascending : boolean, default False

Sort in ascending order.

bins : integer, optional

Rather than count values, group them into half-open bins, a convenience for pd.cut, only works with numeric data.

dropna : boolean, default True

Don’t include counts of NaN.

Returns:

Series

举例如下:

import pandas as pd
index = pd.Index([3, 1, 2, 3, 4, np.nan])
index.value_counts()
 
"""
输出为:
3.0    2
4.0    1
2.0    1
1.0    1
dtype: int64
"""

如果 normalize 为 True的话,统计的结果会相加 = 1:

import pandas as pd
s = pd.Series([3, 1, 2, 3, 4, np.nan])
s.value_counts(normalize=True)
 
"""
输出为:
3.0    0.4
4.0    0.2
2.0    0.2
1.0    0.2
dtype: float64
"""

2.  Series.count(self, level=None)

返回非空值的数量。若是在 CSV 文件中可用来统计行数,如:

import pandas as pd
file = pd.read_csv('test.csv')
print(file['A'].count())
# 此时输出的即是 A 列的行数

参数含义如下: 

Parameters:

level : int or level name, default None

If the axis is a MultiIndex (hierarchical), count along a particular level, collapsing into a smaller Series.

Returns:

int or Series (if level specified)

Number of non-null values in the Series.

举例如下:

import pands as pd
s = pd.Series([0.0, 1.0, np.nan])
s.count()
# 此时输出为 2

这就是两者的区别和各自的用途。

来源:https://blog.csdn.net/Elvirangel/article/details/104556394

标签:Pandas,count,values,count
0
投稿

猜你喜欢

  • Python中docx2txt库的使用说明

    2022-03-23 18:58:46
  • Oracle相关组件版本信息的介绍

    2023-07-14 09:19:53
  • MySQL的表级锁,行级锁,排它锁和共享锁

    2024-01-28 15:44:22
  • CentOS6.5设置Django开发环境

    2022-09-29 22:55:30
  • 解析优化MySQL插入方法的五个妙招

    2024-01-19 13:13:49
  • CentOS7yum安装PHP7.2的操作方法

    2024-05-22 10:08:38
  • Python基于随机采样一至性实现拟合椭圆(优化版)

    2021-10-19 15:08:36
  • 一文带你掌握Python中文词频统计

    2022-11-17 21:02:00
  • Python实现简单的列表冒泡排序和反转列表操作示例

    2022-10-18 08:46:04
  • python中安装模块包版本冲突问题的解决

    2021-07-23 11:04:29
  • Vuex实现简单购物车

    2024-05-08 10:43:45
  • Python迭代用法实例教程

    2021-07-18 13:00:45
  • Python中的defaultdict模块和namedtuple模块的简单入门指南

    2022-01-21 07:10:20
  • win8下python3.4安装和环境配置图文教程

    2022-10-29 03:23:29
  • 快速实现基于Python的微信聊天机器人示例代码

    2022-05-30 19:22:50
  • Javascript: 为<input>设置readOnly属性问题,希望大家以后要小心

    2009-07-23 20:24:00
  • python自制包并用pip免提交到pypi仅安装到本机【推荐】

    2023-12-14 19:33:23
  • 浅谈对python中if、elif、else的误解

    2021-04-04 00:57:57
  • Python3.6通过自带的urllib通过get或post方法请求url的实例

    2023-01-21 09:32:41
  • python获取时间及时间格式转换问题实例代码详解

    2021-12-20 12:46:20
  • asp之家 网络编程 m.aspxhome.com