pandas如何统计某一列或某一行的缺失值数目

作者:WGS. 时间:2023-02-10 21:36:00 

统计某一列或某一行的缺失值数目

1.使用isnull()

import pandas as pd

# 首先导入数据
df = pd.read_csv('123.csv' , encoding='gbk')

# 计算data每一行有多少个缺失值的值,即按行统计缺失值
rows_null = df.isnull().sum(axis=1) 

# 下面则是按列统计缺失值
col_null = df.isnull().sum(axis=0)

#统计整个df的缺失值
all_null = df.isnull().sum().sum()

# 统计某一列的缺失值
idx_null = df['列名'].isnull().sum(axis=0)

2.使用count

import pandas as pd

# 首先导入数据
df = pd.read_csv('123.csv' , encoding='gbk')

# 计算data每一行有多少个非空的值,即按行统计非空值
rows_not_null = df.count(axis=1) 

# 下面则是按列统计非空值
cols_not_null = df.count(axis=0)
cols_null = df.shape[1] - cols_not_null

# 统计某一列的非空值
col_not_null = df['列名'].count(axis=0)

利用pandas处理缺失值

处理缺失值

def missing_values(dataframe):
    missing_ratio = (dataframe.isnull().sum() / len(dataframe))*100
    missing_ratio = missing_ratio.drop(missing_ratio[missing_ratio == 0].index).sort_values(ascending=False)
    missing_count = dataframe.isnull().sum()
    missing_count = missing_count.drop(missing_count[missing_count == 0].index).sort_values(ascending=False)
    info = pd.DataFrame({'Missing Ratio': missing_ratio, 'Missing Count': missing_count})
    return info

来源:https://wangguisen.blog.csdn.net/article/details/106802178

标签:pandas,统计,某一列,某一行,缺失值
0
投稿

猜你喜欢

  • django celery redis使用具体实践

    2022-12-03 02:45:39
  • python连接mysql调用存储过程示例

    2024-01-18 01:32:19
  • 基于php(Thinkphp)+jquery 实现ajax多选反选不选删除数据功能

    2024-06-07 15:29:45
  • Python封装解构以及丢弃变量

    2022-08-10 07:55:58
  • 浅析Python中的序列化存储的方法

    2022-09-28 19:21:26
  • Python数据分析之 Pandas Dataframe应用自定义

    2023-03-02 09:18:12
  • Spring Data JPA的Audit功能审计数据库的变更

    2024-01-21 18:30:29
  • DW CS4初步试用感受

    2008-05-30 12:17:00
  • 如何用Pytorch搭建一个房价预测模型

    2022-12-16 17:09:21
  • django序列化serializers过程解析

    2022-09-26 22:22:36
  • Pycharm+Python+PyQt5使用详解

    2021-08-20 06:39:25
  • python调用新浪微博API项目实践

    2021-08-17 21:56:53
  • Scrapy 之中间件(Middleware)的具体使用

    2023-01-10 19:50:22
  • Microsoft .Net Remoting系列教程之一:.Net Remoting基础篇

    2024-05-09 09:03:35
  • pycharm debug 断点调试心得分享

    2022-11-12 05:10:06
  • keras CNN卷积核可视化,热度图教程

    2021-03-15 05:06:15
  • perl命令行参数内建数组@ARGV浅析

    2022-11-04 06:58:47
  • 新版php study根目录下文件夹无法显示的图文解决方法

    2023-11-15 00:44:29
  • python 数据提取及拆分的实现代码

    2023-11-13 09:13:12
  • 用 JavaScript 解数学题

    2010-07-09 13:38:00
  • asp之家 网络编程 m.aspxhome.com