Python pandas库中的isnull()详解
作者:flying bug 时间:2022-06-06 20:58:01
问题描述
python的pandas库中有一个十分便利的isnull()函数,它可以用来判断缺失值,我们通过几个例子学习它的使用方法。
首先我们创建一个dataframe,其中有一些数据为缺失值。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(10,99,size=(10,5)))
df.iloc[4:6,0] = np.nan
df.iloc[5:7,2] = np.nan
df.iloc[7,3] = np.nan
df.iloc[2:3,4] = np.nan
得到的结果如下所示
0 1 2 3 4
0 63.0 89 58.0 94.0 10.0
1 44.0 77 66.0 54.0 14.0
2 25.0 41 93.0 56.0 NaN
3 43.0 26 27.0 53.0 44.0
4 NaN 98 45.0 32.0 45.0
5 NaN 28 NaN 72.0 10.0
6 69.0 92 NaN 24.0 61.0
7 51.0 22 35.0 NaN 72.0
8 83.0 32 93.0 62.0 25.0
9 48.0 54 83.0 30.0 79.0
我们先来运行以下isnull()看会出现什么结果
df.isnull()
0 1 2 3 4
0 False False False False False
1 False False False False False
2 False False False False True
3 False False False False False
4 True False False False False
5 True False True False False
6 False False True False False
7 False False False True False
8 False False False False False
9 False False False False False
可见程序返回了布尔值,该处为缺失值,返回True,该处不为缺失值,则返回False
其它
直接使用isnull()并不能很直观的反应缺失值的信息。
我们再调用其他命令进行尝试。
df.isnull().any()
0 True
1 False
2 True
3 True
4 True
dtype: bool
可见df.isnull().any()会判断哪些列包含缺失值,该列存在缺失值则返回True,反之False。
df.isnull().sum()
0 2
1 0
2 2
3 1
4 1
dtype: int64
isnull().sum()就更加直观了,它直接告诉了我们每列缺失值的数量。
来源:https://blog.csdn.net/qq_40825479/article/details/83544430
标签:Python,pandas,isnull
0
投稿
猜你喜欢
python实现基于信息增益的决策树归纳
2022-05-20 14:22:47
python安装pywifi全过程
2023-05-25 22:59:29
解决给dom元素绑定click等事件无效问题的方法
2024-04-16 10:36:42
深入理解python中函数传递参数是值传递还是引用传递
2022-02-21 10:08:33
Mysql数据库之Binlog日志使用总结(必看篇)
2024-01-20 20:15:16
Golang 性能基准测试(benchmark)详解
2024-02-08 03:10:11
详解python 降级到3.6终极解决方案
2022-07-07 20:50:26
JavaScript 创建随机数和随机图片
2024-05-02 16:16:02
使用Python通过win32 COM实现Word文档的写入与保存方法
2021-03-16 04:09:27
PyTorch 如何自动计算梯度
2023-08-13 14:44:20
JavaScript 组件之旅(二):编码实现和算法
2009-10-09 14:24:00
解决vue动态路由异步加载import组件,加载不到module的问题
2024-05-29 22:45:37
js css 实现遮罩层覆盖其他页面元素附图
2024-06-08 21:51:06
golang通过node_exporter监控GPU及cpu频率、温度的代码
2024-02-04 14:53:22
设计中基于人类学的田野调查与比较研究法 ——浅谈用研与竞品分析方法之理论基础
2009-08-31 16:45:00
Vue插槽原理与用法详解
2024-05-09 10:43:09
tensorflow实现读取模型中保存的值 tf.train.NewCheckpointReader
2022-08-21 05:25:51
SQLServer Execpt和not in 性能区别
2012-01-29 17:53:24
[翻译]网页设计中的模式窗口
2009-05-29 18:00:00
Django创建项目+连通mysql的操作方法
2024-01-12 17:16:42