如何使用Python检测和处理缺失值,具体操作是怎样
Admin 2022-06-21 群英技术资讯 1387 次浏览
今天这篇我们来学习和了解“如何使用Python检测和处理缺失值,具体操作是怎样”,下文的讲解详细,步骤过程清晰,对大家进一步学习和理解“如何使用Python检测和处理缺失值,具体操作是怎样”有一定的帮助。有这方面学习需要的朋友就继续往下看吧!我们先创建一个带有缺失值的数据框(DataFrame)。
import pandas as pd
df = pd.DataFrame(
{'A': [None, 2, None, 4],
'B': [10, None, None, 40],
'C': [100, 200, None, 400],
'D': [None, 2000, 3000, None]})
df

数值类缺失值在 Pandas 中被显示为 NaN (Not A Number)。下面看看如何判断哪些列或者哪些行有缺失值。
1.info()

info() 返回的结果中,我们只需要观察每一列对应的 Non-Null Count 的数量是否等于 RangeIndex(索引范围) 即可。
2.isnull()
isnull() 返回一个与原 DataFrame 大小(列数,行数)相同的数据框,行列对应的数据代表着该位置是否为缺失值。
df.isnull()

使用 sum() 来检测每列中的缺失值的数量。
df.isnull().sum()

通过 .T 将 DataFrame 转置,获取检测每行中缺失值的数量。
df.isnull().T.sum()

如果出现缺失值的行/列重要性不大的话,可以直接使用 dropna() 删除带有缺失值的行/列。
df.dropna(axis=0,
how='any',
thresh=None,
subset=None,
inplace=False)
参数含义
指定 axis = 1,如果列中有缺失值,则删除该列。
df.dropna(axis=1, how='any')

由于每列都有缺失值,所以只剩索引。
指定 axis = 0(默认),如果行中有缺失值,则删除该行。
df.dropna(axis=0, how='any')

以 ABC 列为参照,删除这三列都是缺失值的行。
df.dropna(axis=0, subset=['A', 'B', 'C'], how='all')

保留至少有3个非NaN值的行。
df.dropna(axis=0, thresh=3)

另一种常见的缺失值处理方式就是使用 fillna() 填补缺失值。
df.fillna(value=None,
method=None,
axis=0,
inplace=False,
limit=None)
1. 直接指定填充值
df.fillna(666)

2.用缺失值前/后的值填充
按前一个值填充
当method 值为 ffill 或 pad时,按前一个值进行填充。
当 axis = 0,用缺失值同一列的上一个值填充,如果缺失值在第一行则不填充。
当 axis = 1,用缺失值同一行的上一个值填充,如果缺失值在第一列则不填充。
df.fillna(axis=0, method='pad')

按后一个值填充
当method 值为 backfill 或 bfill时,按后一个值进行填充。
当 axis = 0,用缺失值同一列的下一个值填充,如果缺失值在最后一行则不填充。
当 axis = 1,用缺失值同一行的下一个值填充,如果缺失值在最后一列则不填充。
df.fillna(axis=0, method='bfill')

指定相应的方法来填充
df.fillna(df.mean())

limit限制填充次数
在ABCD列上,每列只填充第一个空值。
df.fillna(value=666, axis=1, limit=1)

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了pandas 如何将字符串映射为数字,具有很好的参考价值,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
变量是拥有匹配对象的名字(标识符),命名空间是一个包含了变量名称们(键)和它们各自相应的对象们(值)的字典,下面这篇文章主要给大家介绍了关于Python基础教程之名称空间以及作用域的相关资料,需要的朋友可以参考下
这篇文章主要介绍了python 解决微分方程的操作(数值解法),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
python的is和in有啥不同?很多新手学习python,对于is和in的区别不是很清楚,对此,下面小编就给大家简单的介绍一下python的is和in的区别以及用法,感兴趣的朋友就继续往下看吧。
本文给大家分享一个Python基础知识,也就是socket通信原理,一些朋友可能对于socket通信原理不会很理解,因此本文有很详细的介绍,需要的朋友不妨了解看看,那么接下来就跟随小编一起学习一下吧。
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008