pandas缺失值处理的实现及要点是什么
Admin 2022-09-30 群英技术资讯 529 次浏览
有的时候我们可能需要获取一些缺失值的信息,因此我们需要获取这些缺失值在DataFrame中的位置。
假如我们的DataFrame的索引为数值顺序索引,要返回缺失值的位置
import numpy as np import pandas as pd
我们首先构建一个有缺失值的DataFrame
df = pd.DataFrame({'A':[1, 2, 3, np.nan], 'B':[2, np.nan, 4, 6], 'C':[3, 2, np.nan, 3], 'D':[np.nan, 1, np.nan, 2]}) display(df)
首先我们可以查看每列中是否有缺失值
df.isnull().any()
我们发现四个columns均有缺失值,比如我们想知道每列的缺失值的具体位置,以A为例
df.isnull().any()
可以看到返回了A的缺失值位置的索引,这样在定位的时候使用loc函数就可以直接定位到缺失值方便查看了.
如果我们想生成一个字典来存储全部的缺失值位置信息,可以用:
a = df.isnull().any() a = a.loc[a==True] columns = a.index.tolist() mydict = {}#创建一个字典来存储所有的位置 temp = [] for column in columns: temp = df.loc[df[column].isnull()].index.tolist() mydict[column] = temp mydict
#!/usr/bin/evn python # -*-coding:utf8 -*- import pandas as pd data = [[None, None, 90, 80],[57, 43, 89, 65],[78, 50, 67, 78],[None, 78, 90, 73],[67, 45, 78, 76],[77, 88, None, 45],[52, 110, 120, 99],[131, 13, 32, 12]] index = ['语文', '英语', '数学', '政治', '物理', '化学', '生物', '地理'] column = ['张三', '李四', '王五', '周六'] data = pd.DataFrame(data,index=index,columns=column) print(data) print("=========================================================\n") for columname in data.columns: if data[columname].count() != len(data): loc = data[columname][data[columname].isnull().values==True].index.tolist() print('列名:"{}", 第{}行位置有缺失值'.format(columname,loc))
执行结果
F:\Opensources\python\python.exe D:/pythonStudy/EXCELDB/LagelangriCZ_test.py
张三 李四 王五 周六
语文 NaN NaN 90.0 80
英语 57.0 43.0 89.0 65
数学 78.0 50.0 67.0 78
政治 NaN 78.0 90.0 73
物理 67.0 45.0 78.0 76
化学 77.0 88.0 NaN 45
生物 52.0 110.0 120.0 99
地理 131.0 13.0 32.0 12
=========================================================
列名:"张三", 第['语文', '政治']行位置有缺失值
列名:"李四", 第['语文']行位置有缺失值
列名:"王五", 第['化学']行位置有缺失值
Process finished with exit code 0
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了Python实现Telnet自动连接检测密码的示例,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
本篇文章给大家带来了关于Python的相关知识,详细介绍了Python实现提取四种不同文本特征的方法,有字典文本特征提取、英文文本特征提取、中文文本特征提取和TF-IDF 文本特征提取,感兴趣的可以了解一下。
本章节将一些Python3基础语法整理成手册,方便各位在日常使用和学习是查阅,包含了编码、标识符、保留字、注释、缩进、字符串等常用内容。
Python语言处理字符串、数组类的问题时有一定概率需要使用切片方法,本文主要介绍了Python 切片索引越界的问题,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
TFRecord格式的文件存储形式会很合理的帮我们存储数据,本文主要介绍了Tensorflow中TFRecord生成与读取的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008