相同的Dataframe中如何找出不相同的元素
Admin 2022-08-17 群英技术资讯 1367 次浏览
本篇内容介绍了“相同的Dataframe中如何找出不相同的元素”的有关知识,在实际项目的操作过程或是学习过程中,不少人都会遇到这样的问题,接下来就让小编带大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!本篇博客解决在两个几乎完全相同的DataFrame当中如何找出不相同的元素,并使用datacompy直观的显示出来。
x表:

让x1和x2都是x的副本,则此时x1和x2的值是相同:
x1=x.copy() x2=x.copy()
将其中x2的一个数据赋值为2000
x2.loc['罗梓烜']['20220125']=2000
x1[x1==x2].head(25) # 如何对不相等的数据进行纠正
此时可以看到下图这个数据是NaN值,说明对于这个数据来说x1和x2是不相同的

x1[x1==x2].isnull().sum()
下图说明在20220125这一列当中存在一个NaN值,也就是我们刚刚赋值的地方:

但是现在还是不能确定出有异常值(也就是不相等的值的那行数据),因此我们考虑使用datacompy
安装:
pip install datacompy
import datacompy,pandas as pd,sys compy=datacompy.Compare(x1,x2,on_index=True) compy print(compy.matches()) print(compy.report())
此时就可以很清晰的看到两个DataFrame当中不相同的值了:

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
pathlib 是Python内置库,Python 文档给它的定义是 Object-oriented filesystem paths(面向对象的文件系统路径)。pathlib 提供表示文件系统路径的类,其语义适用于不同的操作系统。
这篇文章主要介绍了在Django中创建自己的自定义用户模型,创建自己的自定义用户模型至关重要。将来,如果要对模型进行一些更改,则可以轻松进行这些更改。不然我们可能必须对模型进行一些更改,而且代码的某些部分也将被更改
本文主要介绍了Python数据分析之Matplotlib 3D图详情,Matplotlib提供了mpl_toolkits.mplot3d工具包来进行3D图表的绘制,下文总结了更多相关资料,需要的小伙伴可以参考一下
这篇文章主要介绍了Python如何存储和读取ASCII码形式的byte数据,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
这篇文章主要为大家详细介绍了Python中的time模块以及如何利用time模块实现时间戳与结构化时间,文中的示例代码讲解详细,需要的可以参考一下
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008