dataframe数据选择怎样实现?一文带你快速看懂
Admin 2021-05-20 群英技术资讯 1772 次浏览
这篇文章主要给大家介绍dataframe数据选择的内容,有时候我们需要对数据进行筛选,选择我们想要的数据,下面给给大家分享使用dataframe数据选择的方法,小编觉得是比较实用的,感兴趣的朋友就往下看吧。
import pandas as pd import numpy as np a=np.array([['北京','北方','一线','非沿海'],['杭州','南方','二线','非沿海'],['深圳','南方','一线','沿海'],
['烟台','北方','三线','沿海']]) df=pd.DataFrame(a,index=['一','二','三','四'],columns=['城市','地理','级别','是否沿海'])
城市 地理 级别 是否沿海
一 北京 北方 一线 非沿海
二 杭州 南方 二线 非沿海
三 深圳 南方 一线 沿海
四 烟台 北方 三线 沿海
loc标签是轴标签,也就是我们的索引名,使用也非常简单
df.loc['二']
城市 杭州
地理 南方
级别 二线
是否沿海 非沿海
Name: 二, dtype: object
iloc为整数标签,类似我们使用的元组列表的索引。比如我们想选择第二行的数据,第二行的索引则为1.
df.iloc[1]
城市 杭州
地理 南方
级别 二线
是否沿海 非沿海
Name: 二, dtype: object
如果我们知道列索引,那么选择某一列则变得十分简单
df['级别']
一 一线
二 二线
三 一线
四 三线
Name: 级别, dtype: object
正如我们上述使用iloc的方法,我们只需传入行或者列的索引即可。其实iloc的中括号里可以输入两个参数。前面为行,后面为列中间用逗号隔开。(如果省略了逗号,则默认取选择行)
比如现在我们想选择第二列,我们只需在逗号钱输入: 代表所有的行,后面则输入1代表第二列
df.iloc[:, 1]
一 北方
二 南方
三 南方
四 北方
Name: 地理, dtype: object
和iloc的使用相似,只不过在数据筛选中我们不再使用行整数索引,而是具体的索引值。
df.loc[:, '是否沿海']
一 非沿海
二 非沿海
三 沿海
四 沿海
Name: 是否沿海, dtype: object
其实loc与iloc是dataframe中选择数据最高效的方式,他的功能也十分强大。我们可以随意组合。
比如我们现在选择第二行的中间两列
df.iloc[1,1:3]
地理 南方
级别 二线
Name: 二, dtype: object
当然我们也可以不使用整数索引
df.loc['二':,'地理':'级别']
地理 级别
二 南方 二线
三 南方 一线
四 北方 三线
比如我们想选择第二到三行的第二列和第三列
df.iloc[2:4:, 2:4]
级别 是否沿海
三 一线 沿海
四 三线 沿海
同样十分简单,通过loc使用效果相同,这里不过多描述
选择某几列
df.iloc[:,2:4]
级别 是否沿海
一 一线 非沿海
二 二线 非沿海
三 一线 沿海
四 三线 沿海
选择某几行
城市 地理 级别 是否沿海
二 杭州 南方 二线 非沿海
三 深圳 南方 一线 沿海
如果把dataframe看做一个表格,这里可以看成获得表格里某个单元格的值
iat即为整数标签
df.iat[2,2]
'一线'
at即为具体的索引值去获取
df.at['三','级别']
'一线'
关于dataframe 数据选择的介绍就到这,上述代码仅供参考学习,有这方面学习需要的朋友,可以看看,希望本文对大家有帮助。
文本转载自脚本之家
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
cookie:在网站中,http请求是无状态的。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪个用户
递归的概念很简单,如果函数包含了对其自身的调用,该函数就是递归的。递归(Recursion),在数学与计算机科学中,是指在函数的定义中使用
这篇文章主要为大家介绍了python数字图像处理使用skimage读取显示与保存图片示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
最近开发中用到了eval()与exec()这两个函数,不知道在哪种场景下用哪个函数,所以就翻了下Python的文档。这里就来简单说一下这两个函数的区
由于矢量图层文件较多,手动发布费时费力,python支持的关于geoserver包又由于年久失修,无法在较新的geoserver版本中正常使用。本文为大家准备了Python自动化发布矢量文件的代码,需要的可以参考一下
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008