Python数据升序降序的排序怎么样实现
Admin 2022-08-30 群英技术资讯 1258 次浏览
很多朋友都对“Python数据升序降序的排序怎么样实现”的内容比较感兴趣,对此小编整理了相关的知识分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获,那么感兴趣的朋友就继续往下看吧!DataFrame.sort_values(by,axis=0,ascending=True,inplace=False,kind="quicksort",na_position="last",ignore_index=False) """ by:要排序的名称列表 axis:轴,0表示行,1表示列 ascending:升序或者降序排列,默认是True,升序 inplace:是否直接在数据上修改,True为直接修改df,False为副本 kind:指定排序算法, na_position:空值(NaN)的位置,值为first空值在数据开头,值为last空值在数据最后。 ignore_index:布尔值,是否忽略索引,值为True标记索引(从0开始顺序的整数值),False则忽略索引 """
import pandas as pd
exelFile="C:\\Users\\Administrator\\Desktop\\python数据分析Code\\Code\\03\\46\\mrbook.xlsx"
df=pd.DataFrame(pd.read_excel(exelFile))
pd.set_option('display.max_rows',1000)#设置展示最高行数
pd.set_option('display.max_columns',1000)#设置展示最高列数
pd.set_option('display.unicode.east_asian_width',True)
pd.set_option("display.unicode.ambiguous_as_wide",True)
#按“销量”列降序排序
df1=df.sort_values(by="销量",ascending=False)
print(df1)
结果如图所示:

#先按照图书名称降序排列,再按照销量降序排列 df2=df.sort_values(by=["图书名称","销量"])

将类别分组并统计总销量降序排列。
df3=df.groupby(["类别"])["销量"].sum().reset_index() df4=df3.sort_values(by="销量",ascending=False) print(df4)
结构如下:

DataFrame.rank(axis-0,method="average",numeric_only=None,na_option="keep",ascending=True,,pct=False) """ axis:轴,0表示行,1表示列 method:表示在相同值的情况下所使用的排序方法,参数如下:average:默认值,平均值排名;min:最小值排名;max:最大值排名;first:按第一次出现的顺序排列;dense:密集排序,类似于最小值排序,,但排名每次只增加1,相同排名的数据只只占据一个名词。 numeric_only:对于DataFrame,如果设置值为True,并只对数字列进行排序。 ascending:升序或者降序排列,默认值为True pct:布尔值,是否以百分比形式返回排名,默认值为False """
实例:
对销量相同的产品,按照顺序排名的平均值进行平均排名
#先排序 df=df.sort_values(by="销量",ascending=False) #按照顺序排名的平均值进行平均排名 df["顺序排名"]=df["销量"].rank(ascending=False)
这里两个数销量相同,分别为3和4名,取平均值为3.5

对销量相同的产品,按照在原表中出现的顺序进行排名
#先排序 df=df.sort_values(by="销量",ascending=False) df["顺序排名"]=df["销量"].rank(method="first",ascending=False)
结果如下:很正常的结果

对销量相同的产品,按照顺序排名并取最小值最为排名
#先排序 df=df.sort_values(by="销量",ascending=False) df["顺序排名"]=df["销量"].rank(method="min",ascending=False)
排名如下:相同数量的都按照最小排名填写

对销量相同的产品,按照顺序排名并取最大值最为排名
#先排序 df=df.sort_values(by="销量",ascending=False) df["顺序排名"]=df["销量"].rank(method="max",ascending=False)
排名如下:相同数量的都按照最大排名填写

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
tfrecord是tensorflow中常用的数据打包格式,这篇文章给大家介绍的就是关于tfrecord文件的生成和读取,本文有具体以及步骤,具有的一定的参考价值,需要的朋友可以参考学习。
时间处理是我们日常开发中最最常见的需求,例如:获取当前datetime、获取当天date、获取明天 前N天、获取当天开始和结束时间(00:00:00 23:
缓存是一种优化技术,可以在应用程序中使用它来将最近或经常使用的数据保存在内存中,通过这种方式来访问数据的速度比直接读取磁盘文件的高很多
分词工具在Python中,会经常使用到,而比较常的分词工具有jieba 分词、pkuseg 分词、FoolNLTK 分词和THULAC,这四种,那么究竟哪个更好用呢?
这篇文章主要为大家介绍在通过Python绘制图画时如何调用本地的字体,从而解决中文乱码的问题。感兴趣的小伙伴快来跟随小编学习学习吧
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008