pivot函数是什么,具体用法是怎样的
Admin 2022-08-01 群英技术资讯 2842 次浏览
这篇文章给大家分享的是“pivot函数是什么,具体用法是怎样的”,对大家学习和理解有一定的参考价值和帮助,有这方面学习需要的朋友,接下来就跟随小编一起学习一下吧。pivot(index=None,columns=None,values=None) -> DataFrame
通过给定的索引(index)和列(column)的值重新生一个DataFrame对象。
根据列值对数据进行整形(生成一个“透视”表)。从指定的索引/列中使用唯一的值来形成结果数据帧的轴。此函数不支持数据聚合,多个值将导致列中的多索引。
index:指定一列做为生成DataFrame对象的索引,如果为空则默认为原来的索引。
columns:指定一列的值作为列名,必须传值。
values:指定一列作为生成DataFrame对象的值。可以为空。
df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'],
'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
'baz': [1, 2, 3, 4, 5, 6],
'zoo': ['x', 'y', 'z', 'q', 'w', 't']})

# 指定foo的值为新dataframe的index,bar的值为columns,dataframe中对应的值为baz df.pivot(index='foo', columns='bar', values='baz')

# 没有指定value,列名最外层保留原来的列,如下结果baz和zoo为原dataframe中的列名,新指定的列名bar在里层(暂时这么理解)。 df.pivot(index='foo', columns='bar')

# 可以通过索引的方式取指定的列数据 df.pivot(index='foo', columns='bar')['baz']

# 可以指定多个values df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])

# 指定多个columns df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])

# 指定多个index df.pivot(index=['foo','bar'], columns='baz', values='zoo')

# 指定多个index可以通过index名取当个index的数据 df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]

# 这两行代码运行将会报错。
# 报错提示:ValueError: Index contains duplicate entries, cannot reshape
# 意思是指定的索引one有两个列bar=A冲突了。
df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'],
"bar": ['A', 'A', 'B', 'C'],
"baz": [1, 2, 3, 4]})
df.pivot(index='foo', columns='bar', values='baz')

现在要上图中的不同code之间从2020-11-16到2020-11-18三天内num序列数的相关性。
首先,dataframe对象可以直接调用函数corr()计算不同列之间的相关性,所以现在需要将原始的dataframe对象转换成以code为列,date为索引,num为值的dataframe。
第一种比较笨的方法就是循环,此方法不但代码量较多而且在数据量很大时会比较耗时。不建议使用。
grouped = df.groupby(by=["code"])
df_num = pd.DataFrame()
for name,group in grouped:
d = pd.Series(data=group["num"].values,name=name)
df_num = pd.concat([df_num,d],axis=1)
df_close

第二种方法就是使用pivot函数,一行代码解决,运行快速。
df_num = df.pivot(index='date',columns='code',values='num')

想要的形式的dataframe生成了就可以直接调用corr()函数直接求出code之间的相关性了
# 计算列之间的相关性 df_num.corr()

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
内容介绍1.关于箱线图及plt.boxplot()方法2.绘制一幅简单的箱线图3.绘制一幅更精致的图像4.异常值的标准5.异常值的输出1.关于箱线图及plt.boxplot()方法
适合自动化运维编程语言特点是什么?要具备丰富的第三方库、学习成本低、跨平台、轻量级这几点
今天给大家分享的一个比较有趣的内容,就是在python中现实凯撒密码,凯撒密码算是比较简单的加密技术,下文有实例代码供大家参考,感兴趣的朋友跟随小编一起看看吧。
注:以下都是以公有为前提,私有方法只能在类内部调用,不需多讲。1、对象方法这种方法都有一个默认参数:self 这代表实例的这个对象def__init__(self):print("初始化对象")类是不能直接调用对象方法:classUser(object):name='zs'def__init__(self):
这篇文章主要介绍了如何用python开发Zeroc Ice应用,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008