pandas的merge函数有何用途?怎样使用?
Admin 2022-03-21 群英技术资讯 1677 次浏览
Pandas是Python语言的一个扩展程序库,是用于数据分析的。在Pandas中,merge是用来合并数据的函数,是按照数据中心某一字段来连接数据的,一些朋友可以对于merge()不是很了解,下面小编就给大家介绍一下merge函数用途以及用法。
pandas中的merge()函数类似于SQL中join的用法,可以将不同数据集依照某些字段(属性)进行合并操作,得到一个新的数据集。
用法:
DataFrame1.merge(DataFrame2, how=‘inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', ‘_y'))
参数说明
| 参数 | 说明 |
|---|---|
| how | 默认为inner,可设为inner/outer/left/right |
| on | 根据某个字段进行连接,必须存在于两个DateFrame中(若未同时存在,则需要分别使用left_on和right_on来设置) |
| left_on | 左连接,以DataFrame1中用作连接键的列 |
| right_on | 右连接,以DataFrame2中用作连接键的列 |
| left_index | 将DataFrame1行索引用作连接键 |
| right_index | 将DataFrame2行索引用作连接键 |
| sort | 根据连接键对合并后的数据进行排列,默认为True |
| suffixes | 对两个数据集中出现的重复列,新数据集中加上后缀_x,_y进行区别 |
#利用字典dict创建数据框
dataDf1=pd.DataFrame({'lkey':['foo','bar','baz','foo'],
'value':[1,2,3,4]})
dataDf2=pd.DataFrame({'rkey':['foo','bar','qux','bar'],
'value':[5,6,7,8]})
print(dataDf1)
print(dataDf2)
>>>
lkey value
0 foo 1
1 bar 2
2 baz 3
3 foo 4
rkey value
0 foo 5
1 bar 6
2 qux 7
3 bar 8
#inner链接 dataLfDf=dataDf1.merge(dataDf2, left_on='lkey',right_on='rkey') >>> lkey value_x rkey value_y 0 foo 1 foo 5 1 foo 4 foo 5 2 bar 2 bar 6 3 bar 2 bar 8
#Right链接 dataDf1.merge(dataDf2, left_on='lkey', right_on='rkey',how='right') >>> lkey value_x rkey value_y 0 foo 1.0 foo 5 1 foo 4.0 foo 5 2 bar 2.0 bar 6 3 bar 2.0 bar 8 4 NaN NaN qux 7
#Outer链接 dataDf1.merge(dataDf2, left_on='lkey', right_on='rkey', how='outer') >>> lkey value_x rkey value_y 0 foo 1.0 foo 5.0 1 foo 4.0 foo 5.0 2 bar 2.0 bar 6.0 3 bar 2.0 bar 8.0 4 baz 3.0 NaN NaN 5 NaN NaN qux 7.0
以上就是关于pandas的merge函数的介绍,希望对大家了解merge函数有帮助,更多pandas的merge函数内容,可以关注其他相关文章。
文本转载自脚本之家
相关阅读:
pandas提升计算效率有哪些方法?
pandas怎样实现一列和多列的数值排序?
pandas中重置索引怎样做?方法是什么?
python中的ord函数有什么用?用法是什么?
python中绘图使用的subplots函数用法是什么?
python中plot函数用法是什么?要注意哪些?
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了Python错误+异常+模块总结,在编程时遇见错误信息在所难免,Python中会也有很多种错误信息,常见的两种就是语法错误和逻辑错误,下文我们就来总结一下那些常见的异常,需要的小伙伴可以参考一下
django是用Python开发的一个免费开源的web框架,能帮助我们快速搭建高性能的网站。这篇文章就给大家分享关于django的基础知识,主要介绍django上传文件的方式以及注意事项,下面我们一起来看看吧。
目录1、操作步骤2、代码实现路径问题 函数说明数据处理1、操作步骤(1)打开文件读取整个文件函数open返回一个表示文件的对象,对象存储在infile中。关键字with在不需要访问文件
之前介绍过python中max函数的实现过程,max函数可以在python中求取值,那python中求列表值也是可以的。用max(list)就可以获取列表元素中的值。本文主要介绍列表为数字和字符串的时候max函数求取值的过程,并补充列表元素为元祖和字典时max函数如何用。
本文主要介绍了pytest中配置文件pytest.ini使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
成为群英会员,开启智能安全云计算之旅
立即注册关注或联系群英网络
7x24小时售前:400-678-4567
7x24小时售后:0668-2555666
24小时QQ客服
群英微信公众号
CNNIC域名投诉举报处理平台
服务电话:010-58813000
服务邮箱:service@cnnic.cn
投诉与建议:0668-2555555
Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 ICP核准(ICP备案)粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008