python中glom模块怎样安装与使用?
Admin 2021-05-18 群英技术资讯 1025 次浏览
这篇文章主要给大家介绍的关于python glom模块的使用,小编觉得蛮有用的,因此分享给大家作参考,感兴趣的朋友可以参考学习,下面我们就一起来看看吧。
glom模块,是 Python 处理数据的一个小模块,它具有如下特点:
看起来比较抽象,对不对?下面我们用实例来给大家演示一下。
作为 Python 内置模块,相信你一定知道怎么安装:
pip3 install glom
几秒钟就搞定!
我们来看看最简单的用法:
d = {"a": {"b": {"c": 1}}}
print(glom(d, "a.b.c")) # 1
在这里,我们有一个嵌套三层的 json 结构,我们想获取最里层的 c 对应的值,正常的写法应该是:
print(d["a"]["b"]["c"])
如果到这里,我说 glom 比传统方式好一些,因为你不用一层层地写中括号和引号,你会不会嗤之以鼻?
好,我们再来看看下面的情况:
d = {"a": {"b": None}}
print(d["a"]["b"]["c"])
遍历到一个 None 对象,你会收到下面的错误:
Traceback (most recent call last): File "/Users/cxhuan/Documents/python_workspace/mypy/pmodules/pglom/glomstudy.py", line 10, in <module> print(d["a"]["b"]["c"]) TypeError: 'NoneType' object is not subscriptable
我们来看看 glom 的处理方式:
from glom import glom
d = {"a": {"b": None}}
print(glom(d, "a.b.c"))
同样地,glom 不能把错误的输出成对的,你会得到以下错误:
Traceback (most recent call last):
File "/Users/cxhuan/Documents/python_workspace/mypy/pmodules/pglom/glomstudy.py", line 11, in <module>
print(glom(d, "a.b.c"))
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/glom/core.py", line 2181, in glom
raise err
glom.core.PathAccessError: error raised while processing, details below.
Target-spec trace (most recent last):
- Target: {'a': {'b': None}}
- Spec: 'a.b.c'
glom.core.PathAccessError: could not access 'c', part 2 of Path('a', 'b', 'c'), got error: AttributeError("'NoneType' object has no attribute 'c'")
如果你仔细看报错内容,你就会发现这报错内容极其详细,一目了然,这对于找程序 bug 简直是神器!
刚才简单的例子,让大家对 glom 有了直观的认识,接下来我们看看 glom 的 glom 方法的定义:
glom(target, spec, **kwargs)
我们看看参数的含义:
下面我们来使用这个方法。
先看一个例子。我们有一个 dict ,想要获取出 所有 name 的值,我们可以通过 glom 来实现:
data = {"student": {"info": [{"name": "张三"}, {"name": "李四"}]}}
info = glom(data, ("student.info", ["name"]))
print(info) # ['张三', '李四']
如果用传统方式的话,我们可能会需要遍历才能获取到,但是使用 glom ,我们只需要一行代码就可以了,输出是一个数组。
如果你不想输出数组,而是想要一个 dict 的话,那也是很简单的:
info = glom(data, {"info": ("student.info", ["name"])})
print(info) # {'info': ['张三', '李四']
我们只需要将原来的数组赋值给一个字典来接收就好了。
假如我现在有两组数据,我要取出 name 的值:
data_1 = {"school": {"student": [{"name": "张三"}, {"name": "李四"}]}}
data_2 = {"school": {"teacher": [{"name": "王老师"}, {"name": "赵老师"}]}}
spec_1 = {"name": ("school.student", ["name"])}
spec_2 = {"name": ("school.teacher", ["name"])}
print(glom(data_1, spec_1)) # {'name': ['张三', '李四']}
print(glom(data_2, spec_2)) # {'name': ['王老师', '赵老师']}
我们通常是这么写,对吗?假如我们有好多组数据,每组都是类似的取法呢?这时候我们就会想办法避免一个个重复写 N 行参数了,我们可以使用 Coalesce 方法:
data_1 = {"school": {"student": [{"name": "张三"}, {"name": "李四"}]}}
data_2 = {"school": {"teacher": [{"name": "王老师"}, {"name": "赵老师"}]}}
spec = {"name": (Coalesce("school.student", "school.teacher"), ["name"])}
print(glom(data_1, spec)) # {'name': ['张三', '李四']}
print(glom(data_2, spec)) # {'name': ['王老师', '赵老师']}
我们可以用 Coalesce 把多个需求聚合起来,然后针对同一个 spec 来取值就行了。
下面再来一个大杀器――取值计算。glom 还可以对取值进行简单计算,我们来看例子:
data = {"school": {"student": [{"name": "张三", "age": 8}, {"name": "李四", "age": 10}]}}
spec = {"sum_age": ("school.student", ["age"], sum)}
print(glom(data, spec)) # {'sum_age': 18}
介绍了这么多,大家应该知道 glom 的厉害之处了吧,据说很多大佬都喜欢使用呢。其实它还有很多其他的实用功能有待大家去发掘,这里就不一一介绍了。
关于python glom模块的使用就介绍到这,希望大家阅读完这篇文章之后大有收获,更多python glom模块功能大家可以关注其他文章。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要为大家介绍了python 虚拟环境,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助<BR>
这篇文章主要为大家介绍了python人工智能tensorflow函数np.random模块使用方法,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
问题场景:问题描述原因分析及解决方案:问题场景:在SparkSQL中,因为需要用到自定义的UDAF函数,所以用pyspark自定义了一个,但是遇到了一个问题,就是自定义的UDAF函数一直报Attri
这篇文章主要介绍了python3 实现mysql数据库连接池的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
这篇文章主要为大家详细介绍了如何通过Python实现批量修改xml文件功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008