MongoDB游标超时的情况如何解决?
Admin 2021-05-13 群英技术资讯 1443 次浏览
本文主要给大家分享关于MongoDB游标超时问题的解决办法,小编认为是比较实用的,有这方面学习需要的朋友可以看看,希望大家阅读完这篇文章之后大有收获。
当我们使用Python从MongoDB里面读取数据时,可能会这样写代码:
import pymongo handler = pymongo.MongoClient().db.col for row in handler.find(): parse_data(row)
短短4行代码,读取MongoDB里面的每一行数据,然后传入parse_data做处理。处理完成以后再读取下一行。逻辑清晰而简单,能有什么问题?只要parse_data(row)不报错,这一段代码就完美无缺。但事实并非这样。
你的代码可能会在for row in handler.find()这一行报错。它的原因,说来话长。要解释这个问题,我们首先就需要知道,handler.find()返回的并不是数据库里面的数据,而是一个游标(cursor)对象。如下图所示:

只有当你使用for循环开始迭代它的时候,游标才会真正去数据库里面读取数据。但是,如果每一次循环都连接数据库,那么网络连接会浪费大量时间。
所以pymongo会一次性获取100行,for row in handler.find()循环第一次的时候,它会连上MongoDB,读取一百条数据,缓存到内存中。于是第2-100次循环,数据都是直接从内存里面获取,不会再连接数据库。
当循环进行到底101次的时候,再一次连接数据库,再读取第101-200行内容……,这个逻辑非常有效地降低了网络I/O耗时。但是,MongoDB默认游标的超时时间是10分钟。10分钟之内,必需再次连接MongoDB读取内容刷新游标时间,否则,就会导致游标超时报错:
pymongo.errors.CursorNotFound: cursor id 211526444773 not found
如下图所示:

所以,回到最开始的代码中来,如果parse_data每次执行的时间超过6秒钟,那么它执行100次的时间就会超过10分钟。此时,当程序想读取第101行数据的时候,程序就会报错。
为了解决这个问题,我们有4种办法:
all_data = [row for row in handler.find()] for row in all_data: parse(row)
这种方案的弊端也很明显,如果数据量非常大,你不一定能全部放到内存里面。即使能够全部放到内存中,但是列表推导式遍历了所有数据,紧接着for循环又遍历一次,浪费时间。
3.让游标每次返回的数据小于100条,这样消费完这一批数据的时间就会小于10分钟:
# 每次连接数据库,只返回50行数据 for row in handler.find().batch_size(50): parse_data(row)
但这种方案会增加数据库的连接次数,从而增加I/O耗时。
4.让游标永不超时。通过设定参数no_cursor_timeout=True,让游标永不超时:
cursor = handler.find(no_cursor_timeout=True) for row in cursor: parse_data(row) cursor.close() # 一定要手动关闭游标
然而这个操作非常危险,因为如果你的Python程序因为某种原因意外停止了,这个游标就再也无法关闭了!除非重启MongoDB,否则这些游标会一直留在MongoDB上,占用资源。
当然可能有人会说,使用try...except把读取数据的地方包住,只要抛出了异常,在处理异常的时候关闭游标即可:
cursor = handler.find(no_cursor_timeout=True) try: for row in cursor: parse_data(row) except Exception: parse_exception() finally: cursor.close() # 一定要手动关闭游标
其中finally里面的代码,无论有没有异常,都会执行。但这样写会让代码非常难看。为了解决这个问题,我们可以使用游标的上下文管理器:
with handler.find(no_cursor_timeout=True) as cursor: for row in cursor: parse_data(row)
只要程序退出了with的缩进,游标自动就会关闭。如果程序中途报错,游标也会关闭。它的原理可以用下面两段代码来解释:
class Test:
def __init__(self):
self.x = 1
def echo(self):
print(self.x)
def __enter__(self):
print('进入上下文')
return self
def __exit__(self, *args):
print('退出上下文')
with Test() as t:
t.echo()
print('退出缩进')
运行效果如下图所示:

接下来在with的缩进里面人为制造异常:
class Test:
def __init__(self):
self.x = 1
def echo(self):
print(self.x)
def __enter__(self):
print('进入上下文')
return self
def __exit__(self, *args):
print('退出上下文')
with Test() as t:
t.echo()
1 + 'a' # 这里一定会报错
print('退出缩进')
运行效果如下图所示:

无论在with的缩进里面发生了什么,Test这个类中的__exit__里面的代码始终都会运行。我们来看看pymongo的游标对象里面,__exit__是怎么写的,如下图所示:

可以看到,这里正是关闭游标的操作。因此,如果我们使用上下文管理器,就可以放心大胆地使用no_cursor_timeout=True参数了。
总结
以上就是关于MongoDB游标超时如何解决的介绍,有需要的朋友可以参考一下,希望文本对大家有帮助,想要了解更多MongoDB游标超时的内容大家可以关注其他相关文章。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
MongoDB 删除集合 本章节我们为大家介绍如何使用 MongoDB 来删除集合。 MongoDB 中使用 drop() 方法来删除集合。 语法格式: db.collection.drop() 参数说明: 无 返回值 如果成功删除选定集合,则 drop() 方法返回 true,否则返回 false。 实例 在数据库 mydb 中,我们可以先通过 show collections 命令查看已存在的集合: >use my..
MongoDB 全文检索 全文检索对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。 这个过程类似于通过字典中的检索字表查字的过程。 MongoDB 从 2.4 版本开始支持全文检索,目前支持15种语言的全文索引。 danish dutch english finnish french german hungari..
使用用户名和密码连接到MongoDB数据库服务器,必须使用 'username:password@hostname/dbname' 格式,'username'为用户名,'password' 为密码。
这篇文章主要介绍了MongoDB的下载、安装与部署方法,需要的朋友可以参考下
MongoDB增删改查的方法及操作是什么?mongodb增删改查的相关知识你了解多少,如果你正在学习mongodb数据库,那这篇文章你一定要参考阅读。接下来就让小编带你们来一探究竟吧!
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008