Python代码怎样实现指定文件查找的功能
Admin 2022-09-17 群英技术资讯 524 次浏览
glob 包是一个快速查找文件夹中内容的包,可以通过模糊查找的形式找到我们想要的内容。
导入包与模块
from glob import glob
使用方法
glob(任意目录)
返回内容:
指定路径下的内容列表,不存在的路径返回空列表。
代码示例如下:
# coding:utf-8 import os from glob import glob target = os.getcwd() result = glob(target) print(result) # 打印输出当前路径的文件夹 result = glob(target + '/*') print(result) # 打印输出当前路径的文件夹下的所有文件 result = glob(target + '/*.py') print(result) # 打印输出当前路径的文件夹下的所有以 "py" 结尾的文件 result = glob(target + '/*.zip') print(result) # 打印输出当前路径的文件夹下的所有以 "zip" 结尾的文件 result = glob(target + '/filetest*') print(result) # # 打印输出当前路径的文件夹下的所有以 "filetest" 开头的文件
运行结果如下:
已知条件:
想查找的文件名已经知道,但是目录在哪里并不知道。
实现方法:
利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找,直到找到为止。
代码示例如下:
# coding:utf-8 import glob """ 获取当前路径下所有内容 判断每个内容的类型(文件夹还是文件) 若是文件夹则继续递归查找 """ path = glob.os.path.join(glob.os.getcwd(), '*') # 获取当前文件夹下的所有内容 # glob 模块其实已经包含了 "os" 模块 final_result = [] # 定义一个空列表,用以存储 search() 函数查到的内容 def search(path, target): # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件 result = glob.glob(path) for data in result: # for 循环判断递归查到的内容是文件夹还是文件 if glob.os.path.isdir(data): # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找 _path = glob.os.path.join(data, '*') search(_path, target) else: # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表 if target in data: final_result.append(data) return final_result if __name__ == '__main__': result = search(path, target='filetest.py') print(result)
运行结果如下:
接下来我们看一下查找指定内容的文件:
已知条件:
文件中包含有某些关键字,但是不知道文件名和文件所在路径
实现方法:
利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找。如果是文件夹则进入继续查找,是文件则读取,判断是否包含该内容,返回该内容的文件名以及所在路径。
其实,基于文件内容查找文件实现的方式大体与上文的查找指定文件大体相似,只不过加入了读取文件的判断罢了。
代码示例如下:
# coding:utf-8 import glob """ 获取当前路径下所有内容 判断每个内容的类型(文件夹还是文件) 若是文件夹则继续递归查找 """ path = glob.os.path.join(glob.os.getcwd(), '*test04') # 因为下文捕获不可读文件格式太多,所以这里直接指定了 "test04" 路径 final_result = [] # 定义一个空列表,用以存储 search() 函数查到的内容 def search(path, target): # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件 result = glob.glob(path) for data in result: # for 循环判断递归查到的内容是文件夹还是文件 if glob.os.path.isdir(data): # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找 _path = glob.os.path.join(data, '*') search(_path, target) else: # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表 f = open(data, 'r') # 利用 open() 函数读取文件,并通过 try...except... 捕获不可读的文件格式(.zip 格式) try: content = f.read() if target in content: final_result.append(data) except: print('这是不可读文件格式的文件的所在路径:{} '.format(data)) continue finally: f.close() return final_result if __name__ == '__main__': result = search(path, target='测试文件') print(result)
运行结果如下:
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能,这篇文章主要介绍了python开发的自动化运维工具ansible详解,需要的朋友可以参考下
这篇文章主要介绍了pygame实现井字棋之第二步逻辑实现,文中有非常详细的代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下
这篇文章介绍了Django框架中表单的用法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
这篇文章介绍了Python中的Selenium异常处理,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
这篇文章给大家分享的是如何解决python中文乱码的问题,下文有多种python中文乱码的情况以及解决办法的介绍,小编觉得挺实用的,因此分享给大家做个参考,接下来一起跟随小编看看吧。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008