Python代码怎样实现指定文件查找的功能
Admin 2022-09-17 群英技术资讯 479 次浏览
glob 包是一个快速查找文件夹中内容的包,可以通过模糊查找的形式找到我们想要的内容。
导入包与模块
from glob import glob
使用方法
glob(任意目录)
返回内容:
指定路径下的内容列表,不存在的路径返回空列表。
代码示例如下:
# coding:utf-8 import os from glob import glob target = os.getcwd() result = glob(target) print(result) # 打印输出当前路径的文件夹 result = glob(target + '/*') print(result) # 打印输出当前路径的文件夹下的所有文件 result = glob(target + '/*.py') print(result) # 打印输出当前路径的文件夹下的所有以 "py" 结尾的文件 result = glob(target + '/*.zip') print(result) # 打印输出当前路径的文件夹下的所有以 "zip" 结尾的文件 result = glob(target + '/filetest*') print(result) # # 打印输出当前路径的文件夹下的所有以 "filetest" 开头的文件
运行结果如下:
已知条件:
想查找的文件名已经知道,但是目录在哪里并不知道。
实现方法:
利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找,直到找到为止。
代码示例如下:
# coding:utf-8 import glob """ 获取当前路径下所有内容 判断每个内容的类型(文件夹还是文件) 若是文件夹则继续递归查找 """ path = glob.os.path.join(glob.os.getcwd(), '*') # 获取当前文件夹下的所有内容 # glob 模块其实已经包含了 "os" 模块 final_result = [] # 定义一个空列表,用以存储 search() 函数查到的内容 def search(path, target): # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件 result = glob.glob(path) for data in result: # for 循环判断递归查到的内容是文件夹还是文件 if glob.os.path.isdir(data): # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找 _path = glob.os.path.join(data, '*') search(_path, target) else: # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表 if target in data: final_result.append(data) return final_result if __name__ == '__main__': result = search(path, target='filetest.py') print(result)
运行结果如下:
接下来我们看一下查找指定内容的文件:
已知条件:
文件中包含有某些关键字,但是不知道文件名和文件所在路径
实现方法:
利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找。如果是文件夹则进入继续查找,是文件则读取,判断是否包含该内容,返回该内容的文件名以及所在路径。
其实,基于文件内容查找文件实现的方式大体与上文的查找指定文件大体相似,只不过加入了读取文件的判断罢了。
代码示例如下:
# coding:utf-8 import glob """ 获取当前路径下所有内容 判断每个内容的类型(文件夹还是文件) 若是文件夹则继续递归查找 """ path = glob.os.path.join(glob.os.getcwd(), '*test04') # 因为下文捕获不可读文件格式太多,所以这里直接指定了 "test04" 路径 final_result = [] # 定义一个空列表,用以存储 search() 函数查到的内容 def search(path, target): # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件 result = glob.glob(path) for data in result: # for 循环判断递归查到的内容是文件夹还是文件 if glob.os.path.isdir(data): # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找 _path = glob.os.path.join(data, '*') search(_path, target) else: # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表 f = open(data, 'r') # 利用 open() 函数读取文件,并通过 try...except... 捕获不可读的文件格式(.zip 格式) try: content = f.read() if target in content: final_result.append(data) except: print('这是不可读文件格式的文件的所在路径:{} '.format(data)) continue finally: f.close() return final_result if __name__ == '__main__': result = search(path, target='测试文件') print(result)
运行结果如下:
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要为大家介绍了Python内建属性getattribute拦截器使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
这篇文章主要为大家介绍了python人工智能tensorflow常用激活函数Activation Functions的汇总介绍,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
写文章的时候有时需要matlab导出清晰的图片,如果直接用figure里面的保存的话不够清晰,下面这篇文章主要给大家介绍了关于如何从Matlab中导出清晰的结果图片的相关资料,需要的朋友可以参考下
这篇文章主要介绍了python实现三次密码验证的示例,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
Supervisor 是一款 Python 开发的进程管理系统,允许用户监视和控制 Linux 上的进程,能将一个普通命令行进程变为后台守护进程,异常退出时能自动重启,这篇文章主要介绍了Python进程管理神器Supervisor,需要的朋友可以参考下
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008