当前位置 博文首页 > python通配符之glob模块的使用详解

    python通配符之glob模块的使用详解

    作者:-牧野- 时间:2021-06-27 15:59

    通配符是一些特殊符号,主要有星号(*)和问号(?),用来模糊搜索文件,“*”可以匹配任意个数个符号, “?”可以匹配单个字符。

    当查找文件夹时,可以使用它来代替一个或多个真正字符;当不知道真正字符或者需要匹配符合一定条件的多个目标文件时,可以使用通配符代替一个或多个真正的字符。

    英文 “globbing”意为统配,python在模块glob中定义了glob()函数,实现了对目录内容进行匹配的功能,glob.glob()函数接受通配模式作为输入,并返回所有匹配的文件名和路径名列表,与os.listdir类似。

    glob模块中的常用函数:

    glob(pathname, recursive=False) 

    第一个参数pathname为需要匹配的字符串。(该参数应尽量加上r前缀,以免发生不必要的错误)

    第二个参数代表递归调用,与特殊通配符“**”一同使用,默认为False。

    该函数返回一个符合条件的路径的字符串列表,如果使用的是Windows系统,路径上的“\”符号会自动加上转义符号变为“\\”。

    iglob(pathname, recursive=False) 

    参数与glob()一致。

    返回一个迭代器,该迭代器不会同时保存所有匹配到的路径,而是逐个获取匹配的文件路径名,遍历该迭代器的结果与使用相同参数调用glob()的返回结果一致。

    glob模块支持的通配符:

    通配符 功能
    * 匹配0或多个字符
    ** 匹配所有文件、目录、子目录和子目录里的文件(3.5版本新增)
    ? 匹配1个字符,与正则表达式里的?不同
    [exp] 匹配指定范围内的字符,如:[1-9]匹配1至9范围内的字符
    [!exp] 匹配不在指定范围内的字符

    glob.glob函数使用示例

    import glob
     
    listglob = []
    listglob = glob.glob(r"/home/xxx/picture/*.png")
    listglob.sort()
    print listglob
     
    print '--------------------'
    listglob = glob.glob(r"/home/xxx/picture/0?.png")
    listglob.sort()
    print listglob
     
    print '--------------------'
    listglob = glob.glob(r"/home/xxx/picture/0[0,1,2].png")
    listglob.sort()
    print listglob
     
    print '--------------------'
    listglob = glob.glob(r"/home/xxx/picture/0[0-3].png")
    listglob.sort()
    print listglob
     
    print '--------------------'
    listglob = glob.iglob(r"/home/xxx/picture/0[a-z].png")
    print listglob
    for item in listglob:
        print item

    补充:Python glob() 函数 秒懂

    Python glob()

    glob模块是最简单的模块之一,内容非常少。用它可以查找符合特定规则的文件路径名。

    跟使用windows下的文件搜索差不多。查找文件只用到三个匹配符:'*', “?”, “[ ]”。”*”匹配任意0个或多个字符;”?”匹配任意单个字符;”[ ]”匹配指定范围内的字符,如:[0-9]匹配数字。

    不区分大小写

    '.'开头的不匹配

    print(glob.glob(r' . ./*') )

    上一级所有目录

    >>> print(glob.glob("../*"))
    ['..\\Python37-32', '..\\Python38-32']

    print(glob.glob(r' ./*') )

    本级所有目录

    >>> print(glob.glob("./*"))
    ['.\\DLLs', '.\\Doc', '.\\include', '.\\Lib', '.\\libs', '.\\LICENSE.txt', '.\\NEWS.txt', '.\\python.exe', '.\\python3.dll', '.\\python38.dll', '.\\pythonw.exe', '.\\Scripts', '.\\tcl', '.\\Tools', '.\\vcruntime140.dll']

    print(glob.glob(r' ./ * . *') )

    本级所有文件

    print(glob.glob("./*.*"))
    ['.\\LICENSE.txt', '.\\NEWS.txt', '.\\python.exe', '.\\python3.dll', '.\\python38.dll', '.\\pythonw.exe', '.\\vcruntime140.dll']
    

    print(glob.glob(r' ./ * . *') )

    本级所有dll

    >>> print(glob.glob("./*.dll"))
    ['.\\python3.dll', '.\\python38.dll', '.\\vcruntime140.dll']

    print(glob.glob(r' C:/ * ') )

    C盘所有目录

    >>> print(glob.glob("C:/*"))
    ['C:/$360Section', 'C:/$Recycle.Bin', 'C:/360SANDBOX', 'C:/Boot', 'C:/bootmgr'.......]
    

    print(glob.glob(“C:/[PB][RO]”) )

    C盘所有包含pr/po/br/bo的目录

    print(glob.glob("C:/*[PB][RO]*"))
    ['C:/360SANDBOX', 'C:/Boot', 'C:/bootmgr', 'C:/BOOTNXT', 'C:/BOOTSECT.BAK', 'C:/PO', 'C:/Program Files', 'C:/Program Files (x86)', 'C:/ProgramData']

    print(glob.glob(“C:/p?O”) )

    C盘所有包含P_o的目录

    >>> print(glob.glob("C:/*P?O*"))
    ['C:/Program Files', 'C:/Program Files (x86)', 'C:/ProgramData']

    print(glob.glob(“C://.txt”) )

    C盘两级目录所有的txt

    >>> print(glob.glob("C:/*/*.txt"))
    ['C:/xiaoyi\\检索式.txt']

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持站长博客。如有错误或未考虑完全的地方,望不吝赐教。

    js
    下一篇:没有了