当前位置 博文首页 > Python中glob库实现文件名的匹配

    Python中glob库实现文件名的匹配

    作者:一天一篇Python库 时间:2021-08-08 18:22

    目录
    • 前言
    • 通配符
      • 星号(*)
      • 问号(?)
      • 区间匹配([0-9][a-z][A-Z])
    • 转义元字符

      前言

      既然在Pathlib库中提到了glob()函数,那么我们就专门用一篇内容讲解文件名的匹配。其实我们有专门的一个文件名匹配库就叫:glob。

      不过,glob库的API非常小,但是仅仅应用于文件名的匹配绰绰有余。只要是在实际的项目中需要过滤,或者匹配一组文件,都可以使用该库进行操作。

      通配符

      星号(*)

      话不多说,下面我们使用通配符来匹配文件名,示例如下:

      import glob
      
      for name in sorted(glob.glob('text/*')):
          print(name)
      

      运行之后,效果如下:

      效果

      这里不仅用*通配符获取了目录下的所有文件,而且还对其进行了排序。

      问号(?)

      问号(?)是用来匹配单字的,比如我们赛选上面1开头的图片文件。示例如下:

      import glob
      
      for name in glob.glob('text/1?.png'):
          print(name)
      

      运行之后,效果如下:

      问号

      区间匹配([0-9][a-z][A-Z])

      从上面两个匹配我们看出来,glob库的匹配规则与正则表达式有些相似。既然它能匹配模糊的,一个或多个字符,那么肯定也可以匹配区间字符。

      示例如下:

      import glob
      
      for name in glob.glob('text/15[a-z].*'):
          print(name)
      

      运行之后,效果如下:

      匹配区间

      转义元字符

      当然,上面的文件名都是常规的文件名,都是用字母与数字组成的。但是,有些人比较怪,可能在文件名中包含了特殊的字符,比如上面的匹配字符“?*[”等。那怎么办呢?用反斜杠“\”转义吗?

      其实,我们还有更简单的,直接使用escape()函数进行操作。示例如下:

      import glob
      
      escape_str='?*[]'
      for char in escape_str:
          pattern = 'text/*' + glob.escape(char) + '.png'
          for name in glob.glob(pattern):
              print(name)
      

      运行之后,效果如下:

      运行效果

      jsjbwy
      下一篇:没有了