当前位置 博文首页 > python使用openpyxl读取合并单元格的值

    python使用openpyxl读取合并单元格的值

    作者:SunboyL 时间:2021-08-03 17:48

    目录
    • 问题:
    • 解决思路:

    问题:

    假设在test.xlsx的“Sheet1”工作表中,A1:D3区域的值如下:

    要求给定指定的行、列以及对应的工作表作为参数,能够正确解析合并单元格,获取指定单元格的值。

    如果直接根据行列获取对应单元格的值,则合并单元格非左上角的其他单元格都会获取到None值,如下:

    if __name__ == "__main__":
        wb = xl.load_workbook("test.xlsx")
        sheet_ = wb["Sheet1"]
        print(sheet_["A1"].value)  # 1
        print(sheet_["A2"].value)  # None
        print(sheet_["D1"].value)  # 8
        print(sheet_["D2"].value)  # None
        print(sheet_["D3"].value)  # None

    解决思路:

    获取到对应单元格后,判断该单元格是否为合并单元格,如果是,则找到该合并区域并获取左上角的值返回。

    通过 sheet.merged_cell_ranges属性,可以获取当前工作表所有的合并区域列表:

    测试代码:

    if __name__ == "__main__":
        wb = xl.load_workbook("test.xlsx")
        sheet_ = wb["Sheet1"]
        merged_ranges = sheet_.merged_cell_ranges  # 获取当前工作表的所有合并区域列表
        for merged_range in merged_ranges:
            print(type(merged_range))  # 打印区域对象类型
            print(merged_range)  # 打印区域

    结果如下:

    我们巡着openpyxl.worksheet.merge.MergedCellRange查找其源码,发现定义了in操作,可以直接通过in确认某个坐标是否位于区域内

    这时候我们已经基本具备获取合并单元格的条件了。

    完整代码如下:

    import openpyxl as xl
    from openpyxl.worksheet.worksheet import Worksheet
    from openpyxl.cell import MergedCell
    
    
    def parser_merged_cell(sheet: Worksheet, row, col):
        """
        检查是否为合并单元格并获取对应行列单元格的值。
        如果是合并单元格,则取合并区域左上角单元格的值作为当前单元格的值,否则直接返回该单元格的值
        :param sheet: 当前工作表对象
        :param row: 需要获取的单元格所在行
        :param col: 需要获取的单元格所在列
        :return: 
        """
        cell = sheet.cell(row=row, column=col)
        if isinstance(cell, MergedCell):  # 判断该单元格是否为合并单元格
            for merged_range in sheet.merged_cell_ranges:  # 循环查找该单元格所属的合并区域
                if cell.coordinate in merged_range:
                    # 获取合并区域左上角的单元格作为该单元格的值返回
                    cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col)
                    break
        return cell
    
    
    if __name__ == "__main__":
        wb = xl.load_workbook("test.xlsx")
        sheet_ = wb["Sheet1"]
    
        for row_index in range(1, 4):
            for col_index in range(1, 5):
                cell_ = parser_merged_cell(sheet_, row_index, col_index)
                print("第%s行第%s列:%s" % (row_index, col_index, cell_.value))

    结果如下:

    第1行第1列:1
    第1行第2列:2
    第1行第3列:3
    第1行第4列:8
    第2行第1列:1
    第2行第2列:4
    第2行第3列:5
    第2行第4列:8
    第3行第1列:6
    第3行第2列:7
    第3行第3列:7
    第3行第4列:8

    jsjbwy
    下一篇:没有了