Python操作Excel文件,修改Excel样式(openpyxl)

Python操作Excel文件,修改Excel样式(openpyxl)

在操作Excel表格时,我们有时需要对Excel表中的内容样式进行修改。当Excel文件过大的情况下修改样式单元格较多,修改麻烦,可采用代码脚本的方式来进行Excel样式的修改

安装依赖库openpyxl

shell
1
pip install openpyxl

openpyxl的操作

加载文件,获取sheet

加载文件load_workbook

在Excel中,一般把一个文件称为工作薄。在openpyxl中可以通过load_workbook()方法来加载一个文件,返回Workbook对象。Workbook对象会保存Excel表中的所有相关信息。

python
1
2
3
from openpyxl import load_workbook

load_workbook(file_path)

获取sheet

在一个Excel文件中会有多个sheet表格,所以当操作Excel文件时,需要对多个sheet分别处理。在对多个sheet表格进行处理时,可以通过先获取表格内部所有的sheetname,然后在通过sheetname获取对应的sheet

  • openpyxl中可以通过workbook.get_sheet_names()方法来获取所需所有sheetname列表
    • openpyxlworkbook.get_sheet_names()方法将在后续版本废除,可以通过workbook.sheetnames属性来获取所有的sheetname
  • 获取到对应的sheetname名称后,可以通过workbook.get_sheet_by_name(sheetname)的方法获取对应的sheet,然后对sheet中的单元格进行操作
    • openpyxlworkbook.get_sheet_by_name(sheetname)方法将在后续版本废除,可以通过workbook.[sheetname]属性来获取对应的sheet
python
1
2
3
4
5
sheetnames = workbook.get_sheet_names()

for sheetname in sheetnames:
	sheet = workbook.get_sheet_by_name(sheetname)
	...
  • openpyxl中可以通过workbook.sheetnames的方法获取所有的sheetname。推荐使用
  • openpyxl中可以通过workbook.[sheetname]的方法根据sheetname获取对应的sheet。推荐使用
python
1
2
3
4
5
sheetnames = workbook.sheetnames

for sheetname in sheetnames:
	sheet = workbook[sheetname]
	...

遍历单元格

Excel表格格式作为二维的结构化文件存储格式,对其数据遍历读取修改可以按照行的方式或列的方式进行遍历。

迭代遍历

openpyxl中可以通过sheet.rows按行获取数据或sheet.columns按列获取数据。获取到每一行或者每一列的数据后在对其迭代遍历即可获取到具体的单元格cell,可以通过cell.value获取单元格的具体值。 按行遍历:

python
1
2
3
4
for row in sheet.rows:
	for cell in row:
		value = cell.value
		...

按列遍历:

python
1
2
3
4
for col in sheet.columns:
	for cell in col:
		value = cell.value
		...

索引遍历

通过sheet.rowssheet.columns属性可以很好对按行或按列对表格进行迭代遍历,但是有时我们在遍历的过程中希望知道当前遍历对象的索引,迭代遍历不能很好的满足我们的需求。 在sheet.rowssheet.columns属性中返回的是一个迭代器,所以不能直接根据索引获取内容,所以需要先将其转换成列表然后获取索引来实现遍历 注意,索引遍历因为将sheet的属性转存了,所以在索引遍历中对内容的修改并不会影响到Workbook对象,所以索引遍历的优点是仅能获取到对应的索引,并不能对属性进行修改。 按行索引:

python
1
2
3
4
5
6
rows = list(sheet.rows)

for row_index in range(sheet.max_row):
	for col_index in range(len(rows[row_index])):
		value = rows[row_index][col_index].value
		...

按列索引:

python
1
2
3
4
5
6
columns = list(sheet.columns)

for col_index in range(sheet.max_column):
	for row_index in range(len(columns[col_index])):
		value = columns[col_index][row_index].value
		...

单元格行高和列宽的修改

Excel列号与字母的转换

在Excel中,行号以数字1为下标开始索引,列号以字母A为下标开始索引。在编程语言中一般以下标0为下标开始索引。所以在处理列的时候需要将数字下标转换为相应的字母下标来获取对应的列。openpyxl提供列专门的转换工具。

  • openpyxl.utils.get_column_letter(index: int):实现数字下标到列号字母的转换
  • openpyxl.utils.column_index_from_string(str_col: str):实现列号字母到数字下标到转换

Excel行高修改

在进行Excel行高的修改时,需要先根据对应的行号获取到对应的行,然后对行高修改。 在openpyxl中通过sheet.row_dimensions[row_number]获取到对应的行,修改sheet.row_dimensions[row_number].height属性来修改行高。

python
1
2
3
4
5
rows = list(sheet.rows)

for row_index in range(sheet.max_row):
	for col_index in range(len(rows[row_index])):
		sheet.row_dimensions[row_index + 1].height = 100

Excel列宽修改

在进行Excel列宽的修改时,需要先根据对应的列号索引获取对应列的字母下标,然后根据字母下标获取对应列,对列宽修改。 在openpyxl中通过sheet.column_dimensions[col_number]获取到对应的列,修改sheet.column_dimensions[col_number].width属性来修改列宽。

python
1
2
3
4
5
columns = list(sheet.columns)

for col_index in range(sheet.max_column):
	for row_index in range(len(columns[col_index])):
		sheet.column_dimensions[get_column_letter(col_index + 1)].width = 100

Excel表格文字对齐属性设置

在对Excel的行高和列宽属性进行修改后,由于文字的对齐设置往往会导致部分单元格中字体的显示效果不好。这时我们可以设置文字的对齐属性来修改文字在单元格中的排布。 在Excel中,对齐属性是针对单元格而言的,所以我们需要获取到对应的单元格而不是行列。对齐属性可以分为水平对齐属性和垂直对齐属性,需要对这两个维度的属性分别进行设置。

  • 获取单元格:在openpyxl中获取单元格是根据sheet按照先列后行的维度进行获取
python
1
cell = sheet[f"{get_column_letter(col_number)}{row_number}"]
  • 对齐属性:在openpyxl中对齐属性通过对象Alignment进行设置修改
    • 水平方向:horizontal属性
      • left:左对齐
      • center:水平居中
      • right:右对齐
      • justify:两端对齐
    • 垂直方向:vertical属性
      • top:顶端对齐
      • center:垂直居中
      • bottom:底端对齐
python
1
2
3
from openpyxl.styles import Alignment

alignment = Alignment(horizontal="justify", vertical="center")
  • 修改对齐属性:通过修改单元格的alignment属性来修改对齐属性
python
1
2
3
4
from openpyxl.styles import Alignment

alignment = Alignment(horizontal="justify", vertical="center")
sheet[f"{get_column_letter(col_number)}{row_number}"].alignment = alignment

修改单元格框线

在Excel中,针对表格的框线同样也是针对单元格而言的。openpyxl中修改框线通过Border对象来设置。由于边框线分别有上下左右四个方向的框线,所以需要分别对四个方向的框线进行设置。在Boder对象中通过Side属性来设置某一方向上的线条。

  • Border对象:单元格框线
    • 方向:
      • top:上边框线条设置
      • bottom:下边框线条设置
      • left:左边框线条设置
      • right:右边框线条设置
    • 线条属性Side对象:
      • style:设置线条的属性
        • 可选属性:dashDotdashDotDotdasheddotteddoublehairmediummediumDashDotmediumDashDotDotmediumDashedslantDashDotthickthin
        • 线条的可选属性较多,一般选择常用的thin线条即可
      • color:设置线条颜色,类型HEX格式的颜色属性,默认黑色
  • 修改单元格边框:通过修改单元格的border属性来修改边框颜色
python
1
2
3
4
5
6
7
8
9
from openpyxl.styles.borders import Border, Side

thin_border = Border(
	top=Side(style='thin'),
	bottom=Side(style='thin'),
	left=Side(style='thin'),
	right=Side(style='thin')
)
sheet[f"{get_column_letter(col_number)}{row_number}"].border = thin_border

保存Excel文件

在上文中提到,调用openpyxl.load_workbook()方法会返回一个Workbook对象,对象中包含了Excel中的相关信息属性,我们在后文中对Excel的修改,本质上都是对Workbook对象的属性进行修改,所以在保存是是需要调用workbook.save(file_path)即可将修改后的内容写入Excel文件中。

openpyxl实战,Excel样式优化

python
  1
  2
  3
  4
  5
  6
  7
  8
  9
 10
 11
 12
 13
 14
 15
 16
 17
 18
 19
 20
 21
 22
 23
 24
 25
 26
 27
 28
 29
 30
 31
 32
 33
 34
 35
 36
 37
 38
 39
 40
 41
 42
 43
 44
 45
 46
 47
 48
 49
 50
 51
 52
 53
 54
 55
 56
 57
 58
 59
 60
 61
 62
 63
 64
 65
 66
 67
 68
 69
 70
 71
 72
 73
 74
 75
 76
 77
 78
 79
 80
 81
 82
 83
 84
 85
 86
 87
 88
 89
 90
 91
 92
 93
 94
 95
 96
 97
 98
 99
100
101
102
103
104
105
106
107
108
109
110
111
112
from openpyxl import load_workbook
from openpyxl.utils import get_column_letter, column_index_from_string
from openpyxl.styles import Alignment
from openpyxl.styles.borders import Border, Side


class ExcelStyle:
    # 边框样式
    thin_border = Border(
        top=Side(style='thin'),
        bottom=Side(style='thin'),
        left=Side(style='thin'),
        right=Side(style='thin'),
    )

    # 对齐属性
    alignment = Alignment(horizontal="justify", vertical="center")

    def _get_max_len_cell_index(self, data):
        """
        获取单元格的行数或列号
        data: 行数据或者列数据
        """
        max_len = 0
        max_len_index = 0
        for cell_index in range(len(data)):
            if (data[cell_index].value is not None) and (len(data[cell_index].value) >= max_len):
                max_len = len(data[cell_index].value)
                max_len_index = cell_index
        return max_len_index

    def _get_cell_row_and_col(self, cell, line_length: int = 50):
        """
        根据单元格内容判断其具体需要多少行多少列
        """
        data = []

        # 匹配内容中的"\n"进行多行分割
        lines_data = cell.value.splitlines()

        # 根据line_length一行长度来进行按行分割
        for line in lines_data:
            data.extend([line[i:i+line_length]
                        for i in range(0, len(line), line_length)])
        return len(data), max(len(i) for i in data)

    def _set_col_width(self, sheet):
        """
        设置列宽
        """
        columns = list(sheet.columns)

        # 列遍历获取每列最长cell,修改单元格宽度
        for col_index in range(len(columns)):
            try:
                max_col_len_index = self._get_max_len_cell_index(columns[col_index])
                _, col_num = self._get_cell_row_and_col(columns[col_index][max_col_len_index])

                # 修改列宽
                if col_num < 50:
                    sheet.column_dimensions[get_column_letter(col_index + 1)].width = col_num * 2.5 + 2
                else:
                    sheet.column_dimensions[get_column_letter(col_index + 1)].width = 130
            except (ValueError, IndexError, AttributeError) as error:
                # 捕获在多个sheet的情况下,其余sheet内无数据导致的调用max()方法异常
                ...

    def _set_row_height(self, sheet, alignment: Alignment = alignment):
        """
        设置行高
        """
        rows = list(sheet.rows)

        # 行遍历获取没行最长cell,修改行高和超出长度单元格排布属性
        for row_index in range(len(rows)):
            try:
                max_row_len_index = self._get_max_len_cell_index(rows[row_index])
                row_num, _ = self._get_cell_row_and_col(rows[row_index][max_row_len_index])

                sheet.row_dimensions[row_index + 1].height = row_num * 20
                if row_num > 1:
                    for col_index in range(sheet.max_column):
                        # 修复文字内容过长情况下修改cell高度文字的排版情况
                        sheet[f"{get_column_letter(col_index + 1)}{row_index + 1}"].alignment = alignment
            except (ValueError, IndexError, AttributeError) as error:
                ...

    @classmethod
    def pref_excel_style(cls, file_path, border: Border = thin_border, alignment: Alignment = alignment):
        """
        优化Excel样式
            根据单元格内文字长度优化行高和列宽
            优化单元格边框样式
        """
        # 获取工作博
        workbook = load_workbook(file_path)

        # 根据sheet名称来获取当前工作表,逐sheet修改
        for sheetname in workbook.sheetnames:
            sheet = workbook[sheetname]

            cls()._set_row_height(sheet, alignment)
            cls()._set_col_width(sheet)

            # 所有数据添加单元格
            for row in sheet.rows:
                for cell in row:
                    cell.border = border

        workbook.save(file_path)

ExcelStyle.pref_excel_style(file_path)

以上的行高和列宽与单元格文字长度是通过设置Excel最适合的行高和最适合的列宽厚根据比例关系经过多次试验后得到了修改样式后显示效果较优的关系,可根据自身需求更改。

陕ICP备2023020057号
Built with Hugo
主题 StackJimmy 设计