python 模块 openpyxl - 操作 excel 文件
最编程
2024-06-24 10:09:21
...
关于python处理excel文件的各种信息:http://www.python-excel.org/
本文使用openpyxl(3.0.7)说明文档:https://openpyxl.readthedocs.io/en/stable/
1、openpyxl模块介绍及安装
1、openpyxl模块介绍
- openpyxl是一个Python库,用于读取/写入Excel 2010(xlsx/xlsm/xltx/xltm)文件。
- 简单易用,功能广泛,单元格格式/图片/表格/公式/筛选/批注/文件保护等等功能应有尽有,图表功能是其一大亮点,缺点是对 VBA 支持的不够好。
- 与其他库和应用程序相比,内存使用量相当高,大约是原始文件大小的50倍,例如,50MB Excel文件需要2.5GB。
2、openpyxl模块安装
pip install openpyxl
- 为了能够将图像(jpeg、png、bmp等)包含到openpyxl文件中,您还需要可以安装的“pillow”库:
pip install pillow
2、操作workbook(工作簿)
1、创建工作簿
- 无需在文件系统上创建文件即可开始使用openpyxl。只需导入Workbook类并开始工作。
- 一个工作簿总是由至少一个工作表组成,即创建工作簿时会创建一个工作表sheet。
- 可以通过使用该Workbook.active属性来获取它。(获得工作簿打开时默认的工作表,默认设置为0,即默认获得第一个工作表。)
示例:
from openpyxl import Workbook #导入Workbook模块 wb = Workbook() #创建工作簿,同时会创建一个工作表“Sheet”。此时只是在内存中,没有写进磁盘中,<openpyxl.workbook.workbook.Workbook object at 0x000001E923621C40> # print(tuple(wb)) #结果是:(<Worksheet "Sheet">,) ws = wb.active #获得第一个工作表对象,<Worksheet "Sheet">
2、保存工作簿
- Workbook.save()方法:将在没有警告的情况下覆盖现有文件。在保存到磁盘之前,所有的操作都是在内存中进行的。
- 文件扩展名不会强制为xlsx或xlsm,但如果不使用官方扩展名,则使用其他应用程序打开它可能会遇到一些问题。
示例:
from openpyxl import Workbook wb = Workbook() ws = wb.active wb.save(r'C:\Users\root\Desktop\empty_book.xlsx') #写在磁盘上,并命名为“empty_book.xlsx”
3、读写磁盘上的工作簿
-
load_workbook(filename, read_only=False, keep_vba=KEEP_VBA, data_only=False, keep_links=True)
- 打开给定的文件名并返回工作簿
- filename:打开文件或文件类对象
- read_only(bool):为阅读而优化,内容无法编辑
- keep_vba(bool):保存vba内容(这并不意味着你可以使用它)
- data_only(bool):单元格中是公式默认单元格的值是公式(默认),若data_only=True单元格的值是Excel存储的值(公式得到的值)
- keep_links(bool):是否应该保留到外部工作簿的链接。默认为True
- 打开给定的文件名并返回工作簿
示例:
from openpyxl import load_workbook wb = load_workbook(r'C:\Users\root\Desktop\empty_book.xlsx') #加载磁盘上的工作簿
4、只读模式、只写模式
- 有时需要打开或写入非常大的XLSX文件,而openpyxl中的常见例程将无法处理该负载。幸运的是,有两种模式使能够以(接近)恒定内存消耗读取和写入无限量的数据。
1、只读模式
- 如果您主要对转储工作簿的内容感兴趣,那么您可以使用openpyxl的只读模式并打开工作簿的多个实例并利用多个CPU。
- openpyxl的只读模式几乎立即打开工作簿,使其适用于多个进程,这也显着减少了内存使用。
- 与普通工作簿不同,只读工作簿将使用延迟加载。
- 必须使用该close()方法显式关闭工作簿。
- 返回的单元格不是常规的openpyxl.cell.cell.Cell而是openpyxl.cell._read_only.ReadOnlyCell。
示例:
from openpyxl import load_workbook wb = load_workbook('empty_book.xlsx', read_only=True) #只读模式 ws = wb.active for row in ws.rows: for cell in row: print(cell.value) wb.close() #必须使用close()关闭文件
2、只写模式
- 只写模式使用更快的openpyxl.worksheet._write_only.WriteOnlyWorksheet替代常规的openpyxl.worksheet.worksheet.Worksheet。当您希望转储大量数据时,请确保安装了lxml。
- 与普通工作簿不同,新创建的只写工作簿不包含任何工作表;必须使用create_sheet()方法专门创建工作表。
- 在只写工作簿中,只能使用append()添加行。不能使用cell()或iter_rows()在任意位置写入(或读取)单元格。
- 它能够导出无限数量的数据(甚至超过Excel实际能够处理的数量),同时保持内存使用在10Mb以下。
- 只写工作簿只能保存一次。在此之后,每次尝试保存工作簿或将append()添加到现有工作表都会引发openpyxl.utils.exceptions. workbookalreadsaved异常。
- 在实际单元格数据之前出现在文件中的所有内容都必须在添加单元格之前创建,因为它必须在添加之前写入文件。例如,在添加单元格之前,应该设置freeze_panes。
示例:
from openpyxl import Workbook wb = Workbook(write_only=True) #只写模式 ws = wb.create_sheet() for irow in range(100): ws.append(['%d' % i for i in range(200)]) wb.save('empty_book.xlsx')
- 如果你想让单元格带有样式或注释,那么使用openpyxl.cell.WriteOnlyCell()
- 这将创建一个只写的工作簿,只有一个工作表,并添加一行3个单元格:一个文本单元格,带有自定义字体和注释,一个浮点数,和一个空单元格
示例:
from openpyxl import Workbook from openpyxl.cell import WriteOnlyCell from openpyxl.comments import Comment from openpyxl.styles import Font wb = Workbook(write_only=True) ws = wb.create_sheet() cell = WriteOnlyCell(ws, value="hello world") cell.font = Font(name='Courier', size=36) cell.comment = Comment(text="A comment", author="Author's Name") ws.append([cell, 3.14, None]) wb.save('empty_book.xlsx')
3、操作sheet(工作表)
1、创建工作表sheet
- create_sheet(self, title=None, index=None)。title(str):可选参数,工作表的名字;index(int):可选参数,工作表插入的位置(从0开始)。
- 工作表在创建时会自动命名为“Sheet”。工作表名重复时按顺序编号(Sheet、Sheet1、Sheet2、...)。
示例:
from openpyxl import Workbook wb = Workbook() #创建工作簿,同时会创建一个工作表“Sheet” ws1 = wb.create_sheet() #创建一个工作表,默认工作表名“Sheet1”,默认放在当前现有的工作表的最后面 ws2 = wb.create_sheet('Mysheet1', 1) #创建一个工作表“Mysheet1”,指定放在第一个工作表的后面 ws3 = wb.create_sheet('Mysheet2', 1) #创建一个工作表“Mysheet2”,指定放在第一个工作表的后面 wb.save('empty_book.xlsx')
2、工作表的其他常用操作
-
获取工作表对象的方式
- 创建工作表时,将工作表对象赋值给一个变量。示例:ws2 = wb.create_sheet('Mysheet1')
- 将工作簿当作字典,工作表名是字典的键。示例:ws2 = wb['Mysheet1']
- 复制工作表的注意事项
- 仅复制单元格(包括值、样式、超链接和注释)和某些工作表属性(包括尺寸、格式和属性)。不会复制所有其他工作簿/工作表属性 - 例如图像、图表。
- 也不能在工作簿之间复制工作表。如果工作簿以只读或只写模式打开,则无法复制工作表。
示例:
from openpyxl import Workbook wb = Workbook() ws = wb.active ws2 = wb.create_sheet('Mysheet1') wb.copy_worksheet(ws) #复制工作表 wb.move_sheet('Sheet',1) #移动工作表 wb.remove(ws2) #删除工作表 # del wb['Mysheet1'] #删除工作表 print(wb.index(ws)) #返回工作表的索引 print(wb.sheetnames) #返回所有工作表名称列表,可获得工作表名称wb[wb.sheetnames[1]].title print(wb.worksheets) #返回所有工作表对象列表,可获得工作表名称wb.worksheets[1].title ws.title = "New Title" #修改工作表的名称 ws.sheet_properties.tabColor = 'FF0000' #修改工作表的名称选项卡的背景颜色 wb.save('empty_book.xlsx') <<< 0 ['Sheet', 'Sheet Copy'] [<Worksheet "Sheet">, <Worksheet "Sheet Copy">]
3、循环浏览工作表
from openpyxl import Workbook wb = Workbook() ws2 = wb.create_sheet('Mysheet') for sheet in wb: #循环浏览工作表 print(sheet.title) <<< Sheet Mysheet
4、操作cell(单元格)
- 在内存中创建工作表时,它不包含任何单元格。它们是在第一次访问时创建的。
1、访问一个单元格(获取单元格对象)
- ws['A4']单元格可以直接作为工作表的键进行访问,这将返回A4处的单元格,如果尚不存在,则创建一个。
- Worksheet.cell(row, column, value=None)方法
示例:
from openpyxl import Workbook wb = Workbook() ws = wb.active ws['A4'] = 4 #单元格“A4”赋值为4 ws.cell(row=4, column=2, value=8) #单元格“B4”赋值为8 print(ws['A4'].value) #取出单元格“A4”的值 print(ws.cell(row=4, column=2).value) #取出单元格“B4”的值 wb.save('empty_book.xlsx')
2、访问多个单元格(获取单元格对象)
1、使用切片访问单元格范围
- 可以访问到范围内的所有单元格,即在内存中将创建该范围的所有单元格。
示例:
from openpyxl import Workbook wb = Workbook() ws = wb.active cell_range = ws['A1':'C3'] #在内存中创建出来的这些单元格。返回一个元组,每个元素都是行中的每个单元格对象组成的元组 for row in cell_range: print(row) #行中每个单元格对象组成的元组 for cell in row: print(cell) #单元格对象 <<< (<Cell 'Sheet'.A1>, <Cell 'Sheet'.B1>, <Cell 'Sheet'.C1>) <Cell 'Sheet'.A1> ...... (<Cell 'Sheet'.A2>, <Cell 'Sheet'.B2>, <Cell 'Sheet'.C2>) ...... (<Cell 'Sheet'.A3>, <Cell 'Sheet'.B3>, <Cell 'Sheet'.C3>) ...... <Cell 'Sheet'.C3>
2、切片的方式获得行或列的范围
- 注意,若是才创建的工作表,他们执行后仅仅在内存中创建了部分单元格。若是整列仅创建第一行,若是整行仅创建第一列。
示例:
colC = ws['C'] print(colC) #(<Cell 'Sheet'.C1>,) col_range = ws['C:D'] print(col_range) #((<Cell 'Sheet'.C1>,), (<Cell 'Sheet'.D1>,)) row10 = ws[10] print(row10) #(<Cell 'Sheet'.A10>,) row_range = ws[5:10] print(row_range) #((<Cell 'Sheet'.A5>,), (<Cell 'Sheet'.A6>,), (<Cell 'Sheet'.A7>,), (<Cell 'Sheet'.A8>,), (<Cell 'Sheet'.A9>,), (<Cell 'Sheet'.A10>,))
3、Worksheet.iter_rows()方法,以行获取单元格对象
示例:
from openpyxl import Workbook wb = Workbook() ws1 = wb.create_sheet() for row in ws1.iter_rows(min_row=1, max_col=3, max_row=2): for cell in row: print(cell) <<< <Cell 'Sheet1'.A1> <Cell 'Sheet1'.B1> <Cell 'Sheet1'.C1> <Cell 'Sheet1'.A2> <Cell 'Sheet1'.B2> <Cell 'Sheet1'.C2>
4、Worksheet.iter_cols()方法,以列获取单元格对象(只读模式下不可用)
示例:
from openpyxl import Workbook wb = Workbook() ws1 = wb.create_sheet() for col in ws1.iter_cols(min_row=1, max_col=3, max_row=2): for cell in col: print(cell) <<< <Cell 'Sheet1'.A1> <Cell 'Sheet1'.A2> <Cell 'Sheet1'.B1> <Cell 'Sheet1'.B2> <Cell 'Sheet1'.C1> <Cell 'Sheet1'.C2>
5、遍历文件的所有行或列
- Worksheet.rows属性,遍历文件的所有行。
- Worksheet.columns属性,遍历文件的所有列。(在只读模式下不可用)
示例:
from openpyxl import Workbook wb = Workbook() ws1 = wb.create_sheet() ws1['C3'] = 'hello world' print(tuple(ws1.rows)) #以行遍历文件 print(tuple(ws1.columns)) #以列遍历文件 <<< ((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>), (<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>), (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>)) ((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>), (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>), (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>))
3、仅返回单元格的值
- 如果您只想要工作表中的值,您可以使用该Worksheet.values属性。这将遍历工作表中的所有行,但仅返回单元格值。
示例:
for row in ws.values: for value in row: print(value)
- Worksheet.iter_rows()和Worksheet.iter_cols()可以采取的values_only参数,只返回单元格的值
示例:
from openpyxl import Workbook wb = Workbook() ws = wb.active for row in ws.iter_rows(min_row=1, max_col=3, max_row=2, values_only=True): print('row--', row) for col in ws.iter_cols(min_row=1, max_col=3, max_row=2, values_only=True): print('col--', col) <<< row-- (None, None, None) row-- (None, None, None) col-- (None, None) col-- (None, None) col-- (None, None)
4、单元格的常用操作
1、获取一个单元格的方法
-
cell(row, column, value=None)
- 根据给定的坐标返回一个单元格对象。
- 第一次访问时,调用cell在内存中创建单元格。
- 参数
- row(int):单元格的行索引
- column(int):单元格的列索引
- value(numeric或time或string或bool或none):单元格的值
示例:
c3 = ws.cell(3, 3) #获取单元格对象 #<Cell 'Sheet1'.C3> c3 = ws.cell(3, 3, 'c3') #获取单元格对象,并将单元格值改为‘c3’ c3.value = 'c3' #修改单元格的值 c3val = c3.value #获取单元格的值
2、获取多个单元格的对象或值的方法
-
iter_cols( min_col=None , max_col=None , min_row=None , max_row=None , values_only=False ) #(只读模式下不可用)
- 按列从工作表中生成单元格。使用行和列的索引指定迭代范围。
- 如果未指定索引,则范围从A1开始。
- 如果工作表中没有单元格,将返回一个空元组。
- 参数
- min_col(int):最小列索引(基于1的索引);
- min_row(int):最小行索引(基于1的索引);
- max_col(int):最大列索引(基于1的索引);
- max_row(int):最大行索引(基于1的索引);
- values_only(bool):是否只应返回单元格值,默认是False返回单元格对象,若为True则返回单元格值。
-
iter_rows( min_row=None , max_row=None , min_col=None , max_col=None , values_only=False )
- 按行从工作表中生成单元格。使用行和列的索引指定迭代范围。
示例:
icol = ws.iter_cols(min_row=2, max_row=3, min_col=2, max_col=3) #返回单元格对象生成器 #<generator object Worksheet._cells_by_col at 0x000001A1CF0DDCF0> print(tuple(icol)) #结果是:((<Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>), (<Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>)) icol_val = ws.iter_cols(min_row=2, max_row=3, min_col=2, max_col=3, values_only=True) #返回单元格值的生成器 #<generator object Worksheet._cells_by_col at 0x000001A1CF0DD0B0> print(tuple(icol_val)) #结果是:(('B2', 'B3'), ('C2', 'C3'))
3、获取表中的所有单元格对象
-
rows
- 以行遍历文件,返回所有单元格
-
columns #(在只读模式下不可用)
- 以列遍历文件,返回所有单元格
示例:
rs = ws.rows #返回单元格对象生成器 #<generator object Worksheet._cells_by_row at 0x0000025DF5E1F040> print(tuple(rs)) #结果是:((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.B1>, <Cell 'Sheet1'.C1>, <Cell 'Sheet1'.D1>, <Cell 'Sheet1'.E1>), (<Cell 'Sheet1'.A2>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.D2>, <Cell 'Sheet1'.E2>), (<Cell 'Sheet1'.A3>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.D3>, <Cell 'Sheet1'.E3>), (<Cell 'Sheet1'.A4>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.D4>, <Cell 'Sheet1'.E4>), (<Cell 'Sheet1'.A5>, <Cell 'Sheet1'.B5>, <Cell 'Sheet1'.C5>, <Cell 'Sheet1'.D5>, <Cell 'Sheet1'.E5>)) cols = ws.columns #返回单元格对象生成器 #<generator object Worksheet._cells_by_col at 0x0000025DF5E1FC80> print(tuple(cols)) #结果是:((<Cell 'Sheet1'.A1>, <Cell 'Sheet1'.A2>, <Cell 'Sheet1'.A3>, <Cell 'Sheet1'.A4>, <Cell 'Sheet1'.A5>), (<Cell 'Sheet1'.B1>, <Cell 'Sheet1'.B2>, <Cell 'Sheet1'.B3>, <Cell 'Sheet1'.B4>, <Cell 'Sheet1'.B5>), (<Cell 'Sheet1'.C1>, <Cell 'Sheet1'.C2>, <Cell 'Sheet1'.C3>, <Cell 'Sheet1'.C4>, <Cell 'Sheet1'.C5>), (<Cell 'Sheet1'.D1>, <Cell 'Sheet1'.D2>, <Cell 'Sheet1'.D3>, <Cell 'Sheet1'.D4>, <Cell 'Sheet1'.D5>), (<Cell 'Sheet1'.E1>, <Cell 'Sheet1'.E2>, <Cell 'Sheet1'.E3>, <Cell 'Sheet1'.E4>, <Cell 'Sheet1'.E5>))
4、获取表中的所有单元格值
-
values
- 按行生成工作表中的所有单元格值
示例:
vs = ws.values #返回单元格对象生成器 #<generator object Worksheet.values at 0x000002543827DCF0> print(tuple(vs)) #结果是:(('A1', 'B1', 'C1', 'D1', 'E1'), ('A2', 'B2', 'C2', 'D2', 'E2'), ('A3', 'B3', 'C3', 'D3', 'E3'), ('A4', 'B4', 'C4', 'D4', 'E4'), ('A5', 'B5', 'C5', 'D5', 'E5'))
5、在表的最后添加一行
-
append(iterable)
- 在当前工作表的底部附加一组值(在最后添加一行)。
- 如果是列表:从第一列开始按顺序添加所有值
- 如果是字典:将值分配给键(数字或字母)指示的列
- 在当前工作表的底部附加一组值(在最后添加一行)。
示例:
ws.append(['This is A1', 'This is B1', 'This is C1']) #列表 ws.append({'A': 'This is A1', 'C': 'This is C1'}) #字典 ws.append({1: 'This is A1', 3: 'This is C1'}) #字典
6、删除、插入列或行
-
delete_cols(idx, amount=1)
- 删除一列或多列。从第idx列开始删除amount列(包含idx)
-
delete_rows(idx, amount=1)
- 删除一行或多行,从第idx行开始删除amount行(包含idx)
-
insert_cols(idx, amount=1)
- 插入一列或多列,在第idx列前插入amount列
-
insert_rows(idx, amount=1)
- 插入一行或多行,在第idx行前插入amount行
示例:
ws.delete_cols(2, 2) # 删除一列或多列,从第2列开始删除2列(包含第2列) ws.delete_rows(2, 2) # 删除一行或多行,从第2行开始删除2行 ws.insert_cols(2, 2) # 插入一列或多列,在第2列前插入2列 ws.insert_rows(2, 2) # 插入一行或多行,在第2行前插入2行
7、移动单元格
-
move_range( cell_range , rows=0 , cols=0 , translate=False )
- 按行数或列数移动单元格范围。
- 现有单元格将被覆盖。公式和参考资料将不会更新。
- 如果rows > 0,则向下移动;如果rows < 0,则向上移动。
- 如果 cols > 0,则向右移动,如果 cols < 0,则向左移动。
- 若translate=False移动时单元格中的公式被重新解析到新的单元格。若translate=True只移动单元格中公式的值。
示例:
ws.move_range("A1:C3", rows=3, cols=3) #将“A1:C3”范围的单元格向下移动3行,向右移动3列 ws.move_range("A1:C3", rows=3, cols=3, translate=True) #将范围内公式中的相对引用移动3行和3列。
8、合并单元格
- 当您合并单元格时,除了左上角的所有单元格都将从工作表中删除。
-
merge_cells(range_string=None, start_row=None, start_column=None, end_row=None, end_column=None)
- 在单元格范围上设置合并。Range 是一个单元格区域(例如 A1:E1)
-
unmerge_cells(range_string=None, start_row=None, start_column=None, end_row=None, end_column=None)
- 取消单元格的合并。Range 是一个单元格区域(例如 A1:E1)
示例:
ws.merge_cells('A2:B4') #合并单元格 ws.unmerge_cells('A2:B4') #取消单元格的合并 #注意,范围要一致 #两种方式的结果一样 ws.merge_cells(start_row=2, start_column=1, end_row=4, end_column=2) ws.unmerge_cells(start_row=2, start_column=1, end_row=4, end_column=2)
9、返回行、列的标识
-
calculate_dimension()
- 返回包含数据的所有单元格的最小边界范围(例如“A1:M24”)
-
dimensions
- 返回包含数据的所有单元格的最小边界范围(例如“A1:M24”)
-
max_column
- 包含数据的最大列索引(从 1 开始)
-
max_row
- 包含数据的最大行索引(从 1 开始)
-
min_column
- 包含数据的最小列索引(从 1 开始)
-
min_row
- 包含数据的最小行索引(从 1 开始)
示例:
print(ws.calculate_dimension()) #结果是:A1:H5 print(ws.dimensions) #结果是:A1:H5 print(ws.max_column) #结果是:8 print(ws.max_row) #结果是:5 print(ws.min_column) #结果是:1 print(ws.min_row) #结果是:1
10、插入图片
-
aadd_image(img, anchor=None)
- 向工作表添加图像。可选参数anchor为左上角锚点提供一个单元格
示例:
from openpyxl import Workbook from openpyxl.drawing.image import Image wb = Workbook() ws = wb.active ws['A1'] = 'You should see three logos below' img = Image('logo.png') #创建图片对象 ws.add_image(img, 'B2') #将图片插入工作表 wb.save('empty_book.xlsx')
11、注释
- Openpyxl目前只支持读取和写入注释。注释维度(注释框的大小)在读取时丢失,但可以写入。如果使用read_only=True,则当前不支持(读写)注释。
1、向一个单元格添加注释
- 注释有一个文本属性和一个作者属性,这两个属性都必须设置
- def __init__(self, text, author, height=79, width=144)
- 如果将相同的注释分配给多个单元格,那么openpyxl将自动创建副本
- 可以指定注释维度。注释维度以像素为单位。
示例:
from openpyxl import load_workbook from openpyxl.comments import Comment wb = load_workbook('empty_book.xlsx') ws = wb.active comment = Comment('This is the comment text ', 'Comment Author') #创建一个注释对象 comment.width = 300 comment.height = 50 ws["A1"].comment = comment #向单元格“A1”添加注释 ws["B1"].comment = comment print(ws["A1"].comment is comment) #结果是:True print(ws["B2"].comment is comment) #结果是:False #两个单元格的注释对象不是同一个 print(ws["A1"].comment.text) #结果是:This is the comment text #打印单元格“A1”的注释的text属性 print(ws["A1"].comment.author) #结果是:Comment Author wb.save('empty_book.xlsx')
- 如果需要,openpyxl.utils.units包含帮助函数,用于从其他度量(如mm或点)转换为像素
示例:
from openpyxl.utils import units comment.width = units.points_to_pixels(100) comment.height = units.points_to_pixels(100)
2、加载和保存注释
- 加载工作簿时注释将自动存储在各自单元格的注释属性中。但注释的格式化信息,如字体大小、粗体和斜体,以及注释容器框的原始尺寸和位置都将丢失。
- 保存工作簿时保留在工作簿中的注释将自动保存到工作簿文件中。
5、使用样式
- 样式用于更改显示在屏幕上的数据的外观。它们还用于确定数字的格式。
- 有两种样式:单元格样式和命名样式,也称为样式模板。
- 单元格样式是在对象之间共享的,一旦它们被分配,就不能更改。这就避免了一些不必要的副作用,比如当只有一个单元格发生变化时,就会改变很多单元格的样式。
- 与单元格样式相反,命名样式是可变的。当您想要同时对许多不同的单元格应用格式时,它们是有意义的。注意:将命名样式分配给单元格后,对样式的其他更改将不会影响该单元格。
- 样式可以应用于以下几个方面:
- font 设置字体大小、颜色、下划线等。
- 填充以设置图案或颜色渐变
- 边框在单元格上设置边框
- 单元格对齐
- 保护
1、单元格样式之字体
#字体参数的默认值 from openpyxl.styles import Font font = Font(name='Calibri', #字体样式,例如:黑体、宋体 size=11, #字体大小 bold=False, #是否加粗 italic=False, #是否倾斜 underline='none', #下划线。可选的参数有:none无下划线,single单下划线,double双下划线,singleAccounting满格单下划线,doubleAccounting满格双下划线 strike=False, #是否加中横线 vertAlign=None, #纵向对齐方式,superscript在上方, subscript在下方, baseline基线 color='FF000000') #字体颜色
示例:
from openpyxl import load_workbook from openpyxl.styles import Font wb = load_workbook('empty_book.xlsx') ws = wb.active font1 = Font(name='宋体', size=11, bold=True, color='FF000000') #创建字体样式对象,宋体、11号、加粗、黑色 font2 = Font(name='宋体', size=16, italic=True, color='00FF0000') #创建字体样式对象,宋体、16号、斜体、红色 a1 = ws['A1'] a2 = ws['A2'] a1.value = 'a1' a2.value = 'a2' a1.font = font1 #将字体样式对象赋给单元格的font属性 a2.font = font2 wb.save('empty_book.xlsx')
2、单元格样式之(区域)填充
#单元格填充参数的默认值 from openpyxl.styles import PatternFill fill = PatternFill(fill_type=None, start_color='FFFFFFFF', end_color='FF000000')
- fill = PatternFill(patternType=None, fgColor=Color(), bgColor=Color(), fill_type=None, start_color=None, end_color=None)
- patternType、fill_type功能相同,在样式中的区域填充模式。
- 注意:如果不指定fill_type,其他属性将无效!
- 值必须是'gray0625', 'darkGray', 'darkDown', 'lightVertical', 'lightUp', 'mediumGray', 'darkGrid', 'darkUp', 'solid', 'darkVertical', 'gray125', 'lightGray', 'lightGrid', 'lightHorizontal', 'darkTrellis', 'lightDown', 'darkHorizontal', 'lightTrellis'之一
- fgColor、start_color作用相同,前景色。示例:fgColor='0000FF00'
- bgColor、end_color作用相同,背景色。示例:bgColor='0000FF00'
- patternType、fill_type功能相同,在样式中的区域填充模式。
- 填充模式和前景色、背景色
- 前景色时,颜色是图案的颜色。背景色时,颜色是背景的颜色,图案颜色是黑色。
示例:获得上面的图片内容
from openpyxl import load_workbook from openpyxl.styles import PatternFill wb = load_workbook('empty_book.xlsx') ws = wb.active filltype = ['gray0625', 'darkGray', 'darkDown', 'lightVertical', 'lightUp', 'mediumGray', 'darkGrid', 'darkUp', 'solid', 'darkVertical', 'gray125', 'lightGray', 'lightGrid', 'lightHorizontal', 'darkTrellis', 'lightDown', 'darkHorizontal', 'lightTrellis'] #单元格的18种填充模式 i = 0 for rowi in range(1, 5): for coli in range(1, 6): try: a1 = ws.cell(row=rowi, column=coli, value=filltype[i]) #单元格对象 fill = PatternFill(fill_type=filltype[i], fgColor='0000FF00') #创建单元格填充模式对象 a1.fill = fill #将单元格填充模式对象赋给单元格fill属性 i += 1 except: break wb.save('empty_book.xlsx')
3、单元格样式之边框
#单元格边框参数的默认值 from openpyxl.styles import Border, Side border = Border(left=Side(border_style=None, color='FF000000'), right=Side(border_style=None, color='FF000000'), top=Side(border_style=None, color='FF000000'), bottom=Side(border_style=None, color='FF000000'), diagonal=Side(border_style=None, color='FF000000'), diagonal_direction=0, outline=Side(border_style=None, color='FF000000'), vertical=Side(border_style=None, color='FF000000'), horizontal=Side(border_style=None, color='FF000000') )
1、边框选项
- 设置单元格边框的样子
-
Side(style=None, color=None, border_style=None)
- 注意:如果不指定border_style,其他属性将无效!
- border_style、style功能一样,值必须是'hair', 'dashDotDot', 'dashDot', 'thin', 'mediumDashed', 'slantDashDot', 'dotted', 'dashed', 'medium', 'thick', 'mediumDashDot', 'double', 'mediumDashDotDot'之一
2、边框定位
- 边框在单元格的位置(上、下、左、右等)
- Border(left=None, right=None, top=None, bottom=None, diagonal=None, diagonal_direction=None, vertical=None, horizontal=None, diagonalUp=False, diagonalDown=False, outline=True, start=None, end=None)
示例1:
from openpyxl import load_workbook from openpyxl.styles import Border, Side wb = load_workbook('empty_book.xlsx') ws = wb.active side_thin = Side(border_style='thin', color="00FF0000") #创建一个边框对象(红色单实线边框) side_double = Side(border_style='double', color="00000000") #创建一个边框对象(黑色双实线边框) ws['B2'].border = Border(left=side_thin, right=side_thin, top=side_double, bottom=side_double, diagonalUp=True, diagonalDown=True) #左右上下(单元格左右红色单实线边框,上下黑色双实线边框) ws['C3'].border = Border(diagonal=side_thin, diagonalDown=True) #斜杠 ws['D4'].border = Border(diagonal=side_double, diagonalUp=True) #反斜杠 ws['E5'].border = Border(start=side_thin, end=side_double) #左右 wb.save('empty_book.xlsx')
示例2:获得上面的图片内容
from openpyxl import load_workbook from openpyxl.styles import Border, Side wb = load_workbook('empty_book.xlsx') ws = wb.active borderstyle = ['hair', 'dashDotDot', 'dashDot', 'thin', 'mediumDashed', 'slantDashDot', 'dotted', 'dashed', 'medium', 'thick', 'mediumDashDot', 'double', 'mediumDashDotDot'] i = 0 for rowi in range(1, 5): for coli in range(1, 5): try: cell = ws.cell(row=rowi, column=coli, value=borderstyle[i]) #单元格对象 side = Side(border_style=borderstyle[i], color="00FF0000") #边框对象 cell.border = Border(bottom=side) #将边框放在单元格下面 i += 1 except: break wb.save('empty_book.xlsx')
4、单元格样式之对齐
#单元格对齐参数的默认值 from openpyxl.styles import Alignment alignment=Alignment(horizontal='general', vertical='bottom', text_rotation=0, wrap_text=False, shrink_to_fit=False, indent=0)
-
Alignment(horizontal=None, vertical=None, textRotation=0, wrapText=None, shrinkToFit=None, indent=0, relativeIndent=0, justifyLastLine=None, readingOrder=0, text_rotation=None, wrap_text=None, shrink_to_fit=None, mergeCell=None)
- horizontal(水平)的值必须是general(常规),center(居中),left(居左),right(居右),distributed(分布整个单元格),fill(充满单元格,内容重复),justify,centerContinuous之一
-
- vertical(垂直)的值必须是top,center,bottom,justify,distributed。
-
- textRotation(旋转文本)的范围是[0-180]
- wrapText(文本换行),若为True则换行,若为False则不换行。(其他的参数可能会影响它)
- shrinkToFit(压缩至适当尺寸),将文本缩小至单元格可以显示全部
- indent=0,单元格的左边将留出空白
示例:获得下面的图片内容
from openpyxl import load_workbook from openpyxl.styles import Alignment wb = load_workbook('empty_book.xlsx') ws = wb.active ws.cell(1, 1, value='A').alignment = Alignment(horizontal='center') ws.cell(1, 2, value='B').alignment = Alignment(vertical='top') ws.cell(1, 3, value='C').alignment = Alignment(textRotation=30) ws.cell(1, 4, value='DDDDDDDDDDDDDDDDDDDDD').alignment = Alignment(shrinkToFit=True) wb.save('empty_book.xlsx')
5、渐变填充区域
- GradientFill(type="linear", degree=0, left=0, right=0, top=0, bottom=0, stop=())
- 两种渐变填充类型:
-
type='linear'渐变是stop指定的一组颜色,横跨一个区域的长度。可以提供一个颜色列表,它们之间的距离相等。
- 默认情况下渐变是从左到右的,但是这个方向可以通过degree属性进行修改。
-
type='path'渐变从区域的每个边缘应用一个线性渐变。
- 属性top, right, bottom, left指定从各自边界填充的范围。因此top="0.2"将填充单元格顶部的20%。
-
type='linear'渐变是stop指定的一组颜色,横跨一个区域的长度。可以提供一个颜色列表,它们之间的距离相等。
示例:
from openpyxl import load_workbook from openpyxl.styles import GradientFill wb = load_workbook('empty_book.xlsx') ws = wb.active filla = GradientFill(type="linear", degree=0, stop=("000000", "00FF00", "FF0000")) fillb = GradientFill(type="path", left=0.2, right=0.2, top=0.4, bottom=0.2, stop=("000000", "00FF00", "FF0000")) ws['A1'].fill = filla ws['B1'].fill = fillb wb.save('empty_book.xlsx')
6、应用单元格样式
1、样式应用于单元格
from openpyxl.workbook import Workbook from openpyxl.styles import Font, Fill wb = Workbook() ws = wb.active c = ws['A1'] c.font = Font(size=12)
2、 样式应用于列和行
- 请注意,这仅适用于文件关闭后(在Excel中)创建的单元格。如果要将样式应用于整个行和列,则必须自己将样式应用于每个单元格
col = ws.column_dimensions['A'] col.font = Font(bold=True) row = ws.row_dimensions[1] row.font = Font(underline="single")
3、样式应用于合并单元格
- 合并单元格的行为与其他单元格对象类似。它的值和格式在其左上角的单元格中定义。要更改整个合并单元格的边框,请更改其左上角单元格的边框。格式化是为了写作而生成的。
- 问题:要执行两次才将边框作用于整个合并单元格上。
示例:
from openpyxl import load_workbook from openpyxl.styles import Border, Side, PatternFill, Font, GradientFill, Alignment wb = load_workbook('empty_book.xlsx') ws = wb.active cells = ws.merge_cells('B2:F4') cell = ws['B2'] thin = Side(border_style="thin", color="000000") double = Side(border_style="double", color="ff0000") cell.value = "My Cell" cell.font = Font(b=True, color="FF0000") cell.border = Border(top=double, left=thin, right=thin, bottom=double) cell.fill = PatternFill("solid", fgColor="FFFFFF") # cell.fill = GradientFill(stop=("00FF00", "000000")) cell.alignment = Alignment(horizontal="center", vertical="center") wb.save('empty_book.xlsx')
7、创建命名样式
- 在工作簿中注册了命名样式后,只需通过名称就可以引用它。
#创建命名样式 from openpyxl.styles import NamedStyle, Font, Border, Side highlight = NamedStyle(name="highlight") #创建命名样式对象 highlight.font = Font(bold=True, size=20) #将字体样式添加到命名样式中 bd = Side(style='thick', color="000000") highlight.border = Border(left=bd, top=bd, right=bd, bottom=bd) #将边框样式添加到命名样式中 #将其注册到工作簿中 wb.add_named_style(highlight) #注册后,仅使用名称分配样式 ws['D5'].style = 'highlight' #命名样式也可以在第一次分配给单元格时自动注册 ws['A1'].style = highlight
8、使用内置样式
- 该规范包括一些也可以使用的内置样式。不幸的是,这些样式的名称是以本地化的形式存储的。openpyxl只会识别英文名称,并且只能和这里写的完全一样。(https://openpyxl.readthedocs.io/en/stable/styles.html#using-builtin-styles)
示例:
from openpyxl import load_workbook wb = load_workbook('empty_book.xlsx') ws = wb.active ws['A1'].style = 'Percent' ws['B2'].style = 'Title' ws['C3'].style = 'Headline 1' wb.save('empty_book.xlsx')
6、条件格式
- Excel支持三种不同类型的条件格式:内置、标准和自定义。
- 内置样式将特定的规则与预定义的样式结合起来。
- 标准条件格式将特定的规则与自定义格式结合起来。
- 此外,还可以定义使用差异样式应用自定义格式的自定义公式。
- 内置条件格式有三种:
- ColorScale(色阶)
- IconSet(图标集)
- DataBar(数据条)
- DataBarRule(start_type=None, start_value=None, end_type=None, end_value=None, color=None, showValue=None, minLength=None, maxLength=None)
- 内置格式包含格式化设置序列,将类型与整数组合起来进行比较。可能的类型是:'num', 'percent', 'max', 'min', 'formula', 'percentile'
1、色阶
-
ColorScaleRule(start_type=None, start_value=None, start_color=None, mid_type=None, mid_value=None, mid_color=None, end_type=None, end_value=None, end_color=None)
- XXX_type可能是:'num', 'percent', 'max', 'min', 'formula', 'percentile'
示例:
from openpyxl import load_workbook from openpyxl.styles import PatternFill from openpyxl.formatting.rule import ColorScaleRule wb = load_workbook('empty_book.xlsx') ws = wb.active #使用2种色阶 ws.conditional_formatting.add('A1:A100', ColorScaleRule(start_type='max', start_color='FF0000', end_type='min', end_color='0000FF') ) #使用3种色阶 ws.conditional_formatting.add('B1:B100', ColorScaleRule(start_type='percentile', start_value=10, start_color='FF0000', mid_type='percentile', mid_value=60, mid_color='0000FF', end_type='percentile', end_value=90, end_color='FFFF00') ) for coli in range(1,3): for rowi in range(1,100): ws.cell(row=rowi,column=coli,value=rowi) wb.save('empty_book.xlsx')
2、图标集
- 方便创建图标集规则功能
-
IconSetRule(icon_style=None, type=None, values=None, showValue=None, percent=None, reverse=None)
- icon_style的值是:'3Flags', '3Signs', '3Arrows', '3TrafficLights2', '3TrafficLights1', '3ArrowsGray', '3Symbols', '3Symbols2', '4TrafficLights', '4Rating', '4Arrows', '4ArrowsGray', '4RedToBlack','5Arrows', '5Rating', '5ArrowsGray', '5Quarters'
- type可能是:'num', 'percent', 'max', 'min', 'formula', 'percentile'
示例1:
from openpyxl import Workbook from openpyxl.formatting.rule import IconSetRule wb = Workbook() ws = wb.active ws.conditional_formatting.add('A1:A100', IconSetRule(icon_style='5Rating', type='percent', values=[0, 20, 40, 60, 80], showValue=None, percent=None, reverse=None) ) wb.save('empty_book.xlsx')
示例2:获得上面的图片内容
from openpyxl import Workbook from openpyxl.formatting.rule import IconSetRule from openpyxl.utils import get_column_letter wb = Workbook() ws = wb.active image = ['3Flags', '3Signs', '3Arrows', '3TrafficLights2', '3TrafficLights1', '3ArrowsGray', '3Symbols', '3Symbols2', '4TrafficLights', '4Rating', '4Arrows', '4ArrowsGray', '4RedToBlack', '5Arrows', '5Rating', '5ArrowsGray', '5Quarters'] i = 0 for coli in range(1, 18): col = get_column_letter(coli) #将列索引由数字转换为字母,例如1-->A rangestring = '{0}2:{0}6'.format(col) #获得单元格范围,例如A1:A6 ws.conditional_formatting.add(rangestring, IconSetRule(image[i], 'formula', [2, 3, 4, 5, 6], showValue=None, percent=None, reverse=None) ) for rowi in range(1, 7): if rowi == 1: #每列的第一行打印icon_style的值 ws.cell(row=rowi, column=coli, value=image[i]) else: ws.cell(row=rowi, column=coli, value=rowi) i += 1 wb.save('empty_book.xlsx')
3、数据条
-
DataBarRule(start_type=None, start_value=None, end_type=None, end_value=None, color=None, showValue=None, minLength=None, maxLength=None)
- XXX_type可能是:'num', 'percent', 'max', 'min', 'formula', 'percentile'
示例:
from openpyxl import Workbook from openpyxl.formatting.rule import DataBarRule wb = Workbook() ws = wb.active ws.conditional_formatting.add('A1:D100', DataBarRule(start_type='percentile', start_value=60, end_type='percentile', end_value='90', color="FF638EC6", showValue="None", minLength=None, maxLength=None) ) wb.save('empty_book.xlsx')
4、基于单元格比较
- 添加基于单元格比较的条件格式
-
CellIsRule(operator=None, formula=None, stopIfTrue=None, font=None, border=None, fill=None) #字体、边框、填充
- operator的值是字典的值:{">": "greaterThan", ">=": "greaterThanOrEqual", "<": "lessThan", "<=": "lessThanOrEqual", "=": "equal", "==": "equal", "!=": "notEqual"}
- formula的值也可以是个序列。例如:formula = [44]
示例:
from openpyxl import load_workbook from openpyxl.styles import PatternFill from openpyxl.formatting.rule import CellIsRule wb = load_workbook('empty_book.xlsx') ws = wb.active redFill = PatternFill(start_color='EE1111', end_color='EE1111', fill_type='solid') #每列大于第一个单元格的标红 ws.conditional_formatting.add('A2:B100', CellIsRule(operator='greaterThan', formula=['A$1'], stopIfTrue=True, fill=redFill)) #在[1,5]之内的标红 ws.conditional_formatting.add('C1:F100', CellIsRule(operator='between', formula=['1', '5'], stopIfTrue=True, fill=redFill)) ws['A1'] = 10 ws['B1'] = 10 for coli in range(1, 7): for rowi in range(1, 101): ws.cell(row=rowi, column=coli, value=rowi) wb.save('empty_book.xlsx')
5、使用公式格式化
- FormulaRule(formula=None, stopIfTrue=None, font=None, border=None, fill=None) #字体、边框、填充
示例:
from openpyxl import load_workbook from openpyxl.styles import PatternFill, Font, Border from openpyxl.formatting.rule import FormulaRule wb = load_workbook('empty_book.xlsx') ws = wb.active redFill = PatternFill(start_color='EE1111', end_color='EE1111', fill_type='solid') #若单元格是空,颜色为红 ws.conditional_formatting.add('A1:B100', FormulaRule(formula=['ISBLANK(A1)'], stopIfTrue=True, fill=redFill)) myFont = Font() myBorder = Border() #若单元格是3,颜色为红(若formula=['A1=0']时,比较特殊,注意为空的情况) ws.conditional_formatting.add('A1:C100', FormulaRule(formula=['A1=3'], font=myFont, border=myBorder, fill=redFill)) for coli in range(1, 2): for rowi in range(1, 101): ws.cell(row=rowi, column=coli, value=rowi) wb.save('empty_book.xlsx')
图表
- https://openpyxl.readthedocs.io/en/stable/charts/introduction.html
推荐阅读
-
用 Python 将 HTML 转换为 Excel 文件 - 用 Python 将 HTML 转换为 Excel 工作表
-
使用 openpyxl 轻松操作 Excel 文件
-
使用Python的内置re模块进行正则表达式操作
-
用Python实际操作CSV文件的案例与代码示例
-
Python自动化实战指南(让繁琐操作自动搞定)第二辑:第九章详解文件的读取与写入
-
在Python中,如何根据多个条件对目录下的文件名进行排序操作
-
Python入门教程:实战示例 - 爬虫解析文件中的队列与线程协同操作
-
使用Python操作企业微信机器人的API来发送文件
-
SSM三大框架基础面试题-一、Spring篇 什么是Spring框架? Spring是一种轻量级框架,提高开发人员的开发效率以及系统的可维护性。 我们一般说的Spring框架就是Spring Framework,它是很多模块的集合,使用这些模块可以很方便地协助我们进行开发。这些模块是核心容器、数据访问/集成、Web、AOP(面向切面编程)、工具、消息和测试模块。比如Core Container中的Core组件是Spring所有组件的核心,Beans组件和Context组件是实现IOC和DI的基础,AOP组件用来实现面向切面编程。 Spring的6个特征: 核心技术:依赖注入(DI),AOP,事件(Events),资源,i18n,验证,数据绑定,类型转换,SpEL。 测试:模拟对象,TestContext框架,Spring MVC测试,WebTestClient。 数据访问:事务,DAO支持,JDBC,ORM,编组XML。 Web支持:Spring MVC和Spring WebFlux Web框架。 集成:远程处理,JMS,JCA,JMX,电子邮件,任务,调度,缓存。 语言:Kotlin,Groovy,动态语言。 列举一些重要的Spring模块? Spring Core:核心,可以说Spring其他所有的功能都依赖于该类库。主要提供IOC和DI功能。 Spring Aspects:该模块为与AspectJ的集成提供支持。 Spring AOP:提供面向切面的编程实现。 Spring JDBC:Java数据库连接。 Spring JMS:Java消息服务。 Spring ORM:用于支持Hibernate等ORM工具。 Spring Web:为创建Web应用程序提供支持。 Spring Test:提供了对JUnit和TestNG测试的支持。 谈谈自己对于Spring IOC和AOP的理解 IOC(Inversion Of Controll,控制反转)是一种设计思想: 在程序中手动创建对象的控制权,交由给Spring框架来管理。IOC在其他语言中也有应用,并非Spring特有。IOC容器实际上就是一个Map(key, value),Map中存放的是各种对象。 将对象之间的相互依赖关系交给IOC容器来管理,并由IOC容器完成对象的注入。这样可以很大程度上简化应用的开发,把应用从复杂的依赖关系中解放出来。IOC容器就像是一个工厂一样,当我们需要创建一个对象的时候,只需要配置好配置文件/注解即可,完全不用考虑对象是如何被创建出来的。在实际项目中一个Service类可能由几百甚至上千个类作为它的底层,假如我们需要实例化这个Service,可能要每次都搞清楚这个Service所有底层类的构造函数,这可能会把人逼疯。如果利用IOC的话,你只需要配置好,然后在需要的地方引用就行了,大大增加了项目的可维护性且降低了开发难度。 Spring中的bean的作用域有哪些? 1.singleton:该bean实例为单例 2.prototype:每次请求都会创建一个新的bean实例(多例)。 3.request:每一次HTTP请求都会产生一个新的bean,该bean仅在当前HTTP request内有效。 4.session:每一次HTTP请求都会产生一个新的bean,该bean仅在当前HTTP session内有效。 5.global-session:全局session作用域,仅仅在基于Portlet的Web应用中才有意义,Spring5中已经没有了。Portlet是能够生成语义代码(例如HTML)片段的小型Java Web插件。它们基于Portlet容器,可以像Servlet一样处理HTTP请求。但是与Servlet不同,每个Portlet都有不同的会话。 Spring中的单例bean的线程安全问题了解吗? 概念用于理解:大部分时候我们并没有在系统中使用多线程,所以很少有人会关注这个问题。单例bean存在线程问题,主要是因为当多个线程操作同一个对象的时候,对这个对象的非静态成员变量的写操作会存在线程安全问题。 有两种常见的解决方案(用于回答的点): 1.在bean对象中尽量避免定义可变的成员变量(不太现实)。 2.在类中定义一个ThreadLocal成员变量,将需要的可变成员变量保存在ThreadLocal(线程本地化对象)中(推荐的一种方式)。 ThreadLocal解决多线程变量共享问题(参考博客):https://segmentfault.com/a/1190000009236777 Spring中Bean的生命周期: 1.Bean容器找到配置文件中Spring Bean的定义。 2.Bean容器利用Java Reflection API创建一个Bean的实例。 3.如果涉及到一些属性值,利用set方法设置一些属性值。 4.如果Bean实现了BeanNameAware接口,调用setBeanName方法,传入Bean的名字。 5.如果Bean实现了BeanClassLoaderAware接口,调用setBeanClassLoader方法,传入ClassLoader对象的实例。 6.如果Bean实现了BeanFactoryAware接口,调用setBeanClassFacotory方法,传入ClassLoader对象的实例。 7.与上面的类似,如果实现了其他*Aware接口,就调用相应的方法。 8.如果有和加载这个Bean的Spring容器相关的BeanPostProcessor对象,执postProcessBeforeInitialization方法。 9.如果Bean实现了InitializingBean接口,执行afeterPropertiesSet方法。 10.如果Bean在配置文件中的定义包含init-method属性,执行指定的方法。 11.如果有和加载这个Bean的Spring容器相关的BeanPostProcess对象,执行postProcessAfterInitialization方法。 12.当要销毁Bean的时候,如果Bean实现了DisposableBean接口,执行destroy方法。 13.当要销毁Bean的时候,如果Bean在配置文件中的定义包含destroy-method属性,执行指定的方法。 Spring框架中用到了哪些设计模式? 1.工厂设计模式:Spring使用工厂模式通过BeanFactory和ApplicationContext创建bean对象。 2.代理设计模式:Spring AOP功能的实现。 3.单例设计模式:Spring中的bean默认都是单例的。 4.模板方法模式:Spring中的jdbcTemplate、hibernateTemplate等以Template结尾的对数据库操作的类,它们就使用到了模板模式。 5.包装器设计模式:我们的项目需要连接多个数据库,而且不同的客户在每次访问中根据需要会去访问不同的数据库。这种模式让我们可以根据客户的需求能够动态切换不同的数据源。 6.观察者模式:Spring事件驱动模型就是观察者模式很经典的一个应用。 7.适配器模式:Spring AOP的增强或通知(Advice)使用到了适配器模式、Spring MVC中也是用到了适配器模式适配Controller。 还有很多。。。。。。。 @Component和@Bean的区别是什么 1.作用对象不同。@Component注解作用于类,而@Bean注解作用于方法。 2.@Component注解通常是通过类路径扫描来自动侦测以及自动装配到Spring容器中(我们可以使用@ComponentScan注解定义要扫描的路径)。@Bean注解通常是在标有该注解的方法中定义产生这个bean,告诉Spring这是某个类的实例,当我需要用它的时候还给我。 3.@Bean注解比@Component注解的自定义性更强,而且很多地方只能通过@Bean注解来注册bean。比如当引用第三方库的类需要装配到Spring容器的时候,就只能通过@Bean注解来实现。 @Configuration public class AppConfig { @Bean public TransferService transferService { return new TransferServiceImpl; } } <beans> <bean id="transferService" class="com.kk.TransferServiceImpl"/> </beans> @Bean public OneService getService(status) { case (status) { when 1: return new serviceImpl1; when 2: return new serviceImpl2; when 3: return new serviceImpl3; } } 将一个类声明为Spring的bean的注解有哪些? 声明bean的注解: @Component 组件,没有明确的角色 @Service 在业务逻辑层使用(service层) @Repository 在数据访问层使用(dao层) @Controller 在展现层使用,控制器的声明 注入bean的注解: @Autowired:由Spring提供 @Inject:由JSR-330提供 @Resource:由JSR-250提供 *扩:JSR 是 java 规范标准 Spring事务管理的方式有几种? 1.编程式事务:在代码中硬编码(不推荐使用)。 2.声明式事务:在配置文件中配置(推荐使用),分为基于XML的声明式事务和基于注解的声明式事务。 Spring事务中的隔离级别有哪几种? 在TransactionDefinition接口中定义了五个表示隔离级别的常量:ISOLATION_DEFAULT:使用后端数据库默认的隔离级别,Mysql默认采用的REPEATABLE_READ隔离级别;Oracle默认采用的READ_COMMITTED隔离级别。ISOLATION_READ_UNCOMMITTED:最低的隔离级别,允许读取尚未提交的数据变更,可能会导致脏读、幻读或不可重复读。ISOLATION_READ_COMMITTED:允许读取并发事务已经提交的数据,可以阻止脏读,但是幻读或不可重复读仍有可能发生ISOLATION_REPEATABLE_READ:对同一字段的多次读取结果都是一致的,除非数据是被本身事务自己所修改,可以阻止脏读和不可重复读,但幻读仍有可能发生。ISOLATION_SERIALIZABLE:最高的隔离级别,完全服从ACID的隔离级别。所有的事务依次逐个执行,这样事务之间就完全不可能产生干扰,也就是说,该级别可以防止脏读、不可重复读以及幻读。但是这将严重影响程序的性能。通常情况下也不会用到该级别。 Spring事务中有哪几种事务传播行为? 在TransactionDefinition接口中定义了八个表示事务传播行为的常量。 支持当前事务的情况:PROPAGATION_REQUIRED:如果当前存在事务,则加入该事务;如果当前没有事务,则创建一个新的事务。PROPAGATION_SUPPORTS: 如果当前存在事务,则加入该事务;如果当前没有事务,则以非事务的方式继续运行。PROPAGATION_MANDATORY: 如果当前存在事务,则加入该事务;如果当前没有事务,则抛出异常。(mandatory:强制性)。 不支持当前事务的情况:PROPAGATION_REQUIRES_NEW: 创建一个新的事务,如果当前存在事务,则把当前事务挂起。PROPAGATION_NOT_SUPPORTED: 以非事务方式运行,如果当前存在事务,则把当前事务挂起。PROPAGATION_NEVER: 以非事务方式运行,如果当前存在事务,则抛出异常。 其他情况:PROPAGATION_NESTED: 如果当前存在事务,则创建一个事务作为当前事务的嵌套事务来运行;如果当前没有事务,则该取值等价于PROPAGATION_REQUIRED。 二、SpringMVC篇 什么是Spring MVC ?简单介绍下你对springMVC的理解? Spring MVC是一个基于Java的实现了MVC设计模式的请求驱动类型的轻量级Web框架,通过把Model,View,Controller分离,将web层进行职责解耦,把复杂的web应用分成逻辑清晰的几部分,简化开发,减少出错,方便组内开发人员之间的配合。 Spring MVC的工作原理了解嘛? image.png Springmvc的优点: (1)可以支持各种视图技术,而不仅仅局限于JSP; (2)与Spring框架集成(如IoC容器、AOP等); (3)清晰的角色分配:前端控制器(dispatcherServlet) , 请求到处理器映射(handlerMapping), 处理器适配器(HandlerAdapter), 视图解析器(ViewResolver)。 (4) 支持各种请求资源的映射策略。 Spring MVC的主要组件? (1)前端控制器 DispatcherServlet(不需要程序员开发) 作用:接收请求、响应结果,相当于转发器,有了DispatcherServlet 就减少了其它组件之间的耦合度。 (2)处理器映射器HandlerMapping(不需要程序员开发) 作用:根据请求的URL来查找Handler (3)处理器适配器HandlerAdapter 注意:在编写Handler的时候要按照HandlerAdapter要求的规则去编写,这样适配器HandlerAdapter才可以正确的去执行Handler。 (4)处理器Handler(需要程序员开发) (5)视图解析器 ViewResolver(不需要程序员开发) 作用:进行视图的解析,根据视图逻辑名解析成真正的视图(view) (6)视图View(需要程序员开发jsp) View是一个接口, 它的实现类支持不同的视图类型(jsp,freemarker,pdf等等) springMVC和struts2的区别有哪些? (1)springmvc的入口是一个servlet即前端控制器(DispatchServlet),而struts2入口是一个filter过虑器(StrutsPrepareAndExecuteFilter)。 (2)springmvc是基于方法开发(一个url对应一个方法),请求参数传递到方法的形参,可以设计为单例或多例(建议单例),struts2是基于类开发,传递参数是通过类的属性,只能设计为多例。 (3)Struts采用值栈存储请求和响应的数据,通过OGNL存取数据,springmvc通过参数解析器是将request请求内容解析,并给方法形参赋值,将数据和视图封装成ModelAndView对象,最后又将ModelAndView中的模型数据通过reques域传输到页面。Jsp视图解析器默认使用jstl。 SpringMVC怎么样设定重定向和转发的? (1)转发:在返回值前面加"forward:",譬如"forward:user.do?name=method4" (2)重定向:在返回值前面加"redirect:",譬如"redirect:http://www.baidu.com" SpringMvc怎么和AJAX相互调用的? 通过Jackson框架就可以把Java里面的对象直接转化成Js可以识别的Json对象。具体步骤如下 : (1)加入Jackson.jar (2)在配置文件中配置json的映射 (3)在接受Ajax方法里面可以直接返回Object,List等,但方法前面要加上@ResponseBody注解。 如何解决POST请求中文乱码问题,GET的又如何处理呢? (1)解决post请求乱码问题: 在web.xml中配置一个CharacterEncodingFilter过滤器,设置成utf-8; <filter> <filter-name>CharacterEncodingFilter</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>utf-8</param-value> </init-param> </filter> <filter-mapping> <filter-name>CharacterEncodingFilter</filter-name> <url-pattern>/*</url-pattern> </filter-mapping> (2)get请求中文参数出现乱码解决方法有两个: ①修改tomcat配置文件添加编码与工程编码一致,如下: <ConnectorURIEncoding="utf-8" connectionTimeout="20000" port="8080" protocol="HTTP/1.1" redirectPort="8443"/> ②另外一种方法对参数进行重新编码: String userName = new String(request.getParamter("userName").getBytes("ISO8859-1"),"utf-8") ISO8859-1是tomcat默认编码,需要将tomcat编码后的内容按utf-8编码。 Spring MVC的异常处理 ? 统一异常处理: Spring MVC处理异常有3种方式: (1)使用Spring MVC提供的简单异常处理器SimpleMappingExceptionResolver; (2)实现Spring的异常处理接口HandlerExceptionResolver 自定义自己的异常处理器; (3)使用@ExceptionHandler注解实现异常处理; 统一异常处理的博客:https://blog.csdn.net/ctwy291314/article/details/81983103 SpringMVC的控制器是不是单例模式,如果是,有什么问题,怎么解决? 是单例模式,所以在多线程访问的时候有线程安全问题,不要用同步,会影响性能的,解决方案是在控制器里面不能写成员变量。(此题目类似于上面Spring 中 第5题 有两种解决方案) SpringMVC常用的注解有哪些? @RequestMapping:用于处理请求 url 映射的注解,可用于类或方法上。用于类上,则表示类中的所有响应请求的方法都是以该地址作为父路径。 @RequestBody:注解实现接收http请求的json数据,将json转换为java对象。 @ResponseBody:注解实现将conreoller方法返回对象转化为json对象响应给客户。 SpingMvc中的控制器的注解一般用那个,有没有别的注解可以替代? 一般用@Controller注解,也可以使用@RestController,@RestController注解相当于@ResponseBody + @Controller,表示是表现层,除此之外,一般不用别的注解代替。 如果在拦截请求中,我想拦截get方式提交的方法,怎么配置? 可以在@RequestMapping注解里面加上method=RequestMethod.GET。 怎样在方法里面得到Request,或者Session? 直接在方法的形参中声明request,SpringMVC就自动把request对象传入。 如果想在拦截的方法里面得到从前台传入的参数,怎么得到? 直接在形参里面声明这个参数就可以,但必须名字和传过来的参数一样。 如果前台有很多个参数传入,并且这些参数都是一个对象的,那么怎么样快速得到这个对象? 直接在方法中声明这个对象,SpringMVC就自动会把属性赋值到这个对象里面。 SpringMVC中函数的返回值是什么? 返回值可以有很多类型,有String, ModelAndView。ModelAndView类把视图和数据都合并的一起的。 SpringMVC用什么对象从后台向前台传递数据的? 通过ModelMap对象,可以在这个对象里面调用put方法,把对象加到里面,前台就可以拿到数据。 怎么样把ModelMap里面的数据放入Session里面? 可以在类上面加上@SessionAttributes注解,里面包含的字符串就是要放入session里面的key。 SpringMvc里面拦截器是怎么写的: 有两种写法,一种是实现HandlerInterceptor接口,另外一种是继承适配器类,接着在接口方法当中,实现处理逻辑;然后在SpringMvc的配置文件中配置拦截器即可: <!-- 配置SpringMvc的拦截器 --> <mvc:interceptors> <!-- 配置一个拦截器的Bean就可以了 默认是对所有请求都拦截 --> <bean id="myInterceptor" class="com.zwp.action.MyHandlerInterceptor"></bean> <!-- 只针对部分请求拦截 --> <mvc:interceptor> <mvc:mapping path="/modelMap.do" /> <bean class="com.zwp.action.MyHandlerInterceptorAdapter" /> </mvc:interceptor> </mvc:interceptors> 注解原理: 注解本质是一个继承了Annotation的特殊接口,其具体实现类是Java运行时生成的动态代理类。我们通过反射获取注解时,返回的是Java运行时生成的动态代理对象。通过代理对象调用自定义注解的方法,会最终调用AnnotationInvocationHandler的invoke方法。该方法会从memberValues这个Map中索引出对应的值。而memberValues的来源是Java常量池 三、Mybatis篇 什么是MyBatis? MyBatis是一个可以自定义SQL、存储过程和高级映射的持久层框架。 讲下MyBatis的缓存 MyBatis的缓存分为一级缓存和二级缓存,一级缓存放在session里面,默认就有, 二级缓存放在它的命名空间里,默认是不打开的,使用二级缓存属性类需要实现Serializable序列化接口, 可在它的映射文件中配置<cache/> Mybatis是如何进行分页的?分页插件的原理是什么? 1)Mybatis使用RowBounds对象进行分页,也可以直接编写sql实现分页,也可以使用Mybatis的分页插件。 2)分页插件的原理:实现Mybatis提供的接口,实现自定义插件,在插件的拦截方法内拦截待执行的sql,然后重写sql。 举例:select * from student,拦截sql后重写为:select t.* from (select * from student)t limit 0,10 简述Mybatis的插件运行原理,以及如何编写一个插件? 1)Mybatis仅可以编写针对ParameterHandler、ResultSetHandler、StatementHandler、 Executor这4种接口的插件,Mybatis通过动态代理, 为需要拦截的接口生成代理对象以实现接口方法拦截功能, 每当执行这4种接口对象的方法时,就会进入拦截方法, 具体就是InvocationHandler的invoke方法,当然, 只会拦截那些你指定需要拦截的方法。 2)实现Mybatis的Interceptor接口并复写intercept方法, 然后在给插件编写注解,指定要拦截哪一个接口的哪些方法即可, 记住,别忘了在配置文件中配置你编写的插件。 Mybatis动态sql是做什么的?都有哪些动态sql?能简述一下动态sql的执行原理不? 1)Mybatis动态sql可以让我们在Xml映射文件内, 以标签的形式编写动态sql,完成逻辑判断和动态拼接sql的功能。 2)Mybatis提供了9种动态sql标签:trim|where|set|foreach|if|choose|when|otherwise|bind。 3)其执行原理为,使用OGNL从sql参数对象中计算表达式的值, 根据表达式的值动态拼接sql,以此来完成动态sql的功能。 #{}和${}的区别是什么? 1)#{}是预编译处理,${}是字符串替换。 2)Mybatis在处理#{}时,会将sql中的#{}替换为?号,调用PreparedStatement的set方法来赋值(有效的防止SQL注入); 3)Mybatis在处理${}时,就是把${}替换成变量的值。 为什么说Mybatis是半自动ORM映射工具?它与全自动的区别在哪里? Hibernate属于全自动ORM映射工具, 使用Hibernate查询关联对象或者关联集合对象时, 可以根据对象关系模型直接获取,所以它是全自动的。 而Mybatis在查询关联对象或关联集合对象时, 需要手动编写sql来完成,所以,称之为半自动ORM映射工具。 Mybatis是否支持延迟加载?如果支持,它的实现原理是什么? 1)Mybatis仅支持association关联对象和collection关联集合对象的延迟加载, association指的就是一对一,collection指的就是一对多查询。 在Mybatis配置文件中, 可以配置是否启用延迟加载lazyLoadingEnabled=true|false。 2)它的原理是,使用CGLIB创建目标对象的代理对象, 当调用目标方法时,进入拦截器方法, 比如调用a.getB.getName, 拦截器invoke方法发现a.getB是null值, 那么就会单独发送事先保存好的查询关联B对象的sql, 把B查询上来,然后调用a.setB(b), 于是a的对象b属性就有值了, 接着完成a.getB.getName方法的调用。 这就是延迟加载的基本原理。 MyBatis与Hibernate有哪些不同? 1)Mybatis和hibernate不同,它不完全是一个ORM框架, 因为MyBatis需要程序员自己编写Sql语句, 不过mybatis可以通过XML或注解方式灵活配置要运行的sql语句, 并将java对象和sql语句映射生成最终执行的sql, 最后将sql执行的结果再映射生成java对象。 2)Mybatis学习门槛低,简单易学,程序员直接编写原生态sql, 可严格控制sql执行性能,灵活度高,非常适合对关系数据模型要求不高的软件开发, 例如互联网软件、企业运营类软件等,因为这类软件需求变化频繁, 一但需求变化要求成果输出迅速。但是灵活的前提是mybatis无法做到数据库无关性, 如果需要实现支持多种数据库的软件则需要自定义多套sql映射文件,工作量大。 3)Hibernate对象/关系映射能力强,数据库无关性好, 对于关系模型要求高的软件(例如需求固定的定制化软件) 如果用hibernate开发可以节省很多代码,提高效率。 但是Hibernate的缺点是学习门槛高,要精通门槛更高, 而且怎么设计O/R映射,在性能和对象模型之间如何权衡, 以及怎样用好Hibernate需要具有很强的经验和能力才行。 总之,按照用户的需求在有限的资源环境下只要能做出维护性、 扩展性良好的软件架构都是好架构,所以框架只有适合才是最好。 MyBatis的好处是什么? 1)MyBatis把sql语句从Java源程序中独立出来,放在单独的XML文件中编写, 给程序的维护带来了很大便利。 2)MyBatis封装了底层JDBC API的调用细节,并能自动将结果集转换成Java Bean对象, 大大简化了Java数据库编程的重复工作。 3)因为MyBatis需要程序员自己去编写sql语句, 程序员可以结合数据库自身的特点灵活控制sql语句, 因此能够实现比Hibernate等全自动orm框架更高的查询效率,能够完成复杂查询。 简述Mybatis的Xml映射文件和Mybatis内部数据结构之间的映射关系? Mybatis将所有Xml配置信息都封装到All-In-One重量级对象Configuration内部。 在Xml映射文件中,<parameterMap>标签会被解析为ParameterMap对象, 其每个子元素会被解析为ParameterMapping对象。 <resultMap>标签会被解析为ResultMap对象, 其每个子元素会被解析为ResultMapping对象。 每一个<select>、<insert>、<update>、<delete> 标签均会被解析为MappedStatement对象, 标签内的sql会被解析为BoundSql对象。 什么是MyBatis的接口绑定,有什么好处? 接口映射就是在MyBatis中任意定义接口,然后把接口里面的方法和SQL语句绑定, 我们直接调用接口方法就可以,这样比起原来了SqlSession提供的方法我们可以有更加灵活的选择和设置. 接口绑定有几种实现方式,分别是怎么实现的? 接口绑定有两种实现方式,一种是通过注解绑定,就是在接口的方法上面加 上@Select@Update等注解里面包含Sql语句来绑定, 另外一种就是通过xml里面写SQL来绑定,在这种情况下, 要指定xml映射文件里面的namespace必须为接口的全路径名. 什么情况下用注解绑定,什么情况下用xml绑定? 当Sql语句比较简单时候,用注解绑定;当SQL语句比较复杂时候,用xml绑定,一般用xml绑定的比较多 MyBatis实现一对一有几种方式?具体怎么操作的? 有联合查询和嵌套查询,联合查询是几个表联合查询,只查询一次, 通过在resultMap里面配置association节点配置一对一的类就可以完成; 嵌套查询是先查一个表,根据这个表里面的结果的外键id, 去再另外一个表里面查询数据,也是通过association配置, 但另外一个表的查询通过select属性配置。 Mybatis能执行一对一、一对多的关联查询吗?都有哪些实现方式,以及它们之间的区别? 能,Mybatis不仅可以执行一对一、一对多的关联查询, 还可以执行多对一,多对多的关联查询,多对一查询, 其实就是一对一查询,只需要把selectOne修改为selectList即可; 多对多查询,其实就是一对多查询,只需要把selectOne修改为selectList即可。 关联对象查询,有两种实现方式,一种是单独发送一个sql去查询关联对象, 赋给主对象,然后返回主对象。另一种是使用嵌套查询,嵌套查询的含义为使用join查询, 一部分列是A对象的属性值,另外一部分列是关联对象B的属性值, 好处是只发一个sql查询,就可以把主对象和其关联对象查出来。 MyBatis里面的动态Sql是怎么设定的?用什么语法? MyBatis里面的动态Sql一般是通过if节点来实现,通过OGNL语法来实现, 但是如果要写的完整,必须配合where,trim节点,where节点是判断包含节点有 内容就插入where,否则不插入,trim节点是用来判断如果动态语句是以and 或or 开始,那么会自动把这个and或者or取掉。 Mybatis是如何将sql执行结果封装为目标对象并返回的?都有哪些映射形式? 第一种是使用<resultMap>标签,逐一定义列名和对象属性名之间的映射关系。 第二种是使用sql列的别名功能,将列别名书写为对象属性名, 比如T_NAME AS NAME,对象属性名一般是name,小写, 但是列名不区分大小写,Mybatis会忽略列名大小写,
-
全面梳理:xlwings库在Python中操作Excel的实用指南!