Python 操作 Excel 库 xlrd 和 xlwt 的常用操作详解!
在之前的Python办公自动化系列文章中,我们已经相信介绍了openyxl
、xlsxwriter
等Python操作Excel库。
- openpyxl操作Excel详解
- xlwings操作Excel详解
- xlsxwriter操作Excel详解
相信大家对于几个库的差异与使用场景有了一定的认识,本文将继续介绍另外两种操作Excel的Python
库---xlrd
与xlwt
。看看这两者搭配起来如何玩出火花!
和以前文章一样,有请老朋友openpyxl
登场来进行对比
“
-
openyxl
:可以对xlsx、xlsm文件进行读、写操作,主要对Excel2007年之后的版本(.xlsx) -
xlrd
:可以对xlsx、xls、xlsm文件进行读操作且效率高 -
xlwt
:主要对xls文件进行写操作且效率高,但是不能执行xlsx文件
”
通过对比,可以看到在效率上而言,xlrd&xlwt
比openyxl
要高效得多。而写入数据方面上而言,openyxl
又比较贴近我们的日常所需,所以两种方式来处理Excel各有千秋。
一、简介
xlrd
是用来从Excel中读写数据的,但我们通常只用它进行读操作,写操作会相对于专门写入的模块麻烦一些。其实,后面的rd可以看出是reader的缩小。
类比于xlrd
的reader,那么xlwt
就相对于writer,而且很纯正的一点就是它只能对Excel进行写操作。xlwt和xlrd不光名字像,连很多函数和操作格式也是完全相同。下面让我们慢慢介绍。
二、安装与使用
安装很简单,直接在命令行或者终端中使用pip安装
pip install Xlrd
pip install xlwt
而使用xlrd&xlwt
操作Excel的大致过程如下图所示
三、xlrd常用操作详解
现在我们讲解xlrd
操作Excel部分常用操作,先准备一份Excel文件,大致如下图:
用xlrd进行读取比较方便,流程和平常手动操作Excel一样,打开工作簿(Workbook),选择工作表(sheets),然后操作单元格(cell)。接下来先介绍一下基本操作在举个例子。
3.1 打开Excel文件
import xlrd
df = xlrd.open_workbook(name)
先导入模块而后使用open_workbook()
函数来读取指定的一个工作簿对象。这里的参数name是Excel文件的名字,一般使用的是相对路径的名字,结果如下
3.2 查看工作簿中所有sheet
df.sheet_names()
我们读取上述文件,便可以得到以列表形式嵌字符串的值。
3.3 选择某一个工作表
先看代码
table=df.sheets()[0] #列表是从0开始计数
table=df.sheet_by_index(0)
table=df.sheet_by_name('name')
第一行代码是获取第一个工作表的意思,写法是根据内置的列表格式来选取的。
第二行代码顾名思义是通过索引获取第一个工作表,这里的索引与pandas
中DataFrame
的index
索引类似,只不过对象换成了工作表。
第三行代码是通过表的名称选择工作表,如果工作表是有自己的名字的,那么这个读取方式是最方便的。
打印table,可以得到类似下图的结果
3.4 获取表格的行数和列数
注意,这里不需要在函数后面加小括号,否则你可能debug时都头痛于错在哪。
row=table.nrows
col=table.ncols
打印row和col,可以发现是和我们的原表格一样的行列数。
3.5 获取整行和整列的值
这里需要注意两个参数:num1和num2
table.row_values(num1)
table.column_values(num2)
num1在row_values()
中,指的是选取的行数是多少,例如我们选取第一行所有字段名称数据,那么这个num1就是0。
同理,column_values()
的参数就是第几列的意思。
它出来的值是一个列表的形式。调用第一行代码,可以得到如下结果。
3.6 通过循环读取表格的所有行
在第五步我们实现了读取单行单列的数据,那么我们就用循环来将所有行打印出来。
for i in range(table.nrows):
print (table.row_values(i))
效果如下
3.7 获取单元格的值
代码很简单,有点像VBA
cell1=table.row(0)[0].value
cell1=table.cell(0,0).value
cell1=table.col(0)[0].value
第一行获取单元格值的方式是通过调取指定行数据进行筛选。
第二行是以二维的形式获取,即(第i行,第j列)形式。
第三行与第一行类似是通过列索引调用。
3.8 例子
最后来举一个完整的例子
df=xlrd.open_workbook('data.xlsx')
table=df.sheet_by_name('早起Python')
data_list=[]
data_list.append(table.row_values(1))
for i in data_list:
print(i)
打出来的结果
这里我们的目的是选取上述讲解过的语法,将第三行所有数据放到data_list列表中并用for循环将它打印出来。
四、xlwt常用操作详解
4.1 新建一个Excel文件
直接使用.Workbook()
即可
import xlwt
df2 = xlwt.Workbook()
4.2 新建一个工作表
这里的name是工作表的名称
table2=df2.add_sheet('name')
4.3 写入数据到指定单元格
这里有三个参数,前两个参数对应(第i行,第j列),代表的是单元格的位置。第三个参数是要写的值(可以是字符串、数字)
table2.write(0,0,'Python')
需要注意的是,如果是对同一个单元格重复操作,会让Python报错(多次输入错误),所以如果想要取消这个功能,则添加这个参数在新建工作表的代码里面。
table2=df2.add_sheet('name',cell_overwrite_ok=True)
4.4 保存文件
上面提示过,xlwt
仅支持.xls
的文件格式输出,常用的xlsx
是不行的。这也是这个模块的一种缺陷。
df2.save('data2.xls')
4.5 改变样式
调整样式也是可以的,先看几行代码
style=xlwt.XFStyle()
font=xlwt.Font()
font.name='name Times New Roman'
font.bold=True
style.font=font
sheet.write(0,1,'Python',style)
第一行代码是初始化样式,可以认为是一个类似于父类的东西。
第二行代码是为样式创建字体
第三行代码是指定字体的名字,这里用到的是name Times New Roman
这个类型。
第四行代码是字体加粗,以布尔值的形式的设定。
第五行代码是将font设定为style的字体
第六行代码是写入文件单元格时怎么运用这个格式。
4.6 例子:
最后,我们结合两个模块进行读写操作。
我们的目标是将已经准备好的data文件进行读取,并将其内容进行倒序排序,最终以转置形式输出。先思考一下如何使用代码实现?
“对于
xlwt
写入部分,先创建一个早起Python的工作表。并将提取的数据列表data_list1用列表的倒叙来排序。最后用pop()
函数把两个字段名称(grammer 和 popularity)放在首位。最后结合我们写入部分讲解的内容进行保存。 在xlrd
读取部分我们稍有不同的是,我们的for循环用在了提取所有数据这一步骤,而不再是循环输出列表值。 ”
所以完整代码如下
import xlrd
df=xlrd.open_workbook('data.xlsx')
table=df.sheet_by_name('早起Python')
data_list=[]
for i in range(table.nrows):
data_list.append(table.row_values(i))
data_list1 = []
data_list1 = data_list[::-1]
item = data_list1.pop(-1)
data_list1.insert(0,item)
import xlwt
df2 = xlwt.Workbook()
table2=df2.add_sheet('早起Python')
for i in range(2):
for j in range(9):
table2.write(i,j,data_list1[j][i])
df2.save('data2.xls')
至此我们就将xlrd
与xlwt
的常用操作都盘点了一遍,如果想要了解的透彻一点的话,早起还是建议按照文中介绍的顺序自己动手敲一遍代码来体会!
推荐阅读
-
Python 技术--操作 excel 实现单元格合并和居中的示例演示,用 openpyxl 库为指定区域的单元格设置对齐方式和字体样式的方法
-
包婷婷 (201550484)作业一 统计软件简介与数据操作-SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件。最初软件全称为"(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为"统计产品与服务解决方案",标志着SPSS的战略方向正在做出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。 1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域。世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价。 R统计软件介绍 R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。 与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。 该语言的语法表面上类似 C,但在语义上是函数设计语言(functional programming language)的变种并且和Lisp 以及 APL有很强的兼容性。特别的是,它允许在"语言上计算"(computing on the language)。这使得它可以把表达式作为函数的输入参数,而这种做法对统计模拟和绘图非常有用。 R是一个免费的*软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。在R主页那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。 二、R语言 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个*、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。 R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点: 1.R是*软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。[2] 2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。[2] 3. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有:base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.[2] 4.R具有很强的互动性。除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。[2] 5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地.[2] R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。 但是请不要忘了:R是免费的(R is free)。R语言源代码托管在github,具体地址可以看参考资料。[3] 。 R语言的下载可以通过CRAN的镜像来查找。 R语言有域名为.cn的下载地址,有六个,其中两个由Datagurn,由 中国科学技术大学提供的。R语言Windows版,其中由两个下载地点是Datagurn和 USTC提供的。 三、stata Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。用Stata绘制的统计图形相当精美。 新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。 除此之外,Stata软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也可以透过Stata. Journal获得许许多多的相关讯息以及书籍介绍等。另外一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。 四、PYTHON
-
Python 操作 Excel 库 xlrd 和 xlwt 的常用操作详解!
-
详细解释了 Python 中 Excel 库 xlwings 的最常用操作!
-
使用 xlwt 在 python 中操作 excel 的常见方法和问题
-
使用 xlrd 和 xlwt 模块进行 Python Excel 操作
-
Python 自动操作 Excel 的方法说明(xlrd,xlwt)
-
用 Python 对 Excel 进行读/写操作 -- 安装第三方库(xlrd、xlwt、xlutils、openpyxl)
-
读写 excel 和 csv 文件的 Python 操作。 csv-xlrd-xlwt 模块介绍
-
Python 操作 excel xlrd 和 xlwt 简介