Python按单元格读取复杂电子表格E
2023/5/3 来源:不详Python读取电子表格方法
本文所使用电子表格的目标是读取、解析来自Excel编制的数据报表,或者软件界面导出的数据报表,这类电子表格报表显著特点是有一定的格式,且数据位置不连续,而非标准二维数据表。
关于电子表格,比较常见的有微软OfficeExcel、WPSOffice、OpenOffice、LibreOffice、永中Office等等,这些软件关于电子表格定义相近,文件格式兼容MSExcel标准。
一个电子表格文档(Excel)称为一个工作簿
一个工作簿保存在一个扩展名为XLS(.xlsx)的文件中
一个工作簿可以包含多个表(sheet)
在特定行和列的方格称为单元格、格子
对于文件格式XLS、XLSX,简单来说:
XLS是excel及以前版本所生成的文件格式
XLSX是excel及以后版本所生成的文件格式
Python对excel文件的读写功能的模块有以下三种:
xlwt:对xls格式的Excel文件进行写入;
xlrd:对xls格式的Excel文件进行读取;
OpenpPyXL实现了对xlsm、xlsx开放电子表格格式的读写。
另外,Pandas也能实现了对Excel读写,例如read_excel()和to_excel(),直接读取数据到DataFrame中。
首先,安装第三方包xlrd和xlwt(如果已经安装,则略过):
pipinstall-i