您好,登錄后才能下訂單哦!
背景:生活中常常因日常工作,在記錄統計方面需頻繁處理較多 Excel 表格,這部分工作雖可由人工完成,但這樣會顯得有些繁瑣且可能存在偏差,遂閑時查閱了是否有相關基于python處理Excel表格的學習文檔,后獲知這主要可以運用 win32 和 openpyxl 等第三方庫來幫助完成。在此分享一下學習過程中有關 openpyxl 庫的基本使用方法和一些心得體會。
openpyxl 是一個用于處理 xlsx 格式Excel表格文件的第三方python庫,其支持Excel表格絕大多數基本操作。
安裝方法
使用 pip 或通過專門python IDE(如pyCharm)進行安裝
其中pip安裝方法,命令行輸入:? pip install openpyxl
基本使用
第一步先是要導入 openpyxl 模塊
importopenpyxl
讀取Excel文檔
通過調用方法load_workbook(filename)進行文件讀取,該方法中還有一個read_only參數用于設置文件打開方式,默認為可讀可寫,該方法最終將返回一個workbook的數據對象
# 文件必須是xlsx格式,如果是其他格式在執行前可利用win32輔助轉化wb = openpyxl.load_workbook(‘example.xlsx’)
(一)獲取工作表
每一個Excel表格中都會有很多張sheet工作表,在對表格操作前需要先選定一張工作表
(二)獲取單元格
對Excel表格的操作最終都落于對單元格的操作,獲取單元格有兩種獲取方法:sheet[列行名]和sheet.cell(row,column)
需要注意的是,sheet.cell(row,column)中參數分別是行和列,且必須為整數,如果列為英文字母,可以利用?openpyxl.utils?中的?column_index_from_string(char)進行字母數字的轉化。順便一說,同理也可以利用get_column_letter(number)進行數字字母間的轉化
(三)獲取行和列
在處理Excel表格有時可能需要對表格進行遍歷查找,openpyxl中便提供了一個行和列的生成器(sheet.rows和sheet.columns),這兩個生成器里面是每一行(或列)的數據,每一行(或列)又由一個tuple包裹,借此可以很方便地完成對行和列的遍歷
學習時還發現也可以通過list(sheet.rows)[index](或list(sheet.columns)[index])對某一行或列進行遍歷,而在此值得注意的是,由于sheet.rows(或sheet.columns)是生成器類型,是不能直接調用的,需將其轉化為一個list類型,然后再通過索引遍歷
同時,也可以通過使用sheet[行列值:行列值]來對給定單元格范圍進行遍歷
另外,有時候我們還可能需要確定表格的大小,即獲取表格行和列的最大值,可以用max_row和max_column來獲取
寫入Excel文檔
在開頭讀取時已經介紹,默認的打開方式為可讀可寫,那么使用load_workbook(filename)讀取Excel文檔后也就可以直接寫入了。另外,如果需要新建一個Excel文件,可以使用Workbook()方法,同時它會自動提供一個sheet工作表。對于刪除一個工作表,則可以使用workbook對象的remove(sheet)方法刪除
(一)寫入單元格
獲取工作表和之前一樣,如果使用load_workbook(filename)讀取,那么獲取工作表后可以直接通過sheet[行列值]寫入單元格。學習時,有資料介紹還可以傳入Excel中的公式進行賦值,不過要注意,在讀取文件時需要加上參數data_only=True,這樣才能返回數字,否則將返回字符串,即公式本身
另外,也可使用sheet.append(parameters)一行或多行寫入
(二)保存文件
寫完文件后,使用workbook.save(path+filename)進行保存,不過要注意文件擴展名一定要是xlsx格式
# 保存文件至當前目錄wb.save('new_file.xlsx')
設置單元格樣式
單元格樣式主要包括字體、邊框、顏色以及對齊方式等,這些均位于openpyxl.styles庫中
# 導入字體、邊框、顏色以及對齊方式相關庫fromopenpyxl.stylesimportFont, Border, Side, PatternFill, colors, Alignment
(一)字體
通過sheet單元格font屬性設置字體風格
# 設置字體風格為Times New Roman,大小為16,粗體、斜體,顏色藍色sheet['A1'].font = Font(name='Times New Roman', size=16, bold=True, italic=True, color=colors.BLUE)
(二)對齊方式
通過sheet單元格alignment屬性設置文本對齊風格
# 通過參數horizontal和vertical來設置文字在單元格里的對齊方式,此外設置值還可為left和rightsheet['B1'].alignment = Alignment(horizontal='center',vertical='center')
(三)邊框
通過sheet單元格border屬性設置字體風格
(四)設置行高和列寬
行和列的長度大小可以通過row_dimensions[序號].height和column_dimensions[標號].width來設置
(五)合并和拆分單元格
對單元格的合并與拆分,主要是通過sheet的merge_cells(args1:args2)和unmerge_cells(args1:args2)兩個方法來實現的
當然,除了對角矩形區域化合并,也可以對一行或一列進行合并,只需相應修改參數即可。不過,這里要注意的是,合并后單元格顯示的文本內容是合并前最左上角單元格的內容,而其他單元格內容則會自動清除。
其他
在學習過程中,發現了一個有趣的現象:在對Excel文件利用前面所介紹的workbook.save(path+filename)方法保存后,再次打開保存的文件時發現之前已合并的單元格都只保留了原最左上角單元格的邊框效果,而其他單元格的效果則全部被去除了。就此問題,起初是通過對合并區域內所有子單元格設置邊框以防止保存后邊框效果的消失,不過這種策略難免有一些麻煩。究此現象原因,目前博客論壇上較少有相關問題的提出和解釋,我也暫時未能很好地解決此問題,如大家有更好的想法或見解,歡迎留言分享。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。