Python自動化辦公高效批量查找Excel數據,輕松應對海量數據處理

我是智能取經人 2024-04-28 19:30:43
場景描述 在處理海量的Excel數據時,我們經常會遇到需要跨多個工作簿查找特定信息的情況。比如,一家大型企業可能需從多個部門上報的報表中,檢索特定項目的進度更新或某員工的業績記錄。傳統做法通常是挨個打開Excel表格查找到需要的數據後複制粘貼到結果表裏,有100個表格就需要如此重複操作100次,而且過程中還容易出錯。利用Python進行批量查找Excel數據,可以迅速定位並整合這些信息,從而節約時間並提升工作效率。 數據分析 輸入:包含相似數據結構的多個Excel工作簿。處理流程:遍曆所有工作簿及其工作表。查找包含特定關鍵詞或數據的條目。提取並整合這些數據。輸出:一個整合了所有相關數據的全新Excel工作簿。示例數據 假設企業有多個部門,每個部門每月都會上報銷售數據。現需檢索所有包含特定産品“Y”的銷售記錄。 部門文件如下: SalesReport_Dept1.xlsxSalesReport_Dept2.xlsxSalesReport_Dept3.xlsx...SalesReport_DeptN.xlsx每個文件包含以下列: ReportDate(報告日期)ProductName(産品名稱)SalesVolume(銷售數量)SalesPerson(銷售員)實戰代碼 import pandas as pd import os def batch_search_excel(keyword, directory, output_filename): all_data = pd.DataFrame() # 遍曆指定文件夾中的所有Excel文件 for filename in os.listdir(directory): if filename.endswith('.xlsx'): filepath = os.path.join(directory, filename) df = pd.read_excel(filepath) # 搜索包含特定關鍵詞的數據 matched_data = df[df['ProductName'].str.contains(keyword, na=False, case=False)] # 如果找到匹配的數據,將其添加到總數據中 if not matched_data.empty: all_data = pd.concat([all_data, matched_data], ignore_index=True) # 將彙總的數據輸出到新的Excel文件 all_data.to_excel(output_filename, index=False) # 調用函數 batch_search_excel("産品Y", "path_to_sales_reports", "Matched_Product_Sales.xlsx")總結 本段代碼展示了如何通過Python和pandas庫,批量查找包含特定關鍵詞的Excel數據。通過自動遍曆文件夾中的所有Excel文件,搜索含有特定産品名稱的記錄,並將這些記錄整合到一個新的Excel文件中。這種方法在處理需要從大量分散的數據源中提取信息的情況時特別有效,能顯著提高數據處理的效率。
0 阅读:9

我是智能取經人

簡介:感謝大家的關注