当前位置 博文首页 > 文章内容

    Python 导入分部分项前的 数据处理2

    作者: 栏目:未分类 时间:2020-08-17 18:01:24

    本站于2023年9月4日。收到“大连君*****咨询有限公司”通知
    说我们IIS7站长博客,有一篇博文用了他们的图片。
    要求我们给他们一张图片6000元。要不然法院告我们

    为避免不必要的麻烦,IIS7站长博客,全站内容图片下架、并积极应诉
    博文内容全部不再显示,请需要相关资讯的站长朋友到必应搜索。谢谢!

    另祝:版权碰瓷诈骗团伙,早日弃暗投明。

    相关新闻:借版权之名、行诈骗之实,周某因犯诈骗罪被判处有期徒刑十一年六个月

    叹!百花齐放的时代,渐行渐远!



    import os
    import openpyxl
    from openpyxl import Workbook
    from copy import deepcopy
    
    
    
    
    # 原文:https://www.cnblogs.com/liuda9495/p/9039732.html
    
    
    
    
    fenBuName = '二分部'
    dirName = './所有分部/' + fenBuName+ '/'
    
    
    
    
    #workbook2 = Workbook()
    workbook2 = openpyxl.load_workbook(fenBuName + '.xlsx')# 加载excel
    workbook = None
    worksheet = None
    unit_name = None
    
    
    
    
    
    
    def is_chinese(string):
        """
        检查整个字符串是否包含中文
        :param string: 需要检查的字符串
        :return: bool
        """
        if string is None:
            return False
        for ch in string:
            if u'\u4e00' <= ch <= u'\u9fff':
                return True
        return False
        
        
    
    
    def each_files():    
        pathDir =  os.listdir(dirName)
        for index, value in enumerate(pathDir):
            filepath2 = dirName + value
            print(filepath2)
            each_sheet(filepath2)
    
    
    
    
    def each_sheet(path):
        global workbook
        global worksheet
        
        workbook = openpyxl.load_workbook(path)# 加载excel
        name_list = workbook.sheetnames# 所有sheet的名字    
        for sheetname in name_list:
            print(sheetname)
            worksheet = workbook[sheetname]# 读取第一个工作表
            CellSplit()
            Business()
    
    
    
    
    def CellSplit():
        
        # 获取所有 合并单元格的 位置信息
        # 是个可迭代对象,单个对象类型:openpyxl.worksheet.cell_range.CellRange
        # print后就是excel坐标信息
        m_list = worksheet.merged_cells
    
        l = deepcopy(m_list)# 深拷贝
    
        # 拆分合并的单元格 并填充内容
        for m_area in l:
            
            # 这里的行和列的起始值(索引),和Excel的一样,从1开始,并不是从0开始(注意)
            r1, r2, c1, c2 = m_area.min_row, m_area.max_row, m_area.min_col, m_area.max_col
                
            worksheet.unmerge_cells(start_row=r1, end_row=r2, start_column=c1, end_column=c2)
            print('区域:', m_area, '  坐标:', r1, r2, c1, c2)
            
            # 获取一个单元格的内容
            first_value = worksheet.cell(r1, c1).value
    
            # 数据填充
            for r in range(r1, r2+1):# 遍历行        
                if c2 - c1 > 0:# 多个列,遍历列
                    for c in range(c1, c2+1):
                        worksheet.cell(r, c).value = first_value
                else:# 一个列
                    worksheet.cell(r, c1).value = first_value
        
    
    
    
    
    def Business():# 特定的业务逻辑
        global worksheet2
        global workbook2
        global unit_name
        
        # 获取单位工程的名字
        unit_name = worksheet.cell(5, 1).value
        '''
        unit_name = worksheet.cell(2, 1).value
        nPos = unit_name.find(':')
        unit_name = unit_name[nPos+1:]
        '''    
        worksheet.title = unit_name# 改sheet的名字
    
        
        '''
        # 针对无单位工程的excel,这种情况先不考虑
        worksheet.insert_cols(1)# 插入列
        for index in range(worksheet.max_row):# 首列批量填充数据
            r = index+1
            worksheet.cell(r, 1).value = unit_name
        worksheet.cell(3, 1).value = '单位工程'# 单元格赋值
        '''
    
        # 删除行
        worksheet.delete_rows(4)
        worksheet.delete_rows(2)
        worksheet.delete_rows(1)
    
        # 删除列
        # worksheet.delete_cols(5)
        # worksheet.delete_cols(3)
        
        # 自动删除列 worksheet.max_column
        for i in range(10):
            cellValue = worksheet.cell(5, 10-i).value
            ret1 = is_chinese(cellValue)
            if ret1 == False:
                worksheet.delete_cols(10-i)
        
    
        worksheet2 = workbook2.create_sheet(unit_name)
        for x in range(worksheet.max_row):
            r = x+1
            for y in range(worksheet.max_column):
                c = y+1
                worksheet2.cell(r, c).value = worksheet.cell(r, c).value
    
    
    
    
    each_files()
    workbook2.save(fenBuName+'2.xlsx')
    
    
    




    目录结构