Python 导入分部分项前的数据处理2

当前位置博文首页 > 文章内容

最大化缩小

作者：栏目：未分类时间：2020-08-17 18:01:24

本站于2023年9月4日。收到“大连君*****咨询有限公司”通知
说我们IIS7站长博客，有一篇博文用了他们的图片。
要求我们给他们一张图片6000元。要不然法院告我们

为避免不必要的麻烦，IIS7站长博客，全站内容图片下架、并积极应诉
博文内容全部不再显示，请需要相关资讯的站长朋友到必应搜索。谢谢！

另祝：版权碰瓷诈骗团伙，早日弃暗投明。

相关新闻：借版权之名、行诈骗之实，周某因犯诈骗罪被判处有期徒刑十一年六个月

叹！百花齐放的时代,渐行渐远!

import os
import openpyxl
from openpyxl import Workbook
from copy import deepcopy




# 原文：https://www.cnblogs.com/liuda9495/p/9039732.html




fenBuName = '二分部'
dirName = './所有分部/' + fenBuName+ '/'




#workbook2 = Workbook()
workbook2 = openpyxl.load_workbook(fenBuName + '.xlsx')# 加载excel
workbook = None
worksheet = None
unit_name = None






def is_chinese(string):
    """
    检查整个字符串是否包含中文
    :param string: 需要检查的字符串
    :return: bool
    """
    if string is None:
        return False
    for ch in string:
        if u'\u4e00' <= ch <= u'\u9fff':
            return True
    return False
    
    


def each_files():    
    pathDir =  os.listdir(dirName)
    for index, value in enumerate(pathDir):
        filepath2 = dirName + value
        print(filepath2)
        each_sheet(filepath2)




def each_sheet(path):
    global workbook
    global worksheet
    
    workbook = openpyxl.load_workbook(path)# 加载excel
    name_list = workbook.sheetnames# 所有sheet的名字    
    for sheetname in name_list:
        print(sheetname)
        worksheet = workbook[sheetname]# 读取第一个工作表
        CellSplit()
        Business()




def CellSplit():
    
    # 获取所有 合并单元格的 位置信息
    # 是个可迭代对象，单个对象类型：openpyxl.worksheet.cell_range.CellRange
    # print后就是excel坐标信息
    m_list = worksheet.merged_cells

    l = deepcopy(m_list)# 深拷贝

    # 拆分合并的单元格 并填充内容
    for m_area in l:
        
        # 这里的行和列的起始值（索引），和Excel的一样，从1开始，并不是从0开始（注意）
        r1, r2, c1, c2 = m_area.min_row, m_area.max_row, m_area.min_col, m_area.max_col
            
        worksheet.unmerge_cells(start_row=r1, end_row=r2, start_column=c1, end_column=c2)
        print('区域:', m_area, '  坐标:', r1, r2, c1, c2)
        
        # 获取一个单元格的内容
        first_value = worksheet.cell(r1, c1).value

        # 数据填充
        for r in range(r1, r2+1):# 遍历行        
            if c2 - c1 > 0:# 多个列，遍历列
                for c in range(c1, c2+1):
                    worksheet.cell(r, c).value = first_value
            else:# 一个列
                worksheet.cell(r, c1).value = first_value
    




def Business():# 特定的业务逻辑
    global worksheet2
    global workbook2
    global unit_name
    
    # 获取单位工程的名字
    unit_name = worksheet.cell(5, 1).value
    '''
    unit_name = worksheet.cell(2, 1).value
    nPos = unit_name.find('：')
    unit_name = unit_name[nPos+1:]
    '''    
    worksheet.title = unit_name# 改sheet的名字

    
    '''
    # 针对无单位工程的excel，这种情况先不考虑
    worksheet.insert_cols(1)# 插入列
    for index in range(worksheet.max_row):# 首列批量填充数据
        r = index+1
        worksheet.cell(r, 1).value = unit_name
    worksheet.cell(3, 1).value = '单位工程'# 单元格赋值
    '''

    # 删除行
    worksheet.delete_rows(4)
    worksheet.delete_rows(2)
    worksheet.delete_rows(1)

    # 删除列
    # worksheet.delete_cols(5)
    # worksheet.delete_cols(3)
    
    # 自动删除列 worksheet.max_column
    for i in range(10):
        cellValue = worksheet.cell(5, 10-i).value
        ret1 = is_chinese(cellValue)
        if ret1 == False:
            worksheet.delete_cols(10-i)
    

    worksheet2 = workbook2.create_sheet(unit_name)
    for x in range(worksheet.max_row):
        r = x+1
        for y in range(worksheet.max_column):
            c = y+1
            worksheet2.cell(r, c).value = worksheet.cell(r, c).value




each_files()
workbook2.save(fenBuName+'2.xlsx')

目录结构

立即下载 - IIS7 站长工具包

Python 导入分部分项前的 数据处理2

作者： 栏目：未分类 时间：2020-08-17 18:01:24

Python 导入分部分项前的数据处理2

作者：栏目：未分类时间：2020-08-17 18:01:24