乡下人产国偷v产偷v自拍,国产午夜片在线观看,婷婷成人亚洲综合国产麻豆,久久综合给合久久狠狠狠9

  • <output id="e9wm2"></output>
    <s id="e9wm2"><nobr id="e9wm2"><ins id="e9wm2"></ins></nobr></s>

    • 分享

      Python辦公自動化|從Excel到Word

       liqualife 2020-05-07

      前言

      在前幾天的文章中我們講解了如何從Word表格中提取指定數(shù)據(jù)并按照格式保存到Excel中,今天我們將再次以一位讀者提出的真實需求來講解如何使用Python從Excel中計算、整理數(shù)據(jù)并寫入Word中,其實并不難,主要就是以下兩步:
      • openpyxl讀取Excel獲取內(nèi)容

      • docx讀寫Word文件


      那我們開始吧!

      需求確認(rèn)

      首先來看下我們需要處理的Excel部分?jǐn)?shù)據(jù),因涉及隱私已經(jīng)將數(shù)據(jù)皮卡丘化

      可以看到數(shù)據(jù)非常多,并且還存在重復(fù)數(shù)據(jù)。而我們要做的就是對每一列的數(shù)據(jù)按照一定的規(guī)則進行計算、整理并使用Python自動填入到Word中,大致的要求如下

      上面僅是部分要求,真實需要填入word中的數(shù)據(jù)要更多!

      除了對按照格式進行處理并存入Word中指定位置之外,還有一個需求:最終輸出的word文件名還需要按照一定規(guī)則生成:

      OK,需求分析完畢,接下來看Python如何解決!


      Python實現(xiàn)

      首先我們使用Python對該Excel進行解析

      from openpyxl import load_workbook
      import os
      # 獲取桌面的路徑
      def GetDesktopPath():
          return os.path.join(os.path.expanduser('~'), 'Desktop')

      path = GetDesktopPath() + '/資料/' # 形成文件夾的路徑便后續(xù)重復(fù)使用
      workbook = load_workbook(filename=path + '數(shù)據(jù).xlsx')
      sheet = workbook.active # 獲取當(dāng)前頁
      # 可以用代碼獲取數(shù)據(jù)范圍,如果要批處理循環(huán)迭代也方便
      # 獲取有數(shù)據(jù)范圍
      print(sheet.dimensions)
      # A1:W10

      利用openpyxl讀取單元格有以下幾種用法

      cells = sheet['A1:A4']  # 返回A1-A4的4個單元格
      cells = sheet['A'] # 獲取A列
      cells = sheet['A:C'] # 獲取A-C列
      cells = sheet[5] # 獲取第5行
      # 注意如果是上述用cells獲取返回的是嵌套元祖
      for cell in cells:
          print(cell[0].value) # 遍歷cells依然需要取出元祖中元素才可以獲取值
      # 獲取一個范圍的所有cell
      # 也可以用iter_col返回列
      for row in sheet.iter_rows(min_row=1, max_row=3,min_col=2, max_col=4):
          for cell in row:
              print(cell.value)

      明白了原理我們就可以解析獲取Excel中的數(shù)據(jù)了

      # SQE
      SQE = sheet['Q2'].value
      # 供應(yīng)商&制造商
      supplier = sheet['G2'].value
      # 采購單號
      C2_10 = sheet['C2:C10'] # 返回cell.tuple對象
      # 利用列表推導(dǎo)式后面同理
      vC2_10 = [str(cell[0].value) for cell in C2_10]
      # 用set簡易去重后用,連接,填word表用
      order_num = ','.join(set(vC2_10))
      # 用set簡易去重后用&連接,word文件名命名使用
      order_num_title = '&'.join(set(vC2_10))
      # 產(chǎn)品型號
      T2_10 = sheet['T2:T10']
      vT2_10 = [str(cell[0].value) for cell in T2_10]
      ptype = ','.join(set(vT2_10))
      # 產(chǎn)品描述
      P2_10 = sheet['P2:P10']
      vP2_10 = [str(cell[0].value) for cell in P2_10]
      info = ','.join(set(vP2_10))
      info_title = '&'.join(set(vP2_10))
      # 日期
      # 用datetime庫獲取今日時間以及相應(yīng)格式化
      import datetime
      today = datetime.datetime.today()
      time = today.strftime('%Y年%m月%d日')
      # 驗貨數(shù)量
      V2_10 = sheet['V2:V10']
      vV2_10 = [int(cell[0].value) for cell in V2_10]
      total_num = sum(vV2_10) # 計算總數(shù)量
      # 驗貨箱數(shù)
      W2_10 = sheet['W2:W10']
      vW2_10 = [int(cell[0].value) for cell in W2_10]
      box_num = sum(vW2_10)
      # 生成最終需要的word文件名
      title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-驗貨報告'
      print(title)
      通過上面的代碼,我們就成功的從Excel中提取出來數(shù)據(jù),這樣Excel部分就結(jié)束了,接下來進行word的填表啦,由于這里我們默認(rèn)讀取的word是.docx格式的,實際上讀者的需求是.doc格式文件,所以windows用戶可以用如下代碼批量轉(zhuǎn)化doc,前提是安裝好win32com
      # pip install pypiwin32
      from win32com import client
      docx_path = path + '模板.docx'
      # doc轉(zhuǎn)docx的函數(shù)
      def doc2docx(doc_path,docx_path):
          word = client.Dispatch('Word.Application')
          doc = word.Documents.Open(doc_path)
          doc.SaveAs(docx_path, 16)
          doc.Close()
          word.Quit()
          print('\n doc文件已轉(zhuǎn)換為docx \n')
      if not os.path.exists(docx_path):
          doc2docx(docx_path[:-1], docx_path)
      不過在Mac下暫時沒有好的解決策略,如果有思路歡迎交流,好了有docx格式文件后我們繼續(xù)操作Word部分

      docx_path = path + '模板.docx'
      from docx import Document
      # 實例化
      document = Document(docx_path)
      # 讀取word中的所有表格
      tables = document.tables
      # print(len(tables))
      # 15
      確定好每個表格數(shù)后即可進行相應(yīng)的填報操作,table的用法和openpyxl中非常類似,注意索引和原生python一樣都是從0開始
      tables[0].cell(1, 1).text = SQE
      tables[1].cell(1, 1).text = supplier
      tables[1].cell(2, 1).text = supplier
      tables[1].cell(3, 1).text = ptype
      tables[1].cell(4, 1).text = info
      tables[1].cell(5, 1).text = order_num
      tables[1].cell(7, 1).text = time

      上面代碼完成Word中這一部分表格

      我們繼續(xù)用Python填寫下一個表格

      for i in range(2, 11):
          tables[6].cell(i, 0).text = str(sheet[f'T{i}'].value)
          tables[6].cell(i, 1).text = str(sheet[f'P{i}'].value)
          tables[6].cell(i, 2).text = str(sheet[f'C{i}'].value)
          tables[6].cell(i, 4).text = str(sheet[f'V{i}'].value)
          tables[6].cell(i, 5).text = str(sheet[f'V{i}'].value)
          tables[6].cell(i, 6).text = '0'
          tables[6].cell(i, 7).text = str(sheet[f'W{i}'].value)
          tables[6].cell(i, 8).text = '0'

      tables[6].cell(12, 4).text = str(total_num)
      tables[6].cell(12, 5).text = str(total_num)
      tables[6].cell(12, 7).text = str(box_num)

      這里需要注意兩個細節(jié):
      • word寫入的數(shù)據(jù)需是字符串,所以從Excel獲取的數(shù)據(jù)需要用str格式化

      • 表格可能存在合并等其他情況,因此你看到的行數(shù)和列數(shù)可能不是真實的,需要用代碼不斷測試。


      按照上面的辦法,將之前從Excel中取出來的數(shù)據(jù)一一填充到Word中對應(yīng)位置就大功告成!最后保存一下即可。
      document.save(path + f'{title}.docx')
      print('\n文件已生成')

      結(jié)束語

      回顧上面的過程,其實從需求和文件格式上看,這次文件的讀寫解析任務(wù)較復(fù)雜,碼代碼和思考時間會較久,所以當(dāng)我們在考慮使用Python進行辦公自動化之前需要想清楚這個問題:這次需要完成的任務(wù)是否工作量很多,或者以后長期需要進行,用Python是否可以解放雙手?如果不是,實際上手動就可以完成,那么就失去了自動化辦公的意義!

        本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
        轉(zhuǎn)藏 分享 獻花(0

        0條評論

        發(fā)表

        請遵守用戶 評論公約

        類似文章 更多